聂日明:AI替代的是一条完整的专业成长路径。十年后,我们面临的局面可能是:AI消灭了初级岗位,却没有人有资格胜任高级岗位。

以大语言模型驱动的AI已经不再仅仅是新闻舆论中的谈资,而是正在成为工作中的生产力工具。盖洛普4月13日公布的调查显示,美国半数劳动者已在工作中使用AI,约三成受访者每天或每周频繁使用AI工具;约三分之二的员工表示,人工智能对个人生产力和效率产生了“极大”或“一定程度”的积极影响。渗透最深的是软件开发——GitHub的代码公开提交量中,来自Claude Code和Codex等AI工具的比例正在肉眼可见地攀升。就我个人使用AI的体验,无论是辅助翻译学术专著还是清洗数据,尤其是将大样本的文本数据清洗为结构化的标准数据库,AI都体现出极为强悍的效率——以前往往需要多位初级研究助理花数周手工完成的工作,现在的耗时以小时计。至于阅读海量文献、寻章摘句,更是AI的拿手好戏,只要花费足够多的token,AI便会不知疲倦地给出符合各种要求的结果。有律师对我说,他现在给当事人提供的法律服务与此前相比,在质量上已不可同日而语。这些曾经定义白领入门级岗位的工作,正在被AI以分钟级的速度完成,在极大地改善工作效率的同时,也对初级岗位的从业者及未来的潜在新员工构成了不容忽视的挑战。

更为直观的事实是,上述变化不是媒体的夸张报道,它们已经反映在真金白银的收入数字上:OpenAI的年化收入已达约250亿美元,而Anthropic从2025年初的10亿美元起步,到今年4月已突破300亿——Salesforce花了二十年才走完的路,Anthropic用了不到三年。眼下讨论的问题已经不再是AI“能不能”改变工作方式,而是它正在以多快的速度改变,以及谁在这个过程中受益、谁被甩在后面。

那么,是不是“会用AI”就可以摘到这一波红利呢?以下是我个人基于切身经验的一些看法。我观察到一个越来越清晰的规律:同样的工具交给不同的人,产出差距可以是数量级的。这个差距不来自技术门槛,而来自使用者自身的认知结构和语言能力。仅从技术门槛来讲,尽管我至今对Python等编程语言一无所知,但这已经不妨碍我使用各种代理式AI工具,用自然语言描述需求,由AI调用不同的模型来自动编程,实现我的目标。

戈尔丁的竞赛:微小的起跑线差异,巨大的后果

2016年前后,我观察到一个现象:赢家通吃的效应开始从企业向个人渗透,从娱乐、体育等行业向更多行业蔓延。因能力差异而导致的收入差距越来越大,职场上的超级明星获得了不成比例的回报,不同行业间的收入差距也在逐渐拉大。赢家通吃使得些微优势就可以左右巨大的回报分配,并产生了一个副产品:起跑线优势。因此我们看到,由于技术进步,知识资本的价值急剧上升,成为社会分层的主要动力——一方面,知识含量不足的工作岗位工资增长停滞,与知识含量高的岗位之间的收入差距越来越大;另一方面,由于网络外部性和社会外部性,仅有极少数从业者能站到赢家的位置,而他们与其他人的实际知识差异并不大——极小的能力差距就可以造就极大的回报差异。

这是一个历史规律。2023年的诺贝尔经济学奖得主克劳迪亚•戈尔丁与劳伦斯•卡茨在合著的《教育和技术的竞赛》中刻画了一个事实:每一轮重大技术变革到来时,都会显著拉大人与人之间的生产率差距,进而形成巨大的收入差异。二十世纪初电气化和流水线生产的普及如此,计算机革命的早期阶段如此。这种差异往往直到教育体系做出充分调整以后,再经过一段时间才能慢慢弥合。拉开差距的往往不是巨大的能力鸿沟,而是看似微小的差异——经过新技术的杠杆放大,最终投射为收入和生产率的巨大分化。这种微小的差异,可能是受教育年限相近但学校质量有别,也可能来自所处社会网络的竞争差异。

AI正在重演这个剧本,而且放大倍数可能前所未有。近一年来,不断有研究报告和AI企业的负责人发出警告,称大多数白领岗位正受到AI的威胁,可能约有一半左右的入门级白领岗位将被AI取代。这些预测也许偏于激进——一方面,一项新技术在消灭就业的同时也会创造就业;另一方面,劳动力本身也具备适应能力,会调整自己的技能。但无论如何,AI对专业工作的渗透速度,远超多数人的预期。在这个快速渗透的过程中,戈尔丁框架的核心洞察变得格外重要:决定谁受益、谁被碾过去的,不是你是否拥有AI,而是你能不能有效地使用它。而就我个人经验而言,“有效使用”的门槛远比表面看起来要高得多。

框架与审美决定了输出的质量

什么叫“有效使用”?不妨先问一个更基本的问题:所谓的专家是什么?专家不是某个头衔,而是指在一个领域中积累了足够多的结构化经验,以至于面对新问题时,能迅速识别其类型、调用相应的分析框架、预判可能的陷阱。使用者脑子里有分析框架,给AI的指令就天然带有结构,产出质量因此更高。

以普通人都会经历的看病为例。一般患者对医生的病史陈述往往是“我经常头疼”,但有经验的患者会细致地陈述病情:痛的位置、持续时间和频率、是否伴随其他症状、最近生活作息有什么变化。固然,医生会逐项问诊,在一定程度上解决了患者信息输入不全的问题。但即便如此,不同认知水平的患者在治疗依从和最终诊疗效果上仍有显著差异。甚至有一些地区的妇产科医院在建卡时,会将夫妻均为低学历的孕产妇列入高危类别加以特别关注——安排更频繁的问诊、下达更详细更通俗的医嘱。

专家的优势不在于“知道更多信息”——信息检索恰恰是AI最擅长的事——而在于拥有一套问题分解的结构,知道一个复杂问题应该被拆成哪几个子问题、子问题之间的逻辑关系是什么、每个子问题的判断标准是什么。这套结构是在大量实践中内化的,不是读几本教科书就能获得的,更不是AI能替你生成的。AI可以在你的框架内高效执行,但它不能替你建立框架本身。而有无框架,直接决定了输出的质量。

审美是另一个关键变量。这里所说的“审美”不是艺术意义上的审美,而是对专业工作质量的鉴别力——什么是好的分析、深刻的洞察、有效的论证结构、干净的数据、信达雅的译文。这种鉴别力是长期专业训练的产物。AI不会替你建立品味,它只会忠实地执行你的品味——或者暴露你没有品味。同样是研究分析师,一个入行不久的小白问了AI一句“帮我分析一下这家公司”,然后大概率就没有然后了——他既发现不了回答中有价值的线索,也不知道如何进一步追问。相反,一个资深分析师从提问开始就带着明确的目的和判断标准,而追问、甚至否定AI的回答以调整讨论方向与视角,更是依赖于提问者的判断力。在这个意义上,框架和审美其实是同一枚硬币的两面,是经验的一体两面。

不难看出,AI加速了工作产出的效率,但它没有降低对判断力的要求,反而提高了——因为你现在需要在更快的速度下做出更多的判断。更精准的框架和更敏锐的判断力会让产出的质量更好,因为AI作为辅助者能提供远超一般专家个人经验的信息资源。更需要注意的是,大语言模型天然的被动性和迎合使用者的倾向,会放大框架和判断力的水平差异对结果造成的影响——框架越差,AI越不会纠正你,反而会顺着你的偏差越走越远,这和你去图书馆,走向什么书架,就会拿到什么书,是一个道理。

语言能力的放大效应

在学历教育中,语言是最重要的学科——所谓“语数外”,语言占了三分之二的比重,中文更是在中国大陆的教育中拥有独一无二的地位,在中小学的课时安排中遥遥领先。这种教育理念常被不少家长诟病。但笔者个人认为,单论语言的重要性,是怎么强调都不为过的。如果说认知框架决定了你能不能问对问题、问出好问题,那么语言能力决定了你能不能把问题传递清楚,能不能真正让AI成为你的思维伙伴。

向大模型输入指令的精确性直接决定了输出的结果,这曾经引发了一阵教别人怎么写prompt的热潮。但就我个人经验来看,专门去学prompt的收益并不大——真正起作用的是基本的表达能力。例如,我对AI说“这个数据有点问题”和“第三列的2019年数据与统计年鉴原表不一致,怀疑是口径变更导致的,请对比前后年份的指标定义”——前者让AI猜,后者让AI做。后者有可能一次就返回正确结果,而前者折腾五六轮可能都无法得到满意的回答。你和AI之间的交互质量,取决于你用语言组织思维的能力。

比精确描述更重要的是逻辑。 逻辑事关输入的准确性和需求描述的合理性,尤其是在大型任务中——需要调用复杂的AI工作流来应付这些任务的时候,输入内容的逻辑清晰是最基础的要求,直接关系到任务的可拆解性与设计的合理性。所谓逻辑,简言之就是“有理有据”——“理”包括因果关系、前提假设、充分与必要条件的辨析、比较基准的对等、推理链条的完整;“据”则是可靠的证据(这得首先会区分事实与观点)。

逻辑不仅决定输入的质量,也决定了与AI互动的深度。 多数人和AI的交互模式是“我问你答”,得到一个回答就接受了。但高效使用AI的人会追问和挑战:你这个结论的前提假设是什么?如果放松这个假设,结论还成立吗?有没有竞争性解释?支撑当前解释的关键证据是什么?你不是在让AI给你答案,而是在和它进行一场有质量的对话,通过逐步收窄来逼近更可靠的判断。这时候AI就成了自己的“虚拟同行评议”和研究助理,进而提升自身的工作质量与思考深度。

更深层的一点是,语言能力不仅影响表达,在很多时候它就是思考本身。能够用精确的语言描述一个问题的人,往往也是对这个问题想得更透的人。AI时代放大了这种共生关系:语言精度越高、逻辑性越强,AI的执行精度就越高、产出就会更深入;高质量的反馈又反过来帮助你进一步厘清思路,形成正向循环。

在边际上,英语能力目前仍是一个显著的效率加成。主流大语言模型的训练语料以英语为主,模型对英语指令的理解精度在多数场景下优于其他语言。但真正重要的不是语种选择,而是语言能力本身——用任何语言都可以高效驱动AI,前提是你能够结构化地表述复杂任务,精确地捕捉问题核心,并且在AI偏离方向时能够恰当地挑战和纠正它。

AI也许是一柄重如千钧的大刀,但要能挥舞成风、阵前破敌,仍需持刀之人有足够的武力值。框架、审美和语言,决定了这个武力值的上限。

断裂的阶梯:初级职位被替代之后

上面提到的三种能力——结构化的认知框架、对品质的判断力和精确而富有逻辑的语言表达——主要不是在课堂里教出来的。大多数专业技术人员的这些素养,都是通过“干中学”学到的:毕业后进入初级专业岗位,在大量看似枯燥的基础工作中逐步积累专业直觉。以中国宏观研究为例,一个新入行的研究员会慢慢知道数据口径等质量问题如何识别、对历史事件的理解如何深化、不同研究流派的分歧与各自的优势何在,逐渐习得对数据质量的直觉和对研究设计的理解。在这个过程中,框架、审美与语言表达的能力训练水到渠成。这正是他日后成为资深专业人员的基础。

但这条阶梯正在被大语言模型抽掉中间的脚手架。斯坦福数字经济实验室利用了2.85亿条美国在线招聘广告进行分析,发现22-25岁年轻人群的就业出现了显著的收缩(总体下降约6%,软件开发等领域甚至回落达20%),但企业对能熟练运用AI的资深人才以及具备高级管理和决策能力的岗位需求反而有所增加。这种“去初级化”的现象被研究者称为招聘压缩(Hiring Compression)。其逻辑并不复杂: 一个资深专业人员加上AI,能完成过去十个初级员工的工作量。

但问题在于,那些被替代的初级专业岗位,虽然承担的是重复性和基础性工作,却恰恰也是专业素养的隐性训练场,是他们走向资深职位的脚手架。取消了这些岗位,就等于拆掉了通往资深专业能力的脚手架。笔者自己过往近二十年的研究与写作,方法虽然原始,但无论是文献阅读、数据清洗,还是写作中的不断打磨返工,都在塑造着我的判断力和审美。如果一个人一出校门就有AI代劳这些工作,这些能力的养成将困难得多——而没有这些能力,他驾驭AI的能力也就无从谈起。

这是一个尚未被充分讨论的结构性悖论:AI替代的不只是岗位,更是一条完整的专业成长路径。十年后,我们可能面对一个吊诡的局面——AI消灭了初级岗位,却没有人有资格胜任高级岗位。戈尔丁和卡茨的“技术与教育的竞赛”,在这里获得了一层新的含义:教育需要追赶的不仅是技能的更新,还有整个人才培养生态的重建。我无力预测未来专家的培养路径将如何重塑,但在当下,这确实已是一个迫在眉睫的问题。

中国的特殊困境:语言教育不训练表达能力

上述分析适用于所有语言环境,但作为一个长期从事中文研究与写作的人,笔者感到中国还面临着一个额外的结构性劣势:语言教育体系长期重记忆、轻表达;在表达层面重修饰、重文采,而轻内容、轻逻辑。这在AI时代的代价正在急剧放大。

一般来说,语言教育的总体目标可以追溯到古希腊所谓的“三艺”(Trivium),即文法(Grammar)、修辞(Rhetoric)和逻辑(Logic)。文法强调的是语言的严谨性和准确性;修辞是说服的艺术,强调依据不同的受众和目的,采取相应的策略去说服他人;而逻辑则是语言的骨架——所谓批判性思维、同行评议,都遵循相近的路径:提出主张,给出事实和证据,建立证据与主张之间的逻辑关联,同时承认存在例外,预判潜在的质疑。合格的逻辑论证天然是可证伪的、可追溯的、结构化的。

中国的语文教育以及更广泛的文理教育,从小学到高中,训练的不是思辩思维,而更多的是标准答案与记忆。作文写作追求的是比喻、排比、华丽的词藻和感人的升华,而非逻辑的严密、论据的充分和表达的精确。直到今天,中国的中小学和大学中,普通学生几乎不接受系统的逻辑训练。一篇高考满分作文,往往辞藻华丽、情感充沛,却内容乏味。事实上,唐宋古文运动的历史表明,平易朴实、流畅但结构紧凑、逻辑严谨的文章,在生活和工作中往往更具表达力和生命力。至于作为外语的英语教育,问题更为突出——重心放在语法规则的记忆和标准化考试的应对上,“听说读写”四项能力中,可能只有阅读稍好一些,听、说、写方面的欠缺则相当明显。

就我个人经验,大多数人步入职场后,都要经历一次蜕变——摆脱学生时期养成的那种高中生读后感式的、动辄莫名其妙地拔高的华而不实的文风,转向有理有据地把事情说明白、讲清楚的写法。走好这一步,才算是在职场上站稳了脚跟。但很多人因为工作性质等种种因素,这种转变的历练并不充分,语言能力的成长由此受限。此时,学校阶段语言教育的欠缺就会成为使用AI的一道难以逾越的障碍。

戈尔丁的方案之外,我们还能做什么?

回到戈尔丁的框架。她的研究告诉我们,技术与教育的竞赛中,教育总会追上来——但追上来的速度,决定了一代人是受益者还是被碾过去的人。当然,我们也完全不否认,在技术猛烈进步的时代,有人能快速地适应新技术,甚至借助新技术实现了在旧技术条件下无法实现的弯道超车。二十世纪初,美国高中教育的大规模普及用了大约三十年才跟上工业化的步伐。这一轮AI变革的节奏显然更快,留给调整的窗口也更窄。

除了教育,作为个体还能做什么?从前文的讨论来看,答案也许并不新鲜:AI时代,传统的专家品质依然是稀缺要素——结构化的认知能力、复杂场景下的语言表达和思辩能力,以及优秀的判断力。但历史也告诉我们,每一次重大技术变革都会重新定义“有用的能力”。印刷术让记忆力的价值下降,让写作和编辑能力的价值上升。计算器让笔算心算能力贬值,让数学建模能力升值。AI正在做同样的事:它让信息检索和常规文本生产的能力贬值,让思维的结构化能力、语言的精确表达能力和专业的判断能力升值。谁先看清这个趋势并据此调整自己的能力投资组合,谁就能在这一轮变革中占据先机。工具人人都能用,差距从来都在工具之外。

最后,分享一段个人近期的经历。三四个月前,我对大模型的态度还颇为消极:模型迭代如此之快,今天一个版本、明天又一个版本,学会了也很快就被迭代掉,何不等到未来有了稳定的生产力工具再说?然而,在朋友的推动下,我开始深入使用了几个模型,才意识到自己确实过于轻慢了。在我与模型的互动后得到的输出中,有些内容的水准已经达到了我所比较尊敬的行业顶尖专家的水平——尽管部分结论我仍然倾向于去找真正的学者做对照,但身边能有一个这种水平的“专家”随时与自己讨论问题,即便还有不少缺陷,其价值也已不容低估。

反观我此前的判断,漏洞不少。比如,AI的迭代究竟要经过多长时间才能趋于稳定——是一两年,还是五到十年都会持续剧烈变化?这直接决定了个人是否跟得上。更何况,AI终究只是一个工具,是工具就有能力的边界,而对这个边界的把握本身也需要认知能力——比如如何识别幻觉、了解资料的覆盖盲区、权衡不同模型的性价比。善用AI本身就是一项需要培养的能力。这种能力不完全等同于框架或审美,而更接近一种“工具直觉”——知道什么任务可以放手让AI做,什么任务必须人工兜底。退一步说,愿不愿意现在就紧跟技术进步的步伐,本身就是一种筛选机制,是适应能力的外在体现。“不着急学”这四个字,可能已经在不声不响地拉开差距了。

(本文仅代表作者本人观点,责编:闫曼 [email protected])