Anthropic 80% 的代码现在由 Claude 编写。
这不是科幻小说,是 2026 年 6 月 Anthropic 公开的数据。更夸张的是,他们的工程师人均代码产出在两年内翻了 8 倍——不是因为人变强了,而是因为 AI 替他们写了。
这件事的技术名称叫”递归自我提升”(Recursive Self-Improvement, RSI):AI 自己设计、训练、优化下一代 AI。Anthropic 说,我们还没到那一步,但可能比大多数人以为的更近。
什么是递归自我提升?
简单说:AI 不再需要人类手把手教,它自己就能造出更强的自己。
现在的 AI 开发是这样的:人类写代码 → 训练模型 → 测试 → 调优 → 发布。每一步都需要人类决策。但如果 AI 能接管这整条链,它就进入了一个自我加速的循环:更强的 AI 造出更更强的 AI,速度越来越快。
这不是理论推演。Anthropic 这篇博客拿出了一堆硬数据,证明这个循环已经开始转起来了。
数据不会说谎
AI 独立完成任务的时长,每 4 个月翻一倍。
- 2024 年 3 月:Claude Opus 3 能完成 4 分钟的任务
- 2025 年 3 月:Claude Sonnet 3.7 能完成 1.5 小时的任务
- 2026 年 3 月:Claude Opus 4.6 能完成 12 小时的任务
- 2026 年 5 月:Claude Mythos Preview 能完成至少 16 小时的任务
按这个趋势,今年内 AI 就能完成”需要一个熟练工程师干几天”的任务。2027 年,可能是”需要几周”的任务。
工程师人均代码产出:2024 → 2026,翻了 8 倍。
Anthropic 内部数据显示,2021-2024 年,工程师人均每天合并的代码量基本不变。2025 年初 Claude Code 上线后,这条线开始上扬。2026 年初模型能独立工作更长时间后,斜率再次变陡。到 2026 年第二季度,典型工程师每天合并的代码量是 2024 年的 8 倍。
代码行数不是完美指标(更多不等于更好),但 Anthropic 不按代码行数发奖金。这 8 倍是真实的生产力变化:工程师不再自己敲代码,而是指挥 Claude 写,然后 review。
Claude 在最开放编程任务的成功率:6 个月从 26% 跳到 76%。
Anthropic 把任务分成四档:简单修复、常规任务、复杂任务、开放式问题。开放式问题是指”工程师自己也不确定答案长什么样”的那种。
2025 年 11 月,Claude 在这类任务上的成功率只有 26%。到 2026 年 5 月,这个数字变成了 76%。半年跳了 50 个百分点。
举个例子:一次常规升级导致数万个训练任务崩溃。工程师只给了 Claude 一些文本内容和集群访问权限,没有详细指令。Claude 自己一个环境变量一个环境变量地测试,找到了触发崩溃的那个隐蔽的调试标志,复现了问题,确认了修复方案。两小时搞定,人类要两到三天。
代码优化能力:从 3x 到 52x,人类 4-8 小时才做到 4x。
Anthropic 每次发布新模型都会跑同一个测试:给 Claude 一段训练小型 AI 模型的代码,让它在保证正确性的前提下尽可能优化速度。
- 2025 年 5 月,Claude Opus 4 平均能优化 3 倍
- 2026 年 4 月,Claude Mythos Preview 能优化 52 倍
- 作为对比:熟练的人类研究员需要 4-8 小时才能达到 4 倍
这是研究工作流的一个缩影——在明确定义的实验中优化步骤。Claude 不到一年就从”很有用”变成了”超人类”。
AI 安全研究:人类一周缩小 23% 的 gap,Claude 缩小 97%。
2026 年 4 月,Anthropic 发布了第一个 Claude 端到端完成开放研究项目的演示。问题是 AI 安全领域的经典难题:弱模型能可靠地监督强模型吗?
两名人类研究员,大约一周时间,缩小了 23% 的性能差距(floor 是弱监督器单干的表现,ceiling 是强模型用正确答案训练的表现)。Claude 驱动的 agent 们,累计 800 小时,用了大约 18000 美元算力,缩小了 97% 的差距。
人类的角色只剩下:选题 + 定义评分标准。所有实验都是 agent 自己设计的。
Anthropic 的研究员说:”Claude 在 1-2 天内就搞定了这些,基本没怎么需要我的帮助。如果一个初级同事在同样的时间内给我交出这种结果,我会有点印象深刻。未来已经来了。”
Claude 现在能捕获人类工程师漏掉的 bug。
Anthropic 现在用自动化的 Claude reviewer 审查所有代码变更。他们做了个回溯分析:如果过去每次代码变更都让 Claude review 一遍,大约三分之一导致 claude.ai 生产事故的 bug 能在上线前被拦下来。
写出那些 bug 的工程师,是世界上最顶尖的那批人。Claude 开始抓到他们的错了。
三种可能的未来
Anthropic 提出了三种情景。
情景一:趋势停滞(S 曲线)
所有指数级增长最终都会遇到天花板。也许我们正在接近弯道,回报递减,曲线变平。
可能是技术瓶颈:模型架构需要新的突破(就像当年 Transformer 取代 RNN 那样),现在的缩放定律走不下去了。
可能是供应链瓶颈:芯片产能、电网扩容、互联带宽跟不上,算力和能源成为限制因素。
也可能是某种外部冲击——比如算力或电力供应突然短缺——让整个 AI 生态慢下来。
即使能力冻结在今天的水平,世界也会发生重大变化。Anthropic 的 Project Glasswing 上线几周就发现了超过一万个高危和严重级别的软件漏洞,覆盖全球最重要的系统。网络防御的瓶颈已经从”找漏洞”变成了”补得够不够快”。
而我们还处在今天这代模型扩散到更广泛经济体的早期阶段。100 人的公司能干 1000 人公司的活,因为每个员工背后都有一个 agent 金字塔。
Anthropic 说:这种情景我们列在这里是为了完整性,但我们不认为它可能发生。我们能测量的每一项能力——包括那些感觉”更软”的,比如代码质量和开放任务成功率——到目前为止都沿着同一条曲线走。我们还没看到曲线弯下来。
情景二:AI 实验室持续获得复合效率增益
这是 Anthropic 认为目前最可能的情景。
AI 开发大幅自动化,但人类仍然掌握方向盘:设定研究方向、判断结果。组织效率暴涨,100 人的公司能干 1 万人甚至 10 万人的活。
这会彻底改变知识工作和政府服务。但同样的力量也能用在坏的方面:威权政府监控整个人口,影响力操作针对每个个体量身定制、规模化运行,没有任何人类团队能匹敌。
人类在 Anthropic 这样的公司里的角色会转变:与 AI 系统合作,扩大研究规模,产生新洞察,并一起构建验证 AI 输出可信度的系统。
但加速一个环节往往只是把瓶颈转移到别处。Anthropic 已经遇到了这个问题:代码产出暴涨后,人类 code review 变成了新瓶颈。
还有一个摩擦点:新想法、新工具、新模拟的爆炸式增长,远超他们的执行能力。如何快速发现并修复这些瓶颈,可能会成为组织最重要的能力。
情景三:完全 RSI——AI 自己造 AI
如果技术趋势继续,而且 AI 系统获得了”变革性人类独创力”的能力,那么 AI 就能设计和优化它自己。
在这个世界里,AI 开发的速度完全取决于算力供应(或者发现各种训练/推理效率优化的速度)。人类的作用大幅缩小,主要精力转向监督、验证、确认一个不断扩张的”虚拟实验室”的输出。
能做自动化 AI 研发的系统,技能会迁移到其他科学领域,开始革命化其他学科。
对齐问题(alignment problem)在这个未来如何解决——或者根本解决不了——是最不确定的部分。
模型可能足够对齐、足够有研究品味,能发现并实施我们还没想到的新方案。它们也可能足够明智,在条件不成熟时主动暂停开发。
或者,今天模型中偶尔出现的错误对齐会随着模型造模型而复合:越来越频繁,越来越难理解,直到我们失去控制。
也有可能我们根本无法构建、整合、验证所需的工具,来搞清楚我们实际处在哪条轨迹上。
Anthropic 说:我们对这个世界会是什么样没有好的直觉,因为我们的经济目前由人类和人类造的工具驱动。快速 RSI 的世界可能会被自我改进的模型主导,因为它的能力完全超越了人类,并在更广泛的经济中扩散。很难预测如果人类劳动不再有竞争力,经济会是什么样。
即使模型开发完全自动化和递归,我们也无法预测这对大多数人的日常生活意味着什么。更强大的智能可能帮助我们在某些领域快速实现《慈爱机器》(Machines of Loving Grace,Dario Amodei 的乐观愿景)中描绘的好处。我们预计具身智能(机器人)可能会紧随递归智能,走上类似的路径:回报递增、成本递减。
但光有递归改进,不意味着工业生产方式、社会组织形式、市场运作会立刻改变。更多智能学不出一个药物几十年使用的效果,改不了宪法规定的选举周期,也没法让陌生人一个周末就变成老朋友。对大多数人来说,这个未来的实际节奏仍然由瓶颈决定——即使上游的实验室以算力的速度狂奔。
递归智能以越来越快的速度自我构建,与人类、关系、治理的世界碰撞,这是这个未来我们无法预测的另一部分。
AI 军备竞赛与”核不扩散条约”
如果能有效地放慢这项技术的发展,给自己更多时间处理它的巨大影响,Anthropic 认为这可能是件好事。但如果放慢只是让最不谨慎的参与者在技术上追上来,可能会让所有人都更不安全。
没有全球协调机制,公司和政府就得在竞争和地缘政治压力下做艰难的安全决策。
Anthropic 的立场是:世界应该有”选择权”来放慢或暂停前沿 AI 开发,让社会结构和对齐研究跟上技术进步。但这需要一个可验证的全球协调机制。
验证问题:比核武器难多了
有意义的放慢或暂停需要多家资源充足、处于或接近前沿的实验室——在多个国家——同意在相同条件下停止。还需要每家都能验证其他人真的停了。
核不扩散条约可以验证:导弹发射井在那里,卫星能看见。但训练跑(training run)比导弹发射井容易隐藏得多,它的输入是通用的(芯片、数据、电力,都不是专用的),而且悄悄背叛的激励巨大:别人暂停的时候你继续,你就继承了领先地位。
可信的暂停还得明确:什么触发它?什么解除它?谁来裁决?
这在原则上不是不可能——世界为其他复杂技术建立过验证机制(比如《中程核力量条约》)——但那些机制花了几十年建立基础设施和信任。我们没那么长时间。
单边暂停(一家实验室自己停)立刻就能做到,但意义小得多:它只会改变谁是领跑者,不会创造目前缺失的更广泛的审议过程。
Anthropic 说:如果这样的系统存在,我们预期我们会放慢或暂停,前提是其他处于或接近前沿的开发者也以可验证的方式这样做。
对普通人意味着什么?
短期(1-2 年):你的工作可能还在,但性质会变。如果你是知识工作者,你会发现自己越来越多地扮演”指挥官 + 审查员”的角色,而不是执行者。100 人的团队能干 1000 人的活。
中期(3-5 年):就业结构会重塑。”写代码””做研究””写报告”这些技能的市场价值会暴跌。值钱的会是判断力、品味、方向感——那些 AI 现在还不太行、但进步很快的东西。
长期(5 年以上):如果真的进入完全 RSI,没人知道会怎样。可能是乌托邦(科学飞速进步、疾病被治愈、能源问题解决),可能是反乌托邦(人类失去控制、AI 走向我们不理解的方向),也可能是中间态(AI 很强但仍然受限于物理世界的瓶颈,变化比预期的慢)。
有一点是确定的:这不是”会不会发生”的问题,而是”多快发生”和”我们准备好了吗”的问题。
判断的方向
Anthropic 这篇文章没有给出结论,但它给了判断的方向:
- 数据是真实的。 这不是炒作,不是科幻,是正在发生的事实。AI 已经在加速 AI 的开发。
- 趋势还没有减速的迹象。 所有可测量的能力都在沿着同一条曲线走,还没看到弯道。
- 最后的人类优势是”品味”和”方向感”——但这个优势正在缩小。Claude 在研究决策上选择更好下一步的能力,半年内从 51% 涨到 64%。
- 我们没有多少时间。 核不扩散条约花了几十年才建立起来。AI 的发展速度比那快得多。
- 单靠技术公司的自律不够。 需要政策制定者、研究人员、公民社会的共同参与。
Anthropic 说得很明白:讨论的窗口就在这里,现在就要开始。AI 公司之外的人应该参与这场审议。
离奇点还有多远?可能比你以为的近。可能就在这个十年的某个时刻。
问题是:我们准备好了吗?



