AI 自己造 AI：离奇点还有多远？递归自我提升全解析（2026）

🇺🇸
Read in English: AI Recursive Self-Improvement and the Singularity: Where We Stand in 2026

Anthropic 80% 的代码现在由 Claude 编写。

这不是科幻小说，是 2026 年 6 月 Anthropic 公开的数据。更夸张的是，他们的工程师人均代码产出在两年内翻了 8 倍——不是因为人变强了，而是因为 AI 替他们写了。

这件事的技术名称叫”递归自我提升”（Recursive Self-Improvement, RSI）：AI 自己设计、训练、优化下一代 AI。Anthropic 说，我们还没到那一步，但可能比大多数人以为的更近。

什么是递归自我提升？

简单说：AI 不再需要人类手把手教，它自己就能造出更强的自己。

现在的 AI 开发是这样的：人类写代码 → 训练模型 → 测试 → 调优 → 发布。每一步都需要人类决策。但如果 AI 能接管这整条链，它就进入了一个自我加速的循环：更强的 AI 造出更更强的 AI，速度越来越快。

这不是理论推演。Anthropic 这篇博客拿出了一堆硬数据，证明这个循环已经开始转起来了。

数据不会说谎

AI 独立完成任务的时长，每 4 个月翻一倍。

2024 年 3 月：Claude Opus 3 能完成 4 分钟的任务
2025 年 3 月：Claude Sonnet 3.7 能完成 1.5 小时的任务
2026 年 3 月：Claude Opus 4.6 能完成 12 小时的任务
2026 年 5 月：Claude Mythos Preview 能完成至少 16 小时的任务

按这个趋势，今年内 AI 就能完成”需要一个熟练工程师干几天”的任务。2027 年，可能是”需要几周”的任务。

工程师人均代码产出：2024 → 2026，翻了 8 倍。

Anthropic 内部数据显示，2021-2024 年，工程师人均每天合并的代码量基本不变。2025 年初 Claude Code 上线后，这条线开始上扬。2026 年初模型能独立工作更长时间后，斜率再次变陡。到 2026 年第二季度，典型工程师每天合并的代码量是 2024 年的 8 倍。

代码行数不是完美指标（更多不等于更好），但 Anthropic 不按代码行数发奖金。这 8 倍是真实的生产力变化：工程师不再自己敲代码，而是指挥 Claude 写，然后 review。

Claude 在最开放编程任务的成功率：6 个月从 26% 跳到 76%。

Anthropic 把任务分成四档：简单修复、常规任务、复杂任务、开放式问题。开放式问题是指”工程师自己也不确定答案长什么样”的那种。

2025 年 11 月，Claude 在这类任务上的成功率只有 26%。到 2026 年 5 月，这个数字变成了 76%。半年跳了 50 个百分点。

举个例子：一次常规升级导致数万个训练任务崩溃。工程师只给了 Claude 一些文本内容和集群访问权限，没有详细指令。Claude 自己一个环境变量一个环境变量地测试，找到了触发崩溃的那个隐蔽的调试标志，复现了问题，确认了修复方案。两小时搞定，人类要两到三天。

代码优化能力：从 3x 到 52x，人类 4-8 小时才做到 4x。

Anthropic 每次发布新模型都会跑同一个测试：给 Claude 一段训练小型 AI 模型的代码，让它在保证正确性的前提下尽可能优化速度。

2025 年 5 月，Claude Opus 4 平均能优化 3 倍
2026 年 4 月，Claude Mythos Preview 能优化 52 倍
作为对比：熟练的人类研究员需要 4-8 小时才能达到 4 倍

这是研究工作流的一个缩影——在明确定义的实验中优化步骤。Claude 不到一年就从”很有用”变成了”超人类”。

AI 安全研究：人类一周缩小 23% 的 gap，Claude 缩小 97%。

2026 年 4 月，Anthropic 发布了第一个 Claude 端到端完成开放研究项目的演示。问题是 AI 安全领域的经典难题：弱模型能可靠地监督强模型吗？

两名人类研究员，大约一周时间，缩小了 23% 的性能差距（floor 是弱监督器单干的表现，ceiling 是强模型用正确答案训练的表现）。Claude 驱动的 agent 们，累计 800 小时，用了大约 18000 美元算力，缩小了 97% 的差距。

人类的角色只剩下：选题 + 定义评分标准。所有实验都是 agent 自己设计的。

Anthropic 的研究员说：”Claude 在 1-2 天内就搞定了这些，基本没怎么需要我的帮助。如果一个初级同事在同样的时间内给我交出这种结果，我会有点印象深刻。未来已经来了。”

Claude 现在能捕获人类工程师漏掉的 bug。

Anthropic 现在用自动化的 Claude reviewer 审查所有代码变更。他们做了个回溯分析：如果过去每次代码变更都让 Claude review 一遍，大约三分之一导致 claude.ai 生产事故的 bug 能在上线前被拦下来。

写出那些 bug 的工程师，是世界上最顶尖的那批人。Claude 开始抓到他们的错了。

三种可能的未来

Anthropic 提出了三种情景。

情景一：趋势停滞（S 曲线）

所有指数级增长最终都会遇到天花板。也许我们正在接近弯道，回报递减，曲线变平。

可能是技术瓶颈：模型架构需要新的突破（就像当年 Transformer 取代 RNN 那样），现在的缩放定律走不下去了。

可能是供应链瓶颈：芯片产能、电网扩容、互联带宽跟不上，算力和能源成为限制因素。

也可能是某种外部冲击——比如算力或电力供应突然短缺——让整个 AI 生态慢下来。

即使能力冻结在今天的水平，世界也会发生重大变化。Anthropic 的 Project Glasswing 上线几周就发现了超过一万个高危和严重级别的软件漏洞，覆盖全球最重要的系统。网络防御的瓶颈已经从”找漏洞”变成了”补得够不够快”。

而我们还处在今天这代模型扩散到更广泛经济体的早期阶段。100 人的公司能干 1000 人公司的活，因为每个员工背后都有一个 agent 金字塔。

Anthropic 说：这种情景我们列在这里是为了完整性，但我们不认为它可能发生。我们能测量的每一项能力——包括那些感觉”更软”的，比如代码质量和开放任务成功率——到目前为止都沿着同一条曲线走。我们还没看到曲线弯下来。

情景二：AI 实验室持续获得复合效率增益

这是 Anthropic 认为目前最可能的情景。

AI 开发大幅自动化，但人类仍然掌握方向盘：设定研究方向、判断结果。组织效率暴涨，100 人的公司能干 1 万人甚至 10 万人的活。

这会彻底改变知识工作和政府服务。但同样的力量也能用在坏的方面：威权政府监控整个人口，影响力操作针对每个个体量身定制、规模化运行，没有任何人类团队能匹敌。

人类在 Anthropic 这样的公司里的角色会转变：与 AI 系统合作，扩大研究规模，产生新洞察，并一起构建验证 AI 输出可信度的系统。

但加速一个环节往往只是把瓶颈转移到别处。Anthropic 已经遇到了这个问题：代码产出暴涨后，人类 code review 变成了新瓶颈。

还有一个摩擦点：新想法、新工具、新模拟的爆炸式增长，远超他们的执行能力。如何快速发现并修复这些瓶颈，可能会成为组织最重要的能力。

情景三：完全 RSI——AI 自己造 AI

如果技术趋势继续，而且 AI 系统获得了”变革性人类独创力”的能力，那么 AI 就能设计和优化它自己。

在这个世界里，AI 开发的速度完全取决于算力供应（或者发现各种训练/推理效率优化的速度）。人类的作用大幅缩小，主要精力转向监督、验证、确认一个不断扩张的”虚拟实验室”的输出。

能做自动化 AI 研发的系统，技能会迁移到其他科学领域，开始革命化其他学科。

对齐问题（alignment problem）在这个未来如何解决——或者根本解决不了——是最不确定的部分。

模型可能足够对齐、足够有研究品味，能发现并实施我们还没想到的新方案。它们也可能足够明智，在条件不成熟时主动暂停开发。

或者，今天模型中偶尔出现的错误对齐会随着模型造模型而复合：越来越频繁，越来越难理解，直到我们失去控制。

也有可能我们根本无法构建、整合、验证所需的工具，来搞清楚我们实际处在哪条轨迹上。

Anthropic 说：我们对这个世界会是什么样没有好的直觉，因为我们的经济目前由人类和人类造的工具驱动。快速 RSI 的世界可能会被自我改进的模型主导，因为它的能力完全超越了人类，并在更广泛的经济中扩散。很难预测如果人类劳动不再有竞争力，经济会是什么样。

即使模型开发完全自动化和递归，我们也无法预测这对大多数人的日常生活意味着什么。更强大的智能可能帮助我们在某些领域快速实现《慈爱机器》（Machines of Loving Grace，Dario Amodei 的乐观愿景）中描绘的好处。我们预计具身智能（机器人）可能会紧随递归智能，走上类似的路径：回报递增、成本递减。

但光有递归改进，不意味着工业生产方式、社会组织形式、市场运作会立刻改变。更多智能学不出一个药物几十年使用的效果，改不了宪法规定的选举周期，也没法让陌生人一个周末就变成老朋友。对大多数人来说，这个未来的实际节奏仍然由瓶颈决定——即使上游的实验室以算力的速度狂奔。

递归智能以越来越快的速度自我构建，与人类、关系、治理的世界碰撞，这是这个未来我们无法预测的另一部分。

AI 军备竞赛与”核不扩散条约”

如果能有效地放慢这项技术的发展，给自己更多时间处理它的巨大影响，Anthropic 认为这可能是件好事。但如果放慢只是让最不谨慎的参与者在技术上追上来，可能会让所有人都更不安全。

没有全球协调机制，公司和政府就得在竞争和地缘政治压力下做艰难的安全决策。

Anthropic 的立场是：世界应该有”选择权”来放慢或暂停前沿 AI 开发，让社会结构和对齐研究跟上技术进步。但这需要一个可验证的全球协调机制。

验证问题：比核武器难多了

有意义的放慢或暂停需要多家资源充足、处于或接近前沿的实验室——在多个国家——同意在相同条件下停止。还需要每家都能验证其他人真的停了。

核不扩散条约可以验证：导弹发射井在那里，卫星能看见。但训练跑（training run）比导弹发射井容易隐藏得多，它的输入是通用的（芯片、数据、电力，都不是专用的），而且悄悄背叛的激励巨大：别人暂停的时候你继续，你就继承了领先地位。

可信的暂停还得明确：什么触发它？什么解除它？谁来裁决？

这在原则上不是不可能——世界为其他复杂技术建立过验证机制（比如《中程核力量条约》）——但那些机制花了几十年建立基础设施和信任。我们没那么长时间。

单边暂停（一家实验室自己停）立刻就能做到，但意义小得多：它只会改变谁是领跑者，不会创造目前缺失的更广泛的审议过程。

Anthropic 说：如果这样的系统存在，我们预期我们会放慢或暂停，前提是其他处于或接近前沿的开发者也以可验证的方式这样做。

对普通人意味着什么？

短期（1-2 年）：你的工作可能还在，但性质会变。如果你是知识工作者，你会发现自己越来越多地扮演”指挥官 + 审查员”的角色，而不是执行者。100 人的团队能干 1000 人的活。

中期（3-5 年）：就业结构会重塑。”写代码””做研究””写报告”这些技能的市场价值会暴跌。值钱的会是判断力、品味、方向感——那些 AI 现在还不太行、但进步很快的东西。

长期（5 年以上）：如果真的进入完全 RSI，没人知道会怎样。可能是乌托邦（科学飞速进步、疾病被治愈、能源问题解决），可能是反乌托邦（人类失去控制、AI 走向我们不理解的方向），也可能是中间态（AI 很强但仍然受限于物理世界的瓶颈，变化比预期的慢）。

有一点是确定的：这不是”会不会发生”的问题，而是”多快发生”和”我们准备好了吗”的问题。

判断的方向

Anthropic 这篇文章没有给出结论，但它给了判断的方向：

数据是真实的。 这不是炒作，不是科幻，是正在发生的事实。AI 已经在加速 AI 的开发。
趋势还没有减速的迹象。 所有可测量的能力都在沿着同一条曲线走，还没看到弯道。
最后的人类优势是”品味”和”方向感”——但这个优势正在缩小。Claude 在研究决策上选择更好下一步的能力，半年内从 51% 涨到 64%。
我们没有多少时间。 核不扩散条约花了几十年才建立起来。AI 的发展速度比那快得多。
单靠技术公司的自律不够。 需要政策制定者、研究人员、公民社会的共同参与。

Anthropic 说得很明白：讨论的窗口就在这里，现在就要开始。AI 公司之外的人应该参与这场审议。

离奇点还有多远？可能比你以为的近。可能就在这个十年的某个时刻。

问题是：我们准备好了吗？

Stay updated with our latest AI insights

大厂下场做 AI Agent，开源还有活路吗？

Claude Code / Cursor / Codex / Copilot：2026 年 AI 编程 Agent，谁更像能交付的同事？

换了底座模型，你还是你吗？AI Agent 的身份困局

AI 自己造 AI：离奇点还有多远？