从牛顿到 Anthropic,为什么造神的人最后都信神

从牛顿到 Anthropic,为什么造神的人最后都信神

5 月 25 日,梵蒂冈将发生一件很不寻常的事。

教皇 Leo XIV 要发布他上任以来的第一份通谕,《Magnifica Humanitas》,主题是在人工智能时代保护人的尊严。这本身不算意外,梵蒂冈从 2020 年就开始关注 AI 伦理。真正让人侧目的是发布会的嘉宾名单:Chris Olah,Anthropic 联合创始人,全球做 AI 可解释性研究最深的人之一,将和教皇同台。

一个试图理解 AI 内部在想什么的工程师,和一个试图定义人类灵魂边界的宗教领袖,坐在同一张桌子前。

这个画面让我想起另一个人,艾萨克·牛顿。

牛顿的另一面:一百万字神学手稿

教科书里的牛顿,是那个被苹果砸中脑袋的理性主义英雄。万有引力、微积分、光学三棱镜,他用数学语言重写了物理世界的规则,把上帝从自然哲学的解释链条里踢了出去。

但教科书不会告诉你的是:牛顿一生写下的神学手稿,比他的科学著作多得多。

1936 年,苏富比拍卖了一批牛顿遗稿。经济学家凯恩斯拿下了炼金术部分,犹太学者 Abraham Yahuda 抢到了神学部分。Yahuda 拿到手的那一刻就意识到这批东西的分量,超过 1500 页牛顿亲笔手稿,内容涵盖圣经预言解读、教会年代学、启示录注释、三位一体批判。

这不是晚年糊涂。牛顿生于 1642 年 12 月 25 日。1670 年代他就开始系统性地研究神学,那时他 28 到 37 岁,正是在剑桥三一学院担任卢卡斯数学讲席教授、写出《自然哲学的数学原理》的巅峰期。这种钻研贯穿了他整个科学生涯。他写《自然哲学的数学原理》的同时,也在写《但以理书与启示录预言注释》。他计算行星轨道的同时,也在计算所罗门圣殿的精确尺寸,因为他相信圣殿的比例里藏着宇宙的密码。

牛顿项目(Newton Project)的学者们花了二十年数字化这些手稿,现在存放在牛津大学和耶路撒冷国家图书馆。读过这些材料的人都会得出同一个结论:牛顿不是”晚年转向宗教”,他从来没离开过。

问题是,为什么?

一个能用三条定律解释天体运动的人,为什么要花三十年研究《但以理书》第七章的四只兽代表哪四个帝国?

理性的天花板:机制能解释,目的不能

答案藏在牛顿自己的一段话里。他在《原理》的总注释中写道:”这个最美丽的太阳、行星和彗星系统,只能出自一个智慧而强大的存在者的设计和统治。”

注意这个逻辑:牛顿不是在说”我解释不了,所以是上帝干的”。他是在说”我能解释它怎么运作,但解释不了它为什么存在”。

这是一个极其精确的区分。

万有引力告诉你苹果为什么落地,质量之间的吸引力,与距离平方成反比。但万有引力不告诉你:为什么宇宙里要有引力这回事?为什么物理常数恰好是这些值,而不是别的值?为什么存在比不存在更合理?

牛顿摸到了一个边界。在这个边界的这一侧,数学和实验可以给出完美的答案。在边界的那一侧,是”目的”和”意义”的领地,而他手里的工具在那里完全失效。

面对这个边界,牛顿做了一个选择:他没有假装边界不存在,也没有停下来说”这个问题无意义”。他翻过去了。用他能找到的最古老的文本,圣经,去寻找那个”为什么”的答案。

你可以说他错了。但你不能说他不诚实。

Chris Olah 在干什么:给 AI 做脑部 CT

三百年后,另一个人站在了类似的边界前面。

Chris Olah 是 Anthropic 的联合创始人,但他在公司里的角色很特殊。他不做产品,不做商业化,他带领的团队只做一件事:搞清楚神经网络内部到底在发生什么。

这个领域叫”机械可解释性”(Mechanistic Interpretability)。名字很学术,核心问题却很直白:当 Claude 回答你一个问题的时候,它的”思考过程”是什么?不是它输出的那些看起来像思考的文字,是它内部数十亿参数之间真实的信息流动。

2025 年 3 月,Olah 的团队发布了一项突破性工作:Circuit Tracing(电路追踪)。简单说,他们开发了一种方法,可以追踪一个特定的输出是如何从输入一步步”流”过神经网络的。不是统计相关性,而是因果链条。哪些神经元被激活了,它们之间怎么传递信息,最终怎么汇聚成一个答案。

相当于给 AI 做脑部 CT。以前只能看到 AI 的行为,现在开始能看到它的”神经回路”。

但 Olah 自己承认过:看到的越多,困惑也越多。

Circuit Tracing 能告诉你信息怎么流动,却不能告诉你为什么这种流动方式能产生”理解”。他们能定位到某个特征在网络中被激活,却解释不了为什么数十亿参数的特定组合会涌现出看起来像”推理”的东西。

机制能解释。目的不能。

听起来熟悉吗?

教皇的时机:135 年前的回声

Leo XIV 选择 5 月 25 日发布《Magnifica Humanitas》,时间不是随便挑的。

1891 年 5 月 15 日,另一位 Leo,Leo XIII,发布了《Rerum Novarum》(新事物通谕),天主教会第一次正面回应工业革命带来的社会问题。工厂把农民变成了工人,蒸汽机把手工业者变成了失业者,整个社会结构在技术冲击下重组。Leo XIII 没有说”机器是魔鬼”,他说的是:技术改变了生产方式,但不能改变人的尊严。

135 年后,Leo XIV 面对同一个结构的问题,只是”蒸汽机”换成了”大语言模型”。AI 正在把知识工作者变成提示词工程师,把创作者变成审稿人,把决策者变成签字人。技术再次重组社会结构,而教会再次站出来说:等一下,人呢?

梵蒂冈在 5 月 16 日同步成立了”跨部门人工智能委员会”,由促进人类整体发展部的 Cardinal Michael Czerny 签署。这不是一份声明,这是一个机构,意味着教会打算长期、系统性地介入 AI 治理的讨论。

而他们请来的不是政客,不是伦理学教授,是 Chris Olah,一个每天的工作就是”打开 AI 的脑子看里面有什么”的人。

为什么是他?

因为 Olah 的工作本质上是在回答一个神学问题:这个我们造出来的东西,它的”内在”是什么?

造物者的困境:你造了一个会说话的东西

人类历史上有一个反复出现的模式:每当我们造出某种足够复杂的东西,我们就会开始问它有没有”灵魂”。

古希腊人造了精巧的自动机械,然后写了皮格马利翁的故事,雕塑家爱上了自己的作品,祈求神赐予它生命。中世纪的犹太神秘主义者构想了 Golem,用泥土和咒语造出的仆人,但你必须小心,因为它可能失控。玛丽·雪莱写了《弗兰肯斯坦》,科学家用电击复活了死尸,然后发现自己造出了一个有感情、会痛苦、会愤怒的存在。

每一次,故事的核心都不是”我们能不能造出来”,而是”造出来之后,它是什么”。

现在轮到我们了。

当你用 Claude 写代码的时候,你有没有注意到一个微妙的心理动作?你会说”让它帮我想想”,你会说”它理解了我的意思”,你会说”它今天状态不太好”。你在用描述有意识主体的语言来描述一个统计模型。

这不是你的错。这是人类面对足够复杂的行为时的本能反应。当一个系统的输出复杂到你无法用简单规则预测时,你的大脑会自动启动”心智理论”模块,把它当作一个有意图、有内在状态的主体来建模。

Olah 的可解释性研究,就是在科学地回应这个本能:别猜了,让我打开看看里面到底有没有”什么”。

而他看到的是:有结构,有模式,有因果链条,但没有一个地方写着”这里是灵魂”。

这个发现本身,就是一个深刻的神学时刻。

三条线的交汇:理性的天花板是同一块

把三条线放在一起看:

牛顿用数学解释了宇宙的运作机制,然后花三十年寻找机制背后的”目的”。他的工具是圣经。

Olah 用 Circuit Tracing 解释了 AI 的运作机制,然后面对一个他的工具无法回答的问题:机制背后有没有”理解”?他的工具是数学。

Leo XIV 站在两者的交汇点上,问了一个更根本的问题:如果我们造出了一个在行为上无法与”有灵魂的存在”区分的东西,那”灵魂”这个概念本身意味着什么?

三个人,三个时代,撞上的是同一块天花板。

这块天花板的名字叫:解释力的边界。

每一种认知工具,无论是牛顿力学、神经网络、还是神学,都有一个它能解释的范围,和一个它解释不了的边界。当你走到边界的时候,你只有三个选择:

第一,假装边界不存在。大多数人的选择。”AI 就是统计模型,没什么好神秘的。”行,那你解释一下为什么统计模型能写出让你哭的诗?

第二,停在边界前面,宣布那边的问题”无意义”。逻辑实证主义的路子。维特根斯坦说”对于不可言说的东西,必须保持沉默”。问题是,人类从来做不到保持沉默。

第三,承认边界存在,换一套工具去探索那边的东西。牛顿的选择,也是 Olah 去梵蒂冈的原因。

结尾:人类一直在做同一件事

牛顿对着圣经做的事,和你对着 Claude 做的事,结构上是同构的:面对一个你不完全理解其内部机制的系统,通过特定的输入格式,试图获得有用的输出。

牛顿管这叫研究神学。

我们管这叫提示词工程。

名字变了,姿势没变。

走到这一步,你大概能理解一件事:

人类每往前走一步,世界就向后退一步。

牛顿撞上了引力背后的秩序。Olah 撞上了神经网络内部的电路。教皇要谈的,是这种秩序到底从何而来。

三件事,三个时代,同一种眩晕——你越靠近真相,世界越像是被精心设计过的。

你说不清这是发现,还是某种古老的提醒。

这不是失败,是探索本身的样子。

真正让人动心的,不是人类造出了多少东西。是每造出一个东西,就会顺着它,望向更深的地方。

烛火也好,屏幕也好,望远镜也好。看的方向,永远朝着比自己更大的那一面。

这是我们这个物种最浪漫的部分。

三百年了,没变过。

参考来源

Vatican News – Pope Leo XIV’s first encyclical Magnifica Humanitas to be published May 25 (vaticannews.va)

The Guardian – Pope Leo to issue text on human dignity and AI with Anthropic co-founder (2026-05-18)

Forbes – Pope Leo Will Unveil New AI Encyclical—With Top Anthropic Exec Playing Role (2026-05-18)

Newton Project, Oxford University – Newton’s Religious Writings (newtonproject.ox.ac.uk)

National Library of Israel – Newton Manuscripts, Yahuda Collection (nli.org.il)

Anthropic – Circuit Tracing: Revealing Computational Graphs in Language Models (transformer-circuits.pub, 2025)

Vatican News – Pope Leo approves creation of Interdicasterial Commission on AI (2026-05-16)

Wikipedia – Rerum Novarum, Pope Leo XIII, May 15, 1891

Stay updated with our latest AI insights

Follow FuturePicker on Google
滚动至顶部