去年冬天,我的一个朋友做了一件很纠结的事。
他是个独立开发者,每天要跟 AI 对话几十次——写代码、改 bug、讨论架构。他同时开着 Claude 和 ChatGPT 的付费订阅,每个月花 40 美元。有一天他跟我说:”我想砍掉一个,但砍哪个都不对。”
Claude 写代码靠谱,逻辑清晰,而且有一种奇怪的”搭档感”——它会在你犯错的时候直接说”这样不好”,而不是一味附和。但 20 美元一个月只能用有限次数,他一天就能用完。
ChatGPT 什么都能干,用量几乎不限,但用久了他觉得”没意思”。”就像跟一个很能干但完全没有性格的人共事,”他说,”活干完了,但过程很无聊。”
他最后的选择是:工作时间用 Claude,下班后用 ChatGPT 处理杂事。两个都没砍。
这个故事让我开始想一个问题:为什么 2026 年了,我们还是找不到一个”完美”的 AI?
三个你全都想要的东西
如果你把用户对 AI 的期望拆开来看,其实就三样东西:能力强、性格好、价格便宜。
听起来不过分对吧?一个聪明的、有个性的、还不贵的 AI——这要求很高吗?
很高。
事实上,2026 年市面上没有任何一个产品能同时满足这三个条件。不是因为哪家公司不够努力,而是因为这三样东西之间存在根本的物理冲突。就像你不可能造出一辆又快、又省油、又便宜的车一样——工程学有它的边界。
让我一条一条解释为什么。
能力和性格:一场永远打不完的仗
Anthropic 内部有一个专门的团队,他们的工作不是让 Claude 更聪明,而是让 Claude “更像 Claude”。
这听起来很奇怪。一个 AI 公司,花大量资源研究模型的”性格”?
但如果你理解训练过程,就会明白这件事为什么困难。
训练能力的目标是”正确率”——给一道数学题,答对就加分。训练性格的目标是”一致性”——在不同场景下表现出稳定的行为模式。问题在于,这两个目标经常打架。
举个例子。为了提升推理能力,你需要让模型学会”展开思考”——把中间步骤写出来。但这会让模型变得啰嗦。用户会觉得”它怎么话这么多”。于是你又要训练它”简洁”。但简洁了之后,推理能力又下降了。
你拉起一头,另一头就掉下去。
GPT 系列的演变就是这个困境的缩影。从 GPT-4 到 GPT-5,benchmark 分数一路上升,但用户社区里”它越来越没个性”的吐槽也越来越多。OpenAI 选择了能力优先——先把活干好,性格的事以后再说。
Anthropic 做了相反的选择。Claude 的 benchmark 分数从来不是最高的,但它在用户满意度调查中始终排名靠前。因为 Anthropic 宁可牺牲一些能力分数,也要保持 Claude 那种”礼貌但不谄媚、直接但不粗暴”的性格一致性。
这不是产品策略的差异。这是物理约束下的取舍。你优化一个,另一个就会漂移。
能力和价格:算力不会说谎
这条边更容易理解,因为它是纯粹的物理约束。
训练一个顶级大模型要花多少钱?2026 年的答案是:超过 10 亿美元。推理一次顶级模型的成本是轻量模型的几十倍甚至上百倍。这些钱最终要从用户那里收回来。
所以你看到了市场上的分层:旗舰模型贵,轻量模型便宜。轻量模型是旗舰模型的”蒸馏版”——用小模型去模仿大模型的行为。蒸馏过程必然丢失信息,就像把一本 500 页的书压缩成 50 页的摘要,大部分内容还在,但细节和深度没了。
Google 的 Gemini Flash 就是典型案例。它便宜 20 倍,简单任务上能达到 Pro 版 90% 的效果。但一旦遇到需要多步推理的复杂问题,差距就暴露了——不是差一点,是断崖式下跌。
便宜的 AI 不是”不想聪明”,是物理上做不到。算力成本是硬约束,没有魔法能绕过去。
性格和价格:最容易被忽视的一条边
训练一个模型的”性格”,成本远比大多数人想象的高。
Anthropic 的 Claude Character 研究团队透露,Claude 的性格训练迭代了多轮。每一轮都需要:大量标注员阅读对话记录并评估”性格一致性”;研究员手动审查大量 transcript,感知细微的性格漂移;然后调整训练参数,重新跑一轮。
这个过程不是一次性投入——性格需要持续维护。用户反馈会改变模型行为,新的训练数据会引入新的性格倾向,每一代模型都需要重新校准。就像养一个孩子,你不能在 5 岁的时候”设定好性格”然后就不管了。
这就是为什么开源模型”没性格”。Llama、Mistral 能力不错,但用起来感觉平淡。不是它们不想有性格,是开源社区没有资源做这种持续的、昂贵的性格训练。
性格是奢侈品。只有烧得起钱的公司才能提供。而烧了钱,就不可能便宜。
三种选择,三种人生
理解了这个三角形,你就能看懂 2026 年 AI 市场的格局——不是谁好谁坏,而是每家公司选了不同的两个顶点。
Anthropic 选了能力加性格。Claude 是那种”用了就回不去”的产品,但你的钱包会提醒你它不便宜。适合专业用户——开发者、研究员、写作者——这些人愿意为”搭档感”付费。
OpenAI 选了能力加价格。ChatGPT 是生产力工具的极致——什么都能干,而且相对便宜。但用久了你会觉得在跟一台机器对话,没有温度。适合高频用户——每天用几十次,只要结果不要过程。
Character.AI 选了性格加价格。它能给你一个完美的虚拟朋友,但你别指望它帮你写代码或做研究。适合寻求陪伴的人——对能力没要求,只想要一个”懂我”的存在。
没有谁选错了。只是每个人需要的东西不一样。
这个三角形会被打破吗?
也许会。但不是今天。
有几个可能的方向:算力成本持续下降;性格训练的自动化程度提高,减少人工标注依赖;或者出现全新的架构,让能力和性格不再冲突。
但在那一天到来之前,你需要做一个选择。
我那个朋友最后想通了一件事。他说:”我不再纠结了。Claude 是我的搭档,ChatGPT 是我的工具。它们不是竞争关系,是互补关系。”
也许这就是 2026 年使用 AI 的正确姿势:不是找到那个完美的”唯一”,而是学会在不完美中组合出最优解。
就像你不会用同一把刀切面包和砍柴一样。



