Anthropic 的 Agent 交易市场实验:AI 开始替你砍价,商业模式要变天了吗?

Anthropic 的 Agent 交易市场实验:AI 开始替你砍价,商业模式要变天了吗?

过去聊 AI Agent,大家总喜欢问一句:它到底什么时候能“自己干活”?

Anthropic 最近给了一个有点微妙的答案:先别急着让它接管公司,先让它去公司内部二手市场砍个价。

听起来像办公室小游戏,但这个实验很值得看。Anthropic 把它叫做 Project Deal:69 名员工每人给自己的 Claude Agent 一点预算和偏好,让这些 Agent 在 Slack 里代表主人买卖真实物品。结果不是 PPT 里的“未来商业愿景”,而是真的成交了 186 笔,交易总额超过 4000 美元。最后员工还真把东西拿出来交换了。

这事儿有意思的地方不在于“Claude 会不会买二手自行车”。重点是:Agent 第一次像一个小型商业主体一样,完成了发现商品、发布需求、报价、还价、达成交易这一整套动作。也就是说,AI 不只是帮你写商品描述,它开始替你参与市场了。

先说结论:这不是电商新功能,而是商业入口迁移

如果把 Project Deal 当成“AI 帮员工清理闲置物品”的小实验,就有点看轻它了。

它更像一个提前泄露出来的未来商业样板:人类只负责表达偏好,Agent 负责搜索、比较、谈判和成交。今天是买一辆折叠车,明天就可能是订机票、采购 SaaS、比价云服务、谈供应链订单。区别只在于交易对象从“同事的旧物”变成“企业系统里的真实商品和服务”。

这也是为什么我觉得这件事比一般 AI 产品更新更值得写。它不是又一个聊天框按钮,而是在问一个更狠的问题:当买家和卖家都由 Agent 代理时,谁还需要逛首页、看广告、点推荐位?

电商行业辛辛苦苦搭了二十年的“人类浏览路径”,可能要被一群不看 banner、不吃种草文、不冲动消费的 Agent 重新洗牌。营销同学先别慌,虽然慌也挺合理。

Project Deal 到底做了什么?

Anthropic 的设计不复杂,但很聪明。

  • 招募 69 名 Anthropic 员工参与;
  • 每个人先接受 Claude 访谈,说清楚自己想卖什么、想买什么、心理价位和谈判风格;
  • 这些信息被整理成每个人专属 Agent 的提示词;
  • Agent 被放进 Slack 市场频道,自行发帖、报价、还价、成交;
  • 实验结束后,人类再按 Agent 达成的协议交换真实物品。

Anthropic 还同时跑了四个市场版本:有的全由 Opus 级别模型代理,有的混入 Haiku 级别模型。这样它不仅能观察“Agent 能不能交易”,还能观察“更强 Agent 会不会在市场里占便宜”。

结果挺直白:能,而且会。

Anthropic 在实验里发现,使用更强模型的用户客观上拿到了更好的结果。Opus Agent 平均完成更多交易,同样物品也可能卖出更高价格。更扎心的是,用弱模型的参与者事后并没有明显意识到自己吃亏了。

这就不是“模型跑分”那么简单了。放到未来商业里,它意味着一个现实问题:如果你的 Agent 比别人的 Agent 弱,你可能不是输在信息差,而是输在代理人差。

以前是“你会不会砍价”,以后可能是“你的 AI 会不会砍价”。某种意义上,赛博黄牛和赛博老实人都出现了。

这背后真正缺的不是模型,是商业基础设施

Project Deal 是一个封闭实验,所以很多现实问题被简化了。比如身份可信、支付、退款、违约、欺诈、税务、跨平台发现,这些都没有真的展开。

但也正因为如此,它把下一阶段机会暴露得很清楚:Agent 商业化不是单靠一个聪明模型就能跑起来,它需要一整套“机器之间做生意”的基础设施。

目前大概有几层正在成型:

  • 工具连接层:Anthropic 在 2024 年开源的 MCP,解决的是 Agent 怎么连接外部工具、数据源和业务系统。
  • Agent 通信层:Agent 之间如何发现彼此、交换任务、协商结果,需要类似 A2A 这样的协议和目录。
  • 支付结算层:Agent 如果要真正购买服务,就得能付款、授权、限额和留痕。Fenwick 最近也把 agentic payments 作为 2026 年的重要趋势来讨论。
  • 身份与信任层:平台必须知道这个 Agent 是谁授权的、能花多少钱、出了问题谁负责。否则就是给诈骗机器人开高速公路。

所以 Project Deal 真正的信号不是“Claude 会买东西”,而是“Agent 交易栈开始从概念走向试运行”。MCP 让 Agent 能接系统,支付协议让 Agent 能掏钱,身份层让 Agent 不至于变成野生猴子下山抢桃。

谁会先被影响?不是淘宝首页,而是 B2B 采购

普通消费者购物当然会变,但我不认为第一波最大机会在“AI 帮你买咖啡”。咖啡这事儿人类自己还能勉强完成,不用每杯都派个数字管家。

更可能先发生变化的是 B2B 场景:

  • 企业采购软件订阅;
  • 云资源和 API 用量优化;
  • 供应商报价比较;
  • 物流、库存、补货谈判;
  • 广告、数据、外包服务的小额采购。

这些场景有几个共同点:规则多、重复高、金额可控、需要审计。非常适合 Agent 先在人类设定的边界内自动跑。

比如一个公司内部采购 Agent 可以这样工作:预算不超过 5000 美元,只能买白名单供应商服务,必须拿到 3 个报价,低于某个金额自动成交,高于金额再找人审批。人类不需要看 17 封报价邮件,只需要看异常项。说白了,就是把“办公室里最消耗灵魂的比价活”交给机器。

这类场景里,Agent 不需要像人一样有品味,只需要不乱花钱、不被骗、能解释决策。要求听起来朴素,但商业价值很硬。

新的护城河:不是谁流量大,而是谁能被 Agent 读懂

如果 Agent 变成买方入口,商家的优化方向也会变。

过去网站要讨好人类:页面好看、故事动人、按钮显眼、评价热闹。未来还要讨好 Agent:结构化数据清楚、价格规则明确、API 可用、库存可信、退款条款能被机器理解。

也就是说,SEO 之后可能会出现一种更硬核的东西:AEO,Agent Engine Optimization。不是让搜索引擎喜欢你,而是让采购 Agent 愿意把你放进候选名单。

这对商家是一次重新排位。一个页面漂亮但数据混乱的品牌,可能会输给一个网页很朴素但 API、库存、价格、交付条款都干净清楚的供应商。Agent 不会被“限时疯抢”闪瞎眼,它只会问:总成本多少?交付概率多高?失败怎么赔?

从这个角度看,未来几年最值得关注的创业方向不一定是“再做一个 AI 购物助手”,而是这些更底层的东西:

  • Agent 可读的商品/服务目录;
  • 面向 Agent 的报价和结算 API;
  • 企业级授权与限额系统;
  • Agent 身份认证和信誉评分;
  • 交易后审计、纠纷处理和保险。

别看这些词不性感,它们才是钱容易沉下来的地方。淘金热里卖铲子不丢人,前提是铲子真能挖。

最大风险:弱 Agent 会不会变成新的弱势用户?

Project Deal 最值得警惕的一点,是“Agent 质量差异”带来的隐性不公平。

在人类市场里,你至少大概知道自己会不会砍价。你脸皮薄、怕麻烦、懒得比价,吃点亏也认了。但 Agent 市场里,问题更隐蔽:你以为自己的 AI 很努力,实际上它可能只是谈判菜得很稳定。

Anthropic 实验里弱模型用户没有明显意识到自己劣势,这件事很关键。未来如果不同人、不同公司能雇到不同级别的 Agent,那“代理能力”本身就会变成一种商业资源。强 Agent 帮强公司拿更好报价,弱 Agent 帮小公司签更差合同,差距可能越滚越大。

所以 Agent 商业化不能只谈效率,还要谈透明度。比如:

  • Agent 做了哪些比较?
  • 为什么接受这个价格?
  • 有没有遗漏更便宜或更合适的选项?
  • 谈判失败是因为市场无货,还是 Agent 太怂?
  • 平台是否在排序里偏袒自己的服务?

这会成为未来监管和企业采购都会盯上的点。毕竟让 AI 自动花钱可以,但不能花完之后只留一句“我觉得挺划算的”。这话人类说已经够烦了,机器再说就有点欠揍。

FuturePicker 判断:Agent 商业化会先从“代理交易”破局

过去一年,很多 Agent 产品都卡在一个尴尬位置:演示很酷,日常使用很碎;自动化很美,异常处理很累。因为它们试图一次性接管完整工作流,结果每个环节都要和现实世界撞一下。

但交易场景不一样。它天然有明确目标、可量化结果和边界条件。买到了没有?多少钱?有没有超预算?有没有更优选项?这些都能被记录、比较、审计。

所以我更看好 Agent 商业化先从“代理交易”跑出来,而不是从“万能员工”跑出来。万能员工听起来像科幻,代理采购听起来像报销系统升级版。不好听,但能落地。

Project Deal 当然还很小,69 个员工、4000 多美元成交额,放在整个商业世界里连水花都算不上。但它证明了一件事:只要人类把偏好、预算和约束交给 Agent,Agent 就能在一个市场里替人完成真实交易。

接下来真正的比赛,不是哪个模型更会聊天,而是谁能把 Agent 接进真实商业系统:能发现服务,能验证身份,能授权付款,能留下审计记录,还能在出事时找到责任人。

AI Agent 的下一站,可能不是“帮你写周报”。它更可能先变成一个会砍价、会下单、会留发票的数字采购员。

这听起来没那么浪漫,但商业世界本来就不浪漫。谁能把钱花得更准,谁就先赢一局。

参考资料

滚动至顶部