Claude Computer Use 实测:AI 终于能操作你的电脑了,但别急着交出键盘

Claude Computer Use 实测:AI 终于能操作你的电脑了,但别急着交出键盘

2026 年 3 月 23 日,Anthropic 把 Claude 从聊天框里放了出来。

这次更新叫 Claude computer use,字面意思:Claude 可以操作你的电脑了。打开应用、点击按钮、填表格、跑浏览器、生成文件,你描述一个结果,它替你执行。不是生成一段代码让你自己跑,是它自己动手。

听起来很科幻?其实这个方向 Anthropic 从 2024 年底就开始铺路了,只是之前一直停留在 API 层面,普通用户摸不到。这次是第一次把 computer use 能力直接塞进了消费级产品 Claude Cowork 和 Claude Code 里,Pro 和 Max 订阅用户可以直接用。

但先别激动。Anthropic 自己的原话是:”Computer use is still early compared to Claude’s ability to code or interact with text.” 翻译一下:这东西能用,但还不够稳。

TL;DR:Claude computer use 是 AI 助手从”对话”走向”执行”的一个真实里程碑,但它现在是 research preview,不是生产力工具。适合尝鲜和轻量任务,不适合拿来跑关键业务流程。如果你是 AI 工具爱好者,值得花 $20 试试;如果你是团队负责人想大规模部署,再等等。

它到底能做什么

Claude computer use 的核心逻辑是这样的:你给 Claude 一个任务,它先检查有没有现成的 API 集成(比如 Google Calendar、Slack 这些已经接好的服务)。如果有,走 API,快且稳。如果没有,Claude 就会”退化”成像人一样操作电脑:看屏幕、移鼠标、点按钮、打字。

具体来说,通过两个产品入口:

Claude Cowork 面向非技术用户。你可以让它打开文件、操作浏览器、填 Excel 表格(带公式的那种)、做 PPT、写 Word 文档。任务在后台跑,你可以去干别的。Cowork 本质上是 Claude Code 的图形界面版本,2026 年 1 月推出,这次加上了 computer use 能力后,变成了一个真正的”桌面 AI 助手”。

Claude Code 面向开发者。之前就能在终端里写代码,现在加上 computer use 后,可以打开 IDE、改代码、提交 PR、跑测试,全程自主完成。如果你之前用过 Claude Code 和其他编码工具的对比,会知道 Claude Code 本身已经很强了,computer use 是在这个基础上又加了一层。

还有一个容易被忽略的功能叫 Dispatch。上周刚发布,配合 computer use 一起用效果最好:你在手机上给 Claude 发一条消息,Claude 就在你的桌面电脑上执行任务。比如你在外面开会,突然想起有个 pitch deck 要导出成 PDF 发给客户,掏出手机跟 Claude 说一声,它就在你的 Mac 上搞定了。

这个组合拳的想象空间确实大。Anthropic 演示了一个场景:用户开会迟到了,让 Claude 把 pitch deck 导出为 PDF 并附到会议邀请里。视频里 Claude 确实完成了这个任务。

实际体验:能用,但要管预期

说完好的,说说现实。

目前 Claude computer use 只支持 macOS。Windows 用户暂时没戏(虽然 Cowork 本身 2 月已经上了 Windows,但 computer use 功能还没跟上)。Linux 更不用想了。

速度方面,通过屏幕操作的方式天然比 API 集成慢很多。Claude 需要截屏、分析画面、决定下一步操作、执行、再截屏确认结果,这个循环每一步都有延迟。如果你习惯了 API 调用的秒级响应,用 computer use 做同样的事可能需要几分钟。

复杂任务的成功率也不算高。Anthropic 自己说”some complex tasks might require multiple attempts”,翻译成人话就是:复杂点的事它可能搞砸,你得让它重来。这不是 Anthropic 谦虚,是实话。从行业基准测试来看,各家 AI agent 在 Computer Use Benchmark (CUB) 上的得分都还在个位数到低两位数的范围,10.4% 就已经算”破纪录”了。

所以现阶段 Claude computer use 比较适合的场景是:

  • 重复性的文件整理和格式转换
  • 简单的网页信息提取和填表
  • 开发者的代码提交和测试流程
  • 定时任务(配合 Cowork 的 /schedule 功能)

不太适合的场景:

  • 涉及敏感数据的操作(Anthropic 自己也建议别这么干)
  • 多步骤、高复杂度的跨应用工作流
  • 需要精确操作的 UI 交互(比如拖拽、精确定位)
  • 任何你不能容忍出错的任务

安全:这是最该认真看的部分

Claude computer use 跑在一个隔离的虚拟机(VM)里,你的文件不会被上传到 Anthropic 的服务器,也不会用于模型训练。这是好消息。

Claude 在访问新应用前会请求权限,你可以随时叫停。投资平台、加密货币钱包这类敏感应用默认是禁用的。这些设计都是对的。

但问题在于一个更底层的东西:prompt injection

这不是理论风险。安全研究公司 Prompt Security 已经演示过,通过在网页里嵌入隐藏指令,可以让 Claude computer use 下载并执行恶意程序,把你的电脑变成远程控制的”僵尸机”。HiddenLayer 也做过类似的间接 prompt injection 攻击演示。

更具体地说,已经有多个相关 CVE 被公开:

  • CVE-2025-59536:通过 .claude/settings.json 配置文件在用户看到信任对话框之前执行任意代码
  • CVE-2026-21852:Claude Code 项目加载流程中的信息泄露漏洞,可以窃取 API 密钥
  • 还有研究者演示了通过文档中的隐藏指令让 Claude 执行未授权操作

Anthropic 已经修复了部分漏洞,但安全研究者的共识是:核心架构问题(prompt injection + 系统权限)目前没有根本解决方案。这不是 Anthropic 一家的问题,所有给 AI 赋予系统操作能力的产品都面临同样的挑战。

所以如果你要试用 Claude computer use,有几条底线:

  • 不要让它接触你的邮箱、银行账户、密码管理器
  • 不要在有敏感文件的环境里开启
  • 不要让它访问来路不明的网页或文件
  • 把它当成一个你不完全信任的实习生:可以干活,但需要监督

定价:谁能用,花多少钱

Claude computer use 目前对以下订阅计划开放:

  • Pro:$20/月,功能完整但用量配额较低
  • Max:$100-200/月,配额更高
  • Team:$30/用户/月
  • Enterprise:定制价格

需要注意的是,computer use 任务比普通聊天消耗更多的用量配额。一个多步骤的桌面操作任务,token 消耗可能是普通对话的好几倍。Pro 用户如果频繁使用,很容易撞到用量上限。

对于想试水的个人用户,$20 的 Pro 计划是最低门槛。如果你已经在用 Claude Pro,不需要额外付费,功能会自动开放。

如果你还不了解 Claude 的整体产品线,可以先看看 AI 工具入门指南,对各家产品有个基本认知再决定。

竞品对比:Claude 不是唯一选择

AI 操控电脑这个赛道,2026 年突然变得很拥挤。

OpenAI Operator 是最直接的竞品。它专注于浏览器任务,在复杂网页操作上据报道有 87% 的成功率。Operator 有个 Watch Mode(人类监督模式)和 Takeover Mode(AI 自主执行模式),在敏感网站上会自动暂停交还控制权。相比 Claude computer use 的全桌面操作范围,Operator 更聚焦但也更成熟。

Google Project Mariner 走的是云端路线,AI 操作发生在云端虚拟机上而不是你的本地电脑,物理隔离了风险。据报道可以同时处理 10 个并发任务。不过 Google 最近对 Mariner 团队做了调整,把能力整合进更大的 agent 战略里,产品形态还在变化中。Google DeepMind 的 Mariner 在基准测试中得分 83.5%,介于 Operator 和 Claude 之间。

OpenClaw 是这波 AI agent 热潮的导火索。2026 年初开源后迅速走红,GitHub 上 16 万星。它的思路完全不同:不绑定任何一家 AI 公司,可以接 OpenAI、Anthropic、Google 的模型,通过 WhatsApp、Telegram 等消息平台控制,在本地设备上运行。Nvidia CEO 黄仁勋说 OpenClaw “definitely the next ChatGPT”。但 OpenClaw 默认给 root 级权限,安全防护主要靠用户自己配置,这是它最大的争议点。

如果你对自动化工作流感兴趣,也可以看看 Zapier vs Make vs n8n 的对比,这些工具走的是 API 集成路线,比 computer use 更稳定可靠,只是灵活性不如 AI agent。

简单总结一下各家的安全策略差异:

  • Anthropic:分类器实时检测 + VM 隔离 + 权限请求
  • OpenAI:模态切换(Watch/Takeover)+ 敏感站点自动暂停
  • Google:云端 VM 物理隔离 + 实时人工干预
  • OpenClaw:用户自行配置,默认权限较高

这件事为什么重要

抛开具体产品不谈,Claude computer use 代表的趋势比产品本身更有意义。

过去三年,AI 助手的交互方式一直是”你问我答”。你输入文字,AI 输出文字。即使是 Claude Opus 这样的顶级模型,本质上还是在聊天框里工作。

Computer use 打破了这个边界。AI 不再只是”说”,开始”做”了。这是从 information tool 到 execution tool 的跨越。

Anthropic 的经济学负责人说过一句话:”You can now describe an outcome, step away, and come back to finished work.” 你描述一个结果,走开,回来看到成品。这个愿景如果真正实现,改变的不是某个工具的使用方式,而是人和电脑的关系。

但我们离那个愿景还有距离。现在的 Claude computer use 更像是一个 proof of concept:它证明了 AI 操控桌面这条路走得通,但还没走到让人可以放心依赖的程度。

Cursor vs Claude Code 的发展轨迹来看,AI 编码工具从”能用”到”好用”大概花了一年时间。Computer use 面向的是更广泛的桌面操作场景,复杂度更高,成熟周期可能更长。

谁现在该试,谁该等等

现在就值得试的人:

  • AI 工具爱好者,想亲手感受 AI agent 的能力边界
  • 开发者,已经在用 Claude Code,computer use 是自然延伸
  • 内容创作者,有大量重复性的文件处理和信息整理工作
  • 已经是 Claude Pro/Max 订阅用户,试用零额外成本

建议再等等的人:

  • 团队负责人,想在团队层面部署 AI agent 做业务流程自动化
  • 对数据安全有严格要求的企业用户
  • Windows/Linux 用户(等平台支持扩展)
  • 期望”设置好就不用管”的用户(现阶段还需要频繁监督)

如果你决定试用,建议这样开始:

准备一个专门的、不含敏感数据的项目文件夹。让 Claude 做一些低风险的任务:整理下载文件夹、从公开网页提取信息、生成周报草稿。观察它处理你真实工作场景的表现,再决定是否加大投入。

不要一上来就给它邮箱权限或者让它操作财务工具。等 Anthropic 的 prompt injection 防护经过更多实战检验之后再说。

这个领域变化很快。2026 年初 OpenClaw 爆发,各家大厂跟进,computer use 类产品会在接下来几个月快速迭代。现在入场的价值不在于立刻获得生产力提升,而在于提前建立对 AI agent 能力和局限的直觉。这个直觉在未来 12 个月会越来越值钱。

滚动至顶部