浏览器与电脑操作 Agent:2026 能用了吗

2026 年 5 月 4 日,Google 把 Project Mariner 关了。 这件事值得停下来想一秒。Mariner 是 Google 自己在 2024 年底高调推出的浏览器 Agent 原型,能同时跑 10 个任务,在 WebVoyager 这个网页任务基准上拿到 83.5%。听起来很能打。结果一年半后,它没有变成一个产品,而是被"折叠"进了 Gemini 和 Chrome 的功能里——换句话说,作为一个独立的、你可以信任它去完成任务的东西,它没活下来。 这不是 Google 一家的故事。OpenAI 也把独立的 Operator 站点下线,塞回了 ChatGPT 的 “agent mode”。整个行业在 2025 到 2026 年发生的事情,不是"浏览器 Agent 成熟了",而是"大家发现它没法单独卖,只能当一个嵌入式功能"。 那它到底能不能用?能,但你得非常清楚它能做什么、不能做什么。这篇就来拆。 先看分数:基准上的真实水平 行业里衡量电脑操作 Agent 主要看两类基准:OSWorld(完整桌面环境,操作系统级别的多步任务)和 WebVoyager / WebArena(纯网页任务)。 产品 / 模型 OSWorld(桌面) 网页任务 备注 Anthropic Claude Computer Use 72.5% — 2026 年 3 月研究预览 OpenAI CUA / Operator 32.6%–38.1% WebVoyager 87% / WebArena 58% 桌面分数有争议 Google Project Mariner — WebVoyager 83.5% 已于 5 月停为独立产品 两个事实摆在这里。 ...

2026-05-15 · 3 min · Chico