[!info] 这是什么
WebMCP API 是一个新的 JavaScript 接口,允许 Web 开发人员将其 Web 应用程序功能公开为“工具”——具有自然语言描述和结构化模式的 JavaScript 函数,可以由代理、浏览器代理和辅助技术调用。使用 WebMCP 的网页可以被视为模型上下文协议 [MCP] 服务器,它在客户端脚本而不是后端实现工具。 WebMCP 支持协作工作流程,用户和代理在同一 Web 界面中协同工作,利用现有应用程序逻辑,同时维护共享上下文和用户控制。
这是专门给 AI 读取网页的 MCP…
传统的 AI 与网站互动非常依赖“模拟人类行为”:AI 看截图、尝试识别按钮、模仿点击等操作,这种方式既慢又容易出错。
WebMCP 的目标是改变这种模式,让网站开发者明确告诉 AI 代理页面上可用的“动作(tools)”以及它们的输入/输出结构,AI 就可以像调用函数一样调用这些动作。这样 AI 不需要猜按钮位于何处,而是直接调用逻辑上的操作接口。
WebMCP 的一些核心特点包括:
- 网站可以通过 JavaScript 或 HTML 声明在页面上可被 AI 调用的操作(例如提交订单、搜索内容等)。这些操作有结构化的定义(JSON schema),让 AI 知道该怎么用。
- AI 代理可以发现页面上可用的工具,并利用这些工具执行复杂任务,而不靠模拟点击或 DOM 抓取。
- 这个协议通常利用浏览器原生的 API(比如
navigator.modelContext)来实现,让网站前端本身就能充当一个“MCP 服务器”,将功能暴露给客户端 AI。 - 目前 WebMCP 规范仍在发展中,被 W3C Web Machine Learning 社区等组织孵化,但已经在 Chrome 的早期版本中可以体验到。