WebAct MCP 服务端
使用说明(Markdown 格式)
-
项目简介
- WebAct MCP 服务端是一个基于 MCP(Model Context Protocol)的后端实现,负责接收 MCP 客户端的请求,提供初始化、工具列表查询和工具调用等核心能力。核心目标是以标准化的 JSON-RPC 方式向 LLM 客户端暴露浏览器自动化能力、数据读取和外部功能调用等能力,并在服务端负责会话与资源管理。
-
主要功能点
- MCP 初始化与能力声明:客户端首次连接时,返回协议版本、服务器信息与能力信息。
- 工具列表与调用:提供已注册的工具清单,客户端可通过工具名调用对应的命令;调用过程会自动与后端的浏览器控制会话进行交互。
- 自动化执行与会话管理:服务端会启动并维护浏览器实例(Chromium/CDP),实现多会话并发控制、错误处理与资源管理。
- 客户端可扩展性:工具清单来自仓库中的工具定义,支持通过工具调用执行浏览器操作、读取页面信息、执行复杂交互等。
- 安全与稳定性:服务端对多客户端并发访问进行隔离,提供错误返回和回滚逻辑,便于上层 LLM 客户端进行容错处理。
-
安装步骤
- 需要环境
- Node.js 18.x 及以上(用于运行 MCP 服务器)
- 获取与构建
- 克隆仓库并安装依赖
- 运行打包构建(如需要把源码打包成可执行文件,以提升部署灵活性)
- 启动服务器
- 按文档中的方式使用 MCP 客户端配置,启动 WebAct 的 MCP 服务端
- 服务端将通过 MCP 协议接收来自客户端的请求并触发对应的浏览器自动化操作
- 需要环境
-
服务器配置(MCP 客户端需要的配置信息示例,客户端无需关心具体实现,只需按此格式提供即可)
- server_name: webact
- command: webact-mcp
- args: 为空数组或需要的启动参数
- 注释说明:该配置用于 MCP 客户端连接到后端服务器,客户端通过该配置项指定如何启动和连接 MCP 服务端。服务器端的实际实现会在首次接入时进行必要的初始化与会话建立。
-
基本使用方法
- 第一次连接时,发送 initialize 请求,获取服务器协议版本和能力信息。
- 请求工具列表(tools/list),获取当前可用的工具集合。
- 通过工具调用(tools/call)触发具体工具的执行,例如启动浏览器会话、导航、读取页面结构、执行点击/输入等操作。
- 服务端会返回标准化的响应,客户端据此对后续步骤进行规划与决策。
- 如需自行扩展工具,修改或新增 tools.json 中的工具定义,MCP 客户端即可通过工具调用访问新工具。