WebAct MCP 服务端

使用说明(Markdown 格式)

  • 项目简介

    • WebAct MCP 服务端是一个基于 MCP(Model Context Protocol)的后端实现,负责接收 MCP 客户端的请求,提供初始化、工具列表查询和工具调用等核心能力。核心目标是以标准化的 JSON-RPC 方式向 LLM 客户端暴露浏览器自动化能力、数据读取和外部功能调用等能力,并在服务端负责会话与资源管理。
  • 主要功能点

    • MCP 初始化与能力声明:客户端首次连接时,返回协议版本、服务器信息与能力信息。
    • 工具列表与调用:提供已注册的工具清单,客户端可通过工具名调用对应的命令;调用过程会自动与后端的浏览器控制会话进行交互。
    • 自动化执行与会话管理:服务端会启动并维护浏览器实例(Chromium/CDP),实现多会话并发控制、错误处理与资源管理。
    • 客户端可扩展性:工具清单来自仓库中的工具定义,支持通过工具调用执行浏览器操作、读取页面信息、执行复杂交互等。
    • 安全与稳定性:服务端对多客户端并发访问进行隔离,提供错误返回和回滚逻辑,便于上层 LLM 客户端进行容错处理。
  • 安装步骤

    • 需要环境
      • Node.js 18.x 及以上(用于运行 MCP 服务器)
    • 获取与构建
      • 克隆仓库并安装依赖
      • 运行打包构建(如需要把源码打包成可执行文件,以提升部署灵活性)
    • 启动服务器
      • 按文档中的方式使用 MCP 客户端配置,启动 WebAct 的 MCP 服务端
      • 服务端将通过 MCP 协议接收来自客户端的请求并触发对应的浏览器自动化操作
  • 服务器配置(MCP 客户端需要的配置信息示例,客户端无需关心具体实现,只需按此格式提供即可)

    • server_name: webact
    • command: webact-mcp
    • args: 为空数组或需要的启动参数
    • 注释说明:该配置用于 MCP 客户端连接到后端服务器,客户端通过该配置项指定如何启动和连接 MCP 服务端。服务器端的实际实现会在首次接入时进行必要的初始化与会话建立。
  • 基本使用方法

    • 第一次连接时,发送 initialize 请求,获取服务器协议版本和能力信息。
    • 请求工具列表(tools/list),获取当前可用的工具集合。
    • 通过工具调用(tools/call)触发具体工具的执行,例如启动浏览器会话、导航、读取页面结构、执行点击/输入等操作。
    • 服务端会返回标准化的响应,客户端据此对后续步骤进行规划与决策。
    • 如需自行扩展工具,修改或新增 tools.json 中的工具定义,MCP 客户端即可通过工具调用访问新工具。

服务器信息