OpenChrome MCP Server

使用说明(简明版)

  • 项目简介

    • OpenChrome MCP Server 是一个基于 MCP(Model Context Protocol)的后端服务,设计目标是为 LLM 客户端提供统一的资源访问、工具执行以及提示模板渲染能力,支持在云端或本地环境中进行并行的浏览器自动化任务。
    • 核心能力包括:资源(Resources)托管与访问、工具(Tools)的注册与调用、Prompt 模板的定义与渲染,以及通过 JSON-RPC 与客户端进行通信、管理会话、声明能力,并支持多种传输协议(如 Stdio、SSE、WebSocket)。
  • 主要功能点

    • MCP 协议实现与 JSON-RPC 通信:服务端接收 MCP 请求(如 initialize、tools/list、tools/call、sessions/list 等),返回符合 MCP 2024-11-05 规范的响应。
    • 资源、工具、提示模板管理:提供资源数据访问、可调用工具、以及可渲染的 Prompt 模板,方便 LLM 在对话中获取上下文与能力。
    • 会话管理与并行浏览:支持多会话隔离、浏览上下文分组(浏览器 tab 组)、CDP(Chrome DevTools Protocol)连接池、以及并行/串行执行管理,适用于大规模并发浏览场景。
    • 工具执行与错误处理:工具在执行时可跨会话自动创建会话、回放/恢复、以及对连接错误的自动重连与提示信息,提升鲁棒性。
    • 服务器部署与扩展性:提供服务器端 CLI 与扩展化工具注册接口,方便集成到 Claude Code、Claude API、或自定义 MCP 客户端。
  • 安装步骤

      1. 获取源码并安装依赖
      • 下载并解压源码后,在项目根目录执行 npm install 安装依赖。
      1. 构建与测试
      • 运行 npm run build 构建扩展和服务端代码。
      • 运行测试用例(可选)以验证 MCP 协议实现与工具注册逻辑的正确性。
      1. 启动 MCP 服务器
      • 快速启动(快速接入 Claude Code/Claude API):
        • OpenChrome 提供的快速启动路径包括:npx openchrome-mcp setup 安装并自动授权工具权限;再执行 oc serve --server-mode 启动服务器(或在你熟悉的 MCP 客户端中通过 oc 配置开启服务器)。详细启动命令请参考快速使用。
      1. 服务器配置与集成
      • MCP 客户端要通过 JSON 配置与 MCP 服务器对接。具体配置示例见下方的“服务器配置”说明。
  • 服务器配置(MCP 客户端无需实现,仅供参考配置) 这段 JSON 配置描述了一个名为 openchrome 的 MCP 服务器,其启动命令为 “oc”,参数为 ["serve", "--server-mode"],以及服务器名称字段,帮助 MCP 客户端在 Claude Code 等环境中定位并启动对应服务器。 { "mcpServers": { "openchrome": { "command": "oc", "args": ["serve", "--server-mode"], "description": "OpenChrome MCP 服务器,提供资源、工具与 Prompt 的上下文服务", "enabled": true } } }

  • 基本使用方法

    • 通过 Claude Code、Claude API 或自定义 MCP 客户端与 OpenChrome MCP Server 进行对话驱动
    • 在客户端发送 MCP 请求(如 initialize、tools/list、sessions/create、tools/call 等),服务器将返回 JSON-RPC 响应,客户端据此获取工具信息、执行结果与上下文数据
    • 使用多会话能力,按需要创建与切换不同会话,以实现并行浏览、数据获取和任务执行
    • 如需扩展工具或自定义工具集,可以在服务器端注册新的工具,客户端即可调用新工具
  • 需要关注的要点

    • MCP 初始化阶段,服务器应返回 protocolVersion、serverInfo、capabilities 等关键信息,便于客户端对后续能力进行协商。
    • 支持多种传输协议使得 MCP 客户端可以在不同环境中与服务器进行通信(如 STDIO、SSE、WebSocket 等)。
    • 服务器端需要实现会话管理、资源及工具注册、以及错误处理与自动重连策略,确保高可用性。

4-5 个关键词 浏览器自动化, 会话管理, JSON-RPC, Chrome DevTools Protocol, 并行执行

分类ID 5

服务器信息