使用说明

项目简介

browser-use-mcp-server 是一个 MCP (Model Context Protocol) 服务器的实现,它允许大型语言模型 (LLM) 通过标准化的 MCP 协议与浏览器进行交互。该服务器集成了浏览器自动化工具,使 LLM 能够执行如打开网页、点击链接、填写表单、提取信息等浏览器操作,并将结果作为上下文信息返回给 LLM,从而增强 LLM 在处理网页内容和执行在线任务方面的能力。

主要功能点

  • 浏览器自动化工具集成: 提供 'browser_use' 工具,允许 LLM 指示服务器控制浏览器访问指定 URL 并执行特定操作。
  • 异步任务处理: 浏览器操作作为异步任务执行,服务器返回任务 ID,客户端可以通过 'browser_get_result' 工具或资源 URI 查询任务状态和结果。
  • 资源管理: 服务器将完成的浏览器任务结果作为资源进行管理,客户端可以获取资源以访问任务详情和结果数据。
  • SSE 和 Stdio 传输协议支持: 支持 Server-Sent Events (SSE) 和标准输入输出 (Stdio) 两种 MCP 传输协议,可以灵活适配不同的客户端环境。
  • 支持多种 LLM 客户端: 兼容 Cursor.ai, Claude desktop, Claude code 等支持 MCP 协议的 LLM 客户端。

安装步骤

  1. 安装 uv: 根据仓库 README.md 提供的命令安装 uv 包管理器。
    curl -LsSf https://astral.sh/uv/install.sh | sh
  2. 同步依赖并安装 Playwright: 使用 uv 安装项目依赖和 Playwright 浏览器自动化库。
    uv sync
    uv pip install playwright
    uv run playwright install --with-deps --no-shell chromium
  3. 启动 MCP 服务器: 使用 uv 运行服务器脚本,可以选择 SSE 或 Stdio 传输协议,并指定端口号。例如,使用 SSE 协议,端口 8000 启动服务器:
    uv run server --transport sse --port 8000

服务器配置 (MCP 客户端)

对于支持 MCP 协议的客户端,您需要配置 MCP 服务器的连接信息。以下是配置示例,以 JSON 格式描述,通常需要添加到客户端的 MCP 配置文件中(例如 Cursor, Claude 等客户端的配置文件):

{
  "mcpServers": {
    "browser-use-mcp-server": {  // 服务器名称,可以自定义
      "url": "http://localhost:8000/sse" // MCP 服务器的 SSE 地址,根据实际启动参数修改
    }
  }
}

配置信息说明:

  • '"browser-use-mcp-server"': MCP 服务器的名称,客户端用以标识和选择连接的服务器,可以自定义。
  • '"url"': MCP 服务器的 SSE 地址。如果服务器启动时使用了不同的端口或传输协议,请相应地修改此 URL。例如,如果使用 Stdio 协议,则无需 URL 配置,客户端通常通过命令行参数与 Stdio 服务器通信。

注意: MCP 客户端通常还需要配置服务器的启动命令和参数,但 'mcp.json' 配置文件本身不包含启动命令和参数。 启动命令和参数是在客户端软件中配置的,用于启动 'browser-use-mcp-server' 服务进程。 例如,在某些客户端中,您可能需要配置类似以下的启动命令(command)和参数(args)来启动 'browser-use-mcp-server' 服务:

{
    "serverName": "browser-use-mcp-server",
    "command": "uv",  // 或者服务器脚本的完整路径,例如 "/path/to/browser-use-mcp-server/server/server.py"
    "args": ["run", "server", "--transport", "sse", "--port", "8000"] // 启动参数,与上面 "启动 MCP 服务器" 步骤中的命令一致
    // ... 其他客户端需要的配置
}

请务必参考您的 MCP 客户端软件的官方文档,了解如何配置 MCP 服务器的启动命令、参数以及 'mcp.json' 配置文件。 上述 'command' 和 'args' 仅为示例,实际配置可能因客户端而异。

基本使用方法

  1. 启动 MCP 服务器: 按照 "安装步骤" 中的说明启动 'browser-use-mcp-server'。
  2. 配置 MCP 客户端: 将上面提供的 'mcp.json' 配置信息添加到您的 MCP 客户端(如 Cursor, Claude)的配置文件中,并根据客户端的要求配置服务器的启动命令和参数。
  3. 在 LLM 中使用工具: 在 LLM 客户端中,您可以使用 'browser_use' 工具指示 LLM 控制浏览器。例如,您可以向 LLM 提出如下指令:
    open https://news.ycombinator.com and return the top ranked article
    LLM 可能会调用 'browser_use' 工具,并传入 URL 和操作指令。服务器会执行浏览器操作,并将结果返回给 LLM。 您可以使用 'browser_get_result' 工具或资源 URI 查询任务执行状态和最终结果。

重要提示: 'browser-use-mcp-server' 的 'browser_use' 工具是异步执行的,调用后会返回一个任务 ID。 您需要使用 'browser_get_result' 工具并提供任务 ID 来获取最终的浏览器操作结果。 请注意工具返回的信息中包含 'sleep_command' 和 'instruction' 字段,指示客户端在查询任务状态时需要等待的时间间隔 (5 秒)。

信息

分类

AI与计算