使用说明

项目简介

browser-use-mcp-server 是一个 MCP (Model Context Protocol) 服务器的实现，它允许大型语言模型 (LLM) 通过标准化的 MCP 协议与浏览器进行交互。该服务器集成了浏览器自动化工具，使 LLM 能够执行如打开网页、点击链接、填写表单、提取信息等浏览器操作，并将结果作为上下文信息返回给 LLM，从而增强 LLM 在处理网页内容和执行在线任务方面的能力。

主要功能点

浏览器自动化工具集成: 提供 'browser_use' 工具，允许 LLM 指示服务器控制浏览器访问指定 URL 并执行特定操作。
异步任务处理: 浏览器操作作为异步任务执行，服务器返回任务 ID，客户端可以通过 'browser_get_result' 工具或资源 URI 查询任务状态和结果。
资源管理: 服务器将完成的浏览器任务结果作为资源进行管理，客户端可以获取资源以访问任务详情和结果数据。
SSE 和 Stdio 传输协议支持: 支持 Server-Sent Events (SSE) 和标准输入输出 (Stdio) 两种 MCP 传输协议，可以灵活适配不同的客户端环境。
支持多种 LLM 客户端: 兼容 Cursor.ai, Claude desktop, Claude code 等支持 MCP 协议的 LLM 客户端。

安装步骤

安装 uv: 根据仓库 README.md 提供的命令安装 uv 包管理器。

curl -LsSf https://astral.sh/uv/install.sh | sh

同步依赖并安装 Playwright: 使用 uv 安装项目依赖和 Playwright 浏览器自动化库。

uv sync
uv pip install playwright
uv run playwright install --with-deps --no-shell chromium

启动 MCP 服务器: 使用 uv 运行服务器脚本，可以选择 SSE 或 Stdio 传输协议，并指定端口号。例如，使用 SSE 协议，端口 8000 启动服务器：
```
uv run server --transport sse --port 8000
```

服务器配置 (MCP 客户端)

对于支持 MCP 协议的客户端，您需要配置 MCP 服务器的连接信息。以下是配置示例，以 JSON 格式描述，通常需要添加到客户端的 MCP 配置文件中（例如 Cursor, Claude 等客户端的配置文件）：

{
  "mcpServers": {
    "browser-use-mcp-server": {  // 服务器名称，可以自定义
      "url": "http://localhost:8000/sse" // MCP 服务器的 SSE 地址，根据实际启动参数修改
    }
  }
}

配置信息说明:

'"browser-use-mcp-server"': MCP 服务器的名称，客户端用以标识和选择连接的服务器，可以自定义。
'"url"': MCP 服务器的 SSE 地址。如果服务器启动时使用了不同的端口或传输协议，请相应地修改此 URL。例如，如果使用 Stdio 协议，则无需 URL 配置，客户端通常通过命令行参数与 Stdio 服务器通信。

注意: MCP 客户端通常还需要配置服务器的启动命令和参数，但 'mcp.json' 配置文件本身不包含启动命令和参数。启动命令和参数是在客户端软件中配置的，用于启动 'browser-use-mcp-server' 服务进程。例如，在某些客户端中，您可能需要配置类似以下的启动命令（command）和参数（args）来启动 'browser-use-mcp-server' 服务：

{
    "serverName": "browser-use-mcp-server",
    "command": "uv",  // 或者服务器脚本的完整路径，例如 "/path/to/browser-use-mcp-server/server/server.py"
    "args": ["run", "server", "--transport", "sse", "--port", "8000"] // 启动参数，与上面 "启动 MCP 服务器" 步骤中的命令一致
    // ... 其他客户端需要的配置
}

请务必参考您的 MCP 客户端软件的官方文档，了解如何配置 MCP 服务器的启动命令、参数以及 'mcp.json' 配置文件。 上述 'command' 和 'args' 仅为示例，实际配置可能因客户端而异。

基本使用方法

启动 MCP 服务器: 按照 "安装步骤" 中的说明启动 'browser-use-mcp-server'。
配置 MCP 客户端: 将上面提供的 'mcp.json' 配置信息添加到您的 MCP 客户端（如 Cursor, Claude）的配置文件中，并根据客户端的要求配置服务器的启动命令和参数。
在 LLM 中使用工具: 在 LLM 客户端中，您可以使用 'browser_use' 工具指示 LLM 控制浏览器。例如，您可以向 LLM 提出如下指令：
```
open https://news.ycombinator.com and return the top ranked article
```
LLM 可能会调用 'browser_use' 工具，并传入 URL 和操作指令。服务器会执行浏览器操作，并将结果返回给 LLM。您可以使用 'browser_get_result' 工具或资源 URI 查询任务执行状态和最终结果。

重要提示: 'browser-use-mcp-server' 的 'browser_use' 工具是异步执行的，调用后会返回一个任务 ID。您需要使用 'browser_get_result' 工具并提供任务 ID 来获取最终的浏览器操作结果。请注意工具返回的信息中包含 'sleep_command' 和 'instruction' 字段，指示客户端在查询任务状态时需要等待的时间间隔 (5 秒)。

关键词