使用说明

项目简介

Browser Use MCP Server 是一个基于 FastMCP 框架构建的 MCP 服务器,旨在通过自然语言指令实现浏览器自动化。它允许大型语言模型(LLM)通过标准化的 MCP 协议,调用服务器提供的工具来执行各种基于浏览器的任务,例如网页浏览、信息搜索、表单填写、按钮点击等。

主要功能点

  • 浏览器自动化: 提供一套工具,允许 LLM 控制浏览器执行各种操作。
  • 自然语言指令: 接受自然语言描述的任务,降低了使用门槛,使得 LLM 可以更方便地理解和执行复杂的浏览器操作。
  • 多LLM服务商支持: 支持多种主流 LLM 服务商,包括 OpenAI, Anthropic, Google 等,用户可以根据自己的需求和偏好选择合适的 LLM。
  • 易于集成: 作为一个 MCP 服务器,可以轻松集成到任何兼容 MCP 协议的 LLM 客户端中。

安装步骤

  1. 安装软件包: 打开终端,根据您使用的 LLM 服务商选择安装命令。如果您希望支持所有服务商,可以使用以下命令安装:

    pip install -e "git+https://github.com/pietrozullo/browser-use-mcp.git#egg=browser-use-mcp[all-providers]"

    如果您只需要支持特定的服务商,例如 OpenAI,可以使用以下命令:

    pip install -e "git+https://github.com/pietrozullo/browser-use-mcp.git#egg=browser-use-mcp[openai]"
  2. 安装 Playwright 浏览器: Browser Use MCP Server 使用 Playwright 进行浏览器自动化,您需要安装 Playwright 浏览器,推荐安装 Chromium:

    playwright install chromium

服务器配置

要将 Browser Use MCP Server 集成到您的 MCP 客户端,您需要在客户端的配置文件中添加服务器配置信息。以下是一个配置示例,展示了如何配置名为 'browser-use-mcp' 的服务器:

{
    "mcpServers": {
        "browser-use-mcp": {
            "command": "browser-use-mcp",
            "args": ["--model", "gpt-4o"],
            "env": {
                "OPENAI_API_KEY": "您的OpenAI API密钥"
            }
        }
    }
}

配置参数说明:

  • server name: 'browser-use-mcp' (服务器名称,客户端用于识别和调用)
  • command: 'browser-use-mcp' (启动服务器的命令,通常是安装后可执行的程序名)
  • args: '["--model", "gpt-4o"]' (传递给服务器的命令行参数,例如 '--model gpt-4o' 指定使用的模型为 gpt-4o)
  • env: '{ "OPENAI_API_KEY": "您的OpenAI API密钥" }' (环境变量配置,例如 'OPENAI_API_KEY' 用于设置 OpenAI 的 API 密钥,请替换为您的实际密钥)

请注意,'command' 通常设置为 'browser-use-mcp',它会调用安装后的 'browser-use-mcp' 程序。'args' 中的 '--model' 参数允许您指定要使用的 LLM 模型。'env' 字段用于配置服务器运行所需的环境变量,例如各种 LLM 服务商的 API 密钥。您需要根据您使用的 LLM 服务商配置相应的 API 密钥。

基本使用方法

  1. 确保您的 MCP 客户端已正确配置并连接到 Browser Use MCP Server。
  2. 在您的 LLM 客户端中,向 LLM 发送包含浏览器自动化任务的自然语言指令。例如:
    请打开 https://github.com,搜索 "browser-use-mcp",并总结该项目的主要功能。
  3. MCP 客户端会将指令发送给 Browser Use MCP Server。
  4. Browser Use MCP Server 会解析指令,调用相应的浏览器自动化工具执行任务。
  5. 执行结果将通过 MCP 协议返回给客户端,最终由 LLM 呈现给用户。

请参考仓库中的 'example.py' 文件和 README 文档,获取更详细的使用示例和配置说明。

信息

分类

开发者工具