使用说明

项目简介

Browserbase MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器实现,它利用 Browserbase 和 Stagehand 技术,为大型语言模型 (LLM) 提供强大的云端浏览器自动化能力。通过这个服务器,LLM 应用可以与网页进行交互,执行各种浏览器操作,并从中提取所需信息。

主要功能点

  • 浏览器自动化: 控制和编排云端浏览器,模拟用户在浏览器中的各种操作,例如页面导航、元素点击、表单填写等。
  • 数据提取: 从任意网页中提取结构化数据,支持提取页面内容、JSON 数据等。
  • 网页交互: 支持网页导航、点击、填写表单等操作,使 LLM 能够与网页进行深度互动。
  • 屏幕截图: 捕获整个网页或特定元素的屏幕截图,方便 LLM 理解网页的视觉内容。
  • JavaScript 执行: 在浏览器环境中执行自定义 JavaScript 代码,实现更高级的网页操作和数据处理。
  • 原子指令 (Stagehand MCP): 使用 Stagehand MCP 可以执行更高级的原子指令,例如通过自然语言指令 'act("click the login button")' 或 'extract("find the red shoes")' 来操作和提取网页内容,简化复杂任务的构建。
  • 多模型支持 (Stagehand MCP): Stagehand MCP 具有模型灵活性,支持多种 LLM 模型,包括 OpenAI 的 GPT-4 和 Anthropic 的 Claude-3.5 Sonnet,方便用户根据需求选择合适的模型。

安装步骤

  1. 克隆仓库: 将 GitHub 仓库 'MCP-Mirror/browserbase_mcp-server-browserbase' 克隆到本地。
    git clone https://github.com/MCP-Mirror/browserbase_mcp-server-browserbase.git
    cd browserbase_mcp-server-browserbase
  2. 选择 MCP 服务器版本并进入目录: 根据需要选择 Browserbase MCP 或 Stagehand MCP,进入相应的目录。例如,使用 Browserbase MCP:
    cd browserbase
    或者使用 Stagehand MCP:
    cd stagehand
  3. 安装依赖: 在选定的目录中,运行包管理器命令安装项目依赖。
    npm install
    # 或者使用 yarn
    yarn install
  4. 配置环境变量:
    • Browserbase MCP 和 Stagehand MCP 都需要配置 Browserbase API 密钥和项目 ID。
    • 请在 Browserbase 官网 注册并获取 'BROWSERBASE_API_KEY' 和 'BROWSERBASE_PROJECT_ID'。
    • 将这两个值设置为环境变量。例如,在 Linux/macOS 系统中,可以编辑 '.bashrc' 或 '.zshrc' 文件,添加以下行:
      export BROWSERBASE_API_KEY="YOUR_BROWSERBASE_API_KEY"
      export BROWSERBASE_PROJECT_ID="YOUR_BROWSERBASE_PROJECT_ID"
      然后运行 'source ~/.bashrc' 或 'source ~/.zshrc' 使环境变量生效。在 Windows 系统中,可以在系统环境变量中进行配置。

服务器配置

MCP 客户端需要配置以下 JSON 信息以连接到 Browserbase MCP 服务器或 Stagehand MCP 服务器。

Browserbase MCP 服务器配置:

{
  "serverName": "browserbase_mcp",
  "command": "./browserbase/src/index.js",
  "args": []
}
  • 'serverName': 服务器名称,可以自定义,用于在 MCP 客户端中标识该服务器。
  • 'command': 服务器启动命令,指向 'browserbase/src/index.js' 文件。请确保此路径相对于 MCP 客户端的工作目录是正确的,或者使用绝对路径。
  • 'args': 启动参数,此处为空,表示启动服务器时不需要额外的命令行参数。

Stagehand MCP 服务器配置:

{
  "serverName": "stagehand_mcp",
  "command": "./stagehand/src/index.js",
  "args": []
}
  • 'serverName': 服务器名称,可以自定义。
  • 'command': 服务器启动命令,指向 'stagehand/src/index.js' 文件。
  • 'args': 启动参数,此处为空。

注意: 请确保 MCP 客户端能够执行 'command' 中指定的命令。如果需要在其他目录下启动服务器,请根据实际情况修改 'command' 路径。 启动命令需要是可执行的,必要时请检查文件执行权限。

基本使用方法

  1. 启动服务器: 在 'browserbase/' 或 'stagehand/' 目录下,根据选择的版本,运行以下命令启动相应的 MCP 服务器。
    # Browserbase MCP
    npm start
    # 或 yarn start
    
    # Stagehand MCP
    npm start
    # 或 yarn start
    服务器成功启动后,通常会在控制台输出相关日志信息。
  2. 配置 MCP 客户端: 在您的 MCP 客户端应用中,根据上述 “服务器配置” 部分提供的 JSON 配置信息,添加或配置 MCP 服务器连接。确保客户端能够正确读取和使用这些配置。
  3. 使用 MCP 工具: 在 MCP 客户端中,您可以使用服务器提供的工具,例如 'browserbase_navigate'、'browserbase_screenshot' (Browserbase MCP) 或 'stagehand_act'、'stagehand_extract' (Stagehand MCP) 等,与网页进行交互和数据提取。这些工具的具体名称和功能描述可以在代码中的 'TOOLS' 数组定义中找到。根据 MCP 客户端的使用方式,调用这些工具以实现网页自动化任务。

信息

分类

网页与API