Browserbase MCP 服务器使用说明

项目简介

Browserbase MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器实现,它利用 Browserbase 云浏览器服务,为大型语言模型 (LLM) 提供浏览器自动化能力。通过此服务器,LLM 可以控制云端浏览器执行网页导航、元素点击、表单填写、数据提取、屏幕截图和执行 JavaScript 等操作,从而增强 LLM 在 Web 场景下的应用能力。

主要功能点

  • 云端浏览器自动化:控制和编排云端浏览器会话,无需本地浏览器环境。
  • 网页数据提取:从任何网页中提取结构化或非结构化数据。
  • 控制台日志监控:实时跟踪和分析浏览器控制台输出的日志信息。
  • 网页截图:捕获网页完整页面或特定元素的屏幕截图,支持自定义尺寸。
  • JavaScript 执行:在浏览器上下文中执行自定义 JavaScript 代码,实现更复杂的操作。
  • 网页交互:模拟用户在网页上的操作,如导航、点击链接、填写表单等。

安装步骤

  1. 前提条件:确保已安装 Node.js 和 npm (Node.js 包管理器)。
  2. 克隆仓库:将 GitHub 仓库克隆到本地:
    git clone https://github.com/browserbase/mcp-server-browserbase.git
  3. 进入 Browserbase 目录
    cd mcp-server-browserbase/browserbase
  4. 安装依赖:使用 npm 安装项目依赖:
    npm install
  5. 配置环境变量
    • 必须设置以下环境变量,用于连接 Browserbase 服务:
      • 'BROWSERBASE_API_KEY': 您的 Browserbase API 密钥。请在 Browserbase 官网 获取。
      • 'BROWSERBASE_PROJECT_ID': 您的 Browserbase 项目 ID。同样在 Browserbase 控制台获取。
    • 您可以通过多种方式设置环境变量,例如在终端中 export,或者使用 '.env' 文件。

服务器配置

MCP 客户端需要以下 JSON 配置信息来连接 Browserbase MCP 服务器。请将以下配置添加到您的 MCP 客户端配置中:

{
  "serverName": "BrowserbaseMCP",
  "command": "node",
  "args": ["./browserbase/src/index.js"]
}
  • 'serverName': MCP 服务器的名称,可以自定义,用于在客户端中标识该服务器。
  • 'command': 运行服务器的命令,这里使用 'node' 命令来执行 JavaScript 文件。
  • 'args': 传递给 'node' 命令的参数,指定服务器入口文件 'index.js' 的路径。路径是相对于 'command' 执行目录的。

注意:请确保 MCP 客户端的当前工作目录设置为 'mcp-server-browserbase' 仓库的根目录,或者根据实际情况调整 'args' 中的路径。

基本使用方法

  1. 启动服务器:在 'browserbase' 目录下,运行以下命令启动 Browserbase MCP 服务器:

    npm start

    或者

    node src/index.js

    服务器成功启动后,将监听来自 MCP 客户端的请求。

  2. 配置 MCP 客户端:在您的 MCP 客户端应用中,根据上述 “服务器配置” 部分的信息配置 Browserbase MCP 服务器连接。

  3. 调用工具:通过 MCP 客户端,您可以向 Browserbase MCP 服务器发送 'CallToolRequest' 请求,调用预定义的工具来执行浏览器自动化任务。可用的工具包括 'browserbase_create_session', 'browserbase_close_session', 'browserbase_navigate', 'browserbase_screenshot', 'browserbase_click', 'browserbase_fill', 'browserbase_evaluate', 'browserbase_get_content' 和 'browserbase_get_json'。

  4. 访问资源:使用 MCP 客户端请求资源,例如浏览器控制台日志 ('console://logs') 和屏幕截图 ('screenshot://<screenshot_name>')。

通过以上步骤,您就可以使用 Browserbase MCP 服务器为您的 LLM 应用提供强大的云端浏览器自动化能力。

信息

分类

网页与API