Browserbase MCP 服务器使用说明
项目简介
Browserbase MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器实现,它利用 Browserbase 云浏览器服务,为大型语言模型 (LLM) 提供浏览器自动化能力。通过此服务器,LLM 可以控制云端浏览器执行网页导航、元素点击、表单填写、数据提取、屏幕截图和执行 JavaScript 等操作,从而增强 LLM 在 Web 场景下的应用能力。
主要功能点
- 云端浏览器自动化:控制和编排云端浏览器会话,无需本地浏览器环境。
- 网页数据提取:从任何网页中提取结构化或非结构化数据。
- 控制台日志监控:实时跟踪和分析浏览器控制台输出的日志信息。
- 网页截图:捕获网页完整页面或特定元素的屏幕截图,支持自定义尺寸。
- JavaScript 执行:在浏览器上下文中执行自定义 JavaScript 代码,实现更复杂的操作。
- 网页交互:模拟用户在网页上的操作,如导航、点击链接、填写表单等。
安装步骤
- 前提条件:确保已安装 Node.js 和 npm (Node.js 包管理器)。
- 克隆仓库:将 GitHub 仓库克隆到本地:
git clone https://github.com/browserbase/mcp-server-browserbase.git - 进入 Browserbase 目录:
cd mcp-server-browserbase/browserbase - 安装依赖:使用 npm 安装项目依赖:
npm install - 配置环境变量:
- 必须设置以下环境变量,用于连接 Browserbase 服务:
- 'BROWSERBASE_API_KEY': 您的 Browserbase API 密钥。请在 Browserbase 官网 获取。
- 'BROWSERBASE_PROJECT_ID': 您的 Browserbase 项目 ID。同样在 Browserbase 控制台获取。
- 您可以通过多种方式设置环境变量,例如在终端中 export,或者使用 '.env' 文件。
- 必须设置以下环境变量,用于连接 Browserbase 服务:
服务器配置
MCP 客户端需要以下 JSON 配置信息来连接 Browserbase MCP 服务器。请将以下配置添加到您的 MCP 客户端配置中:
{ "serverName": "BrowserbaseMCP", "command": "node", "args": ["./browserbase/src/index.js"] }
- 'serverName': MCP 服务器的名称,可以自定义,用于在客户端中标识该服务器。
- 'command': 运行服务器的命令,这里使用 'node' 命令来执行 JavaScript 文件。
- 'args': 传递给 'node' 命令的参数,指定服务器入口文件 'index.js' 的路径。路径是相对于 'command' 执行目录的。
注意:请确保 MCP 客户端的当前工作目录设置为 'mcp-server-browserbase' 仓库的根目录,或者根据实际情况调整 'args' 中的路径。
基本使用方法
-
启动服务器:在 'browserbase' 目录下,运行以下命令启动 Browserbase MCP 服务器:
npm start或者
node src/index.js服务器成功启动后,将监听来自 MCP 客户端的请求。
-
配置 MCP 客户端:在您的 MCP 客户端应用中,根据上述 “服务器配置” 部分的信息配置 Browserbase MCP 服务器连接。
-
调用工具:通过 MCP 客户端,您可以向 Browserbase MCP 服务器发送 'CallToolRequest' 请求,调用预定义的工具来执行浏览器自动化任务。可用的工具包括 'browserbase_create_session', 'browserbase_close_session', 'browserbase_navigate', 'browserbase_screenshot', 'browserbase_click', 'browserbase_fill', 'browserbase_evaluate', 'browserbase_get_content' 和 'browserbase_get_json'。
-
访问资源:使用 MCP 客户端请求资源,例如浏览器控制台日志 ('console://logs') 和屏幕截图 ('screenshot://<screenshot_name>')。
通过以上步骤,您就可以使用 Browserbase MCP 服务器为您的 LLM 应用提供强大的云端浏览器自动化能力。
信息
分类
网页与API