使用说明
项目简介
Browserbase MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器实现,它利用 Browserbase 和 Stagehand 技术,为大型语言模型 (LLM) 提供强大的云端浏览器自动化能力。通过这个服务器,LLM 应用可以与网页进行交互,执行各种浏览器操作,并从中提取所需信息。
主要功能点
- 浏览器自动化: 控制和编排云端浏览器,模拟用户在浏览器中的各种操作,例如页面导航、元素点击、表单填写等。
- 数据提取: 从任意网页中提取结构化数据,支持提取页面内容、JSON 数据等。
- 网页交互: 支持网页导航、点击、填写表单等操作,使 LLM 能够与网页进行深度互动。
- 屏幕截图: 捕获整个网页或特定元素的屏幕截图,方便 LLM 理解网页的视觉内容。
- JavaScript 执行: 在浏览器环境中执行自定义 JavaScript 代码,实现更高级的网页操作和数据处理。
- 原子指令 (Stagehand MCP): 使用 Stagehand MCP 可以执行更高级的原子指令,例如通过自然语言指令 'act("click the login button")' 或 'extract("find the red shoes")' 来操作和提取网页内容,简化复杂任务的构建。
- 多模型支持 (Stagehand MCP): Stagehand MCP 具有模型灵活性,支持多种 LLM 模型,包括 OpenAI 的 GPT-4 和 Anthropic 的 Claude-3.5 Sonnet,方便用户根据需求选择合适的模型。
安装步骤
- 克隆仓库: 将 GitHub 仓库 'MCP-Mirror/browserbase_mcp-server-browserbase' 克隆到本地。
git clone https://github.com/MCP-Mirror/browserbase_mcp-server-browserbase.git cd browserbase_mcp-server-browserbase - 选择 MCP 服务器版本并进入目录: 根据需要选择 Browserbase MCP 或 Stagehand MCP,进入相应的目录。例如,使用 Browserbase MCP:
或者使用 Stagehand MCP:cd browserbasecd stagehand - 安装依赖: 在选定的目录中,运行包管理器命令安装项目依赖。
npm install # 或者使用 yarn yarn install - 配置环境变量:
- Browserbase MCP 和 Stagehand MCP 都需要配置 Browserbase API 密钥和项目 ID。
- 请在 Browserbase 官网 注册并获取 'BROWSERBASE_API_KEY' 和 'BROWSERBASE_PROJECT_ID'。
- 将这两个值设置为环境变量。例如,在 Linux/macOS 系统中,可以编辑 '.bashrc' 或 '.zshrc' 文件,添加以下行:
然后运行 'source ~/.bashrc' 或 'source ~/.zshrc' 使环境变量生效。在 Windows 系统中,可以在系统环境变量中进行配置。export BROWSERBASE_API_KEY="YOUR_BROWSERBASE_API_KEY" export BROWSERBASE_PROJECT_ID="YOUR_BROWSERBASE_PROJECT_ID"
服务器配置
MCP 客户端需要配置以下 JSON 信息以连接到 Browserbase MCP 服务器或 Stagehand MCP 服务器。
Browserbase MCP 服务器配置:
{ "serverName": "browserbase_mcp", "command": "./browserbase/src/index.js", "args": [] }
- 'serverName': 服务器名称,可以自定义,用于在 MCP 客户端中标识该服务器。
- 'command': 服务器启动命令,指向 'browserbase/src/index.js' 文件。请确保此路径相对于 MCP 客户端的工作目录是正确的,或者使用绝对路径。
- 'args': 启动参数,此处为空,表示启动服务器时不需要额外的命令行参数。
Stagehand MCP 服务器配置:
{ "serverName": "stagehand_mcp", "command": "./stagehand/src/index.js", "args": [] }
- 'serverName': 服务器名称,可以自定义。
- 'command': 服务器启动命令,指向 'stagehand/src/index.js' 文件。
- 'args': 启动参数,此处为空。
注意: 请确保 MCP 客户端能够执行 'command' 中指定的命令。如果需要在其他目录下启动服务器,请根据实际情况修改 'command' 路径。 启动命令需要是可执行的,必要时请检查文件执行权限。
基本使用方法
- 启动服务器: 在 'browserbase/' 或 'stagehand/' 目录下,根据选择的版本,运行以下命令启动相应的 MCP 服务器。
服务器成功启动后,通常会在控制台输出相关日志信息。# Browserbase MCP npm start # 或 yarn start # Stagehand MCP npm start # 或 yarn start - 配置 MCP 客户端: 在您的 MCP 客户端应用中,根据上述 “服务器配置” 部分提供的 JSON 配置信息,添加或配置 MCP 服务器连接。确保客户端能够正确读取和使用这些配置。
- 使用 MCP 工具: 在 MCP 客户端中,您可以使用服务器提供的工具,例如 'browserbase_navigate'、'browserbase_screenshot' (Browserbase MCP) 或 'stagehand_act'、'stagehand_extract' (Stagehand MCP) 等,与网页进行交互和数据提取。这些工具的具体名称和功能描述可以在代码中的 'TOOLS' 数组定义中找到。根据 MCP 客户端的使用方式,调用这些工具以实现网页自动化任务。
信息
分类
网页与API