Selenium MCP Server 使用说明
项目简介
Selenium MCP Server 是一个实现了 Model Context Protocol (MCP) 的服务器,它利用 Selenium WebDriver 库,为 LLM 客户端提供浏览器自动化能力。通过该服务器,LLM 可以控制浏览器执行各种操作,例如访问网页、填写表单、点击按钮、获取网页内容等,从而扩展 LLM 在 Web 交互方面的能力。
主要功能点
- 浏览器会话管理: 启动和关闭 Chrome 或 Firefox 浏览器会话,支持自定义启动参数和 headless 模式。
- 网页导航: 控制浏览器访问指定的 URL。
- 元素定位与交互: 提供多种元素定位策略(id, css, xpath, name, tag, class),支持点击、输入文本、悬停、拖拽、双击、右键点击等元素交互操作。
- 数据获取: 获取元素的文本内容。
- 键盘模拟: 模拟键盘按键操作。
- 文件上传: 模拟文件上传操作。
- 屏幕截图: 截取当前网页的屏幕截图,可保存到指定路径或返回 Base64 编码。
安装步骤
- 安装 Node.js 和 npm: 确保你的系统已安装 Node.js 和 npm (Node 包管理器)。
- 全局安装 Selenium MCP Server: 打开终端,运行以下命令全局安装 'mcp-selenium':
npm install -g @angiejones/mcp-selenium
服务器配置
MCP 客户端需要配置 Selenium MCP Server 的启动信息才能连接和使用其功能。以下是配置示例,你需要将此配置添加到你的 MCP 客户端的服务器配置中。
{ "mcpServers": { "selenium": { // 服务器名称,可以自定义 "command": "mcp-selenium", // 启动服务器的命令,这里直接使用安装后可用的命令名 "args": [] // 启动参数,当前示例无需额外参数 } } }
配置参数说明:
- '"selenium"': 服务器名称,客户端用此名称来标识和调用 Selenium MCP Server。你可以自定义名称。
- '"command": "mcp-selenium"': 指定启动服务器的命令。全局安装后,'mcp-selenium' 命令可以直接在终端中运行。
- '"args": []': 启动参数列表。对于 Selenium MCP Server 默认配置,通常不需要额外的启动参数,因此设置为空数组。
基本使用方法
- 启动 Selenium MCP Server: 在终端中运行 'mcp-selenium' 命令即可启动服务器。服务器默认通过 Stdio 协议与客户端通信。
- 在 MCP 客户端中配置并连接 Selenium MCP Server。
- 通过 MCP 客户端向 Selenium MCP Server 发送 JSON-RPC 请求,调用预定义的工具 (Tools) 来控制浏览器。 例如,调用 'start_browser' 工具启动浏览器会话,然后调用 'navigate' 工具访问网页,再使用 'find_element' 和 'click_element' 等工具与网页元素互动。
工具调用示例 (JSON-RPC 请求体):
以下是一些工具调用的示例,展示如何通过 JSON-RPC 请求来使用 Selenium MCP Server 的功能。你需要将这些请求发送到你的 MCP 客户端,客户端会负责将其转发给 Selenium MCP Server 执行。
- 启动 Chrome 浏览器 (headless 模式):
{ "tool": "start_browser", "parameters": { "browser": "chrome", "options": { "headless": true } } }
- 访问百度首页:
{ "tool": "navigate", "parameters": { "url": "https://www.baidu.com" } }
- 在百度搜索框输入 "MCP" 并点击 "百度一下" 按钮 (假设搜索框 id 为 "kw", 按钮 id 为 "su"):
{ "tool": "send_keys", "parameters": { "by": "id", "value": "kw", "text": "MCP" } }
{ "tool": "click_element", "parameters": { "by": "id", "value": "su" } }
请参考仓库 README.md 文件中 "Tools" 部分的详细说明,了解每个工具的参数和使用方法。
信息
分类
开发者工具