使用说明
项目简介
MCP Server Playwright 是一个基于 Model Context Protocol (MCP) 的服务器,它利用 Playwright 浏览器自动化库,为大型语言模型 (LLM) 提供与网页交互的能力。通过此服务器,LLM 可以浏览网页、填写表单、点击元素、截取屏幕截图,并执行 JavaScript 代码,从而扩展 LLM 在 Web 环境中的应用场景。
主要功能点
- 网页浏览和导航:允许 LLM 控制浏览器访问指定的 URL。
- 网页元素交互:支持点击网页元素(通过 CSS 选择器或文本内容)、填写表单、选择下拉选项等操作,使 LLM 能够与网页进行互动。
- 网页内容获取:能够截取整个网页或特定元素的屏幕截图,并将截图作为资源提供给 LLM。
- JavaScript 代码执行:允许 LLM 在浏览器环境中执行 JavaScript 代码,获取更深层次的网页信息或执行复杂操作。
- 实时日志监控:提供浏览器控制台日志的实时访问,帮助 LLM 理解网页运行状态和调试。
- 资源管理:将浏览器控制台日志和屏幕截图作为可访问的资源进行管理,方便 LLM 获取和利用。
安装步骤
- 确保已安装 Node.js 和 npm。
- 打开终端,运行以下命令安装 MCP Server Playwright:
此命令会自动检测您的操作系统(Windows 或 macOS),并更新 Claude 客户端的配置文件,完成服务器的安装和配置。npx @automatalabs/mcp-server-playwright install
服务器配置
对于 MCP 客户端(例如 Claude),需要在其配置文件中添加服务器配置信息。安装步骤通常会自动完成此配置。以下是配置示例,您可以在客户端的配置文件中找到 'mcpServers' 字段并添加 'playwright' 服务器的配置:
{ "mcpServers": { "playwright": { "command": "npx", // 启动 MCP Server Playwright 的命令,通常为 npx "args": ["-y", "@automatalabs/mcp-server-playwright"] // 启动命令的参数,这里指定了要执行的 npm 包 } } }
基本使用方法
- 启动 MCP Server Playwright 服务器。通常在安装后,服务器会在需要时自动启动,或者您可以根据客户端的指示手动启动。
- 在支持 MCP 协议的 LLM 客户端中,配置并连接到名为 'playwright' 的 MCP 服务器。客户端会根据配置文件中的 'command' 和 'args' 启动服务器。
- LLM 可以通过调用预定义的工具来控制浏览器。例如:
- 使用 'browser_navigate' 工具导航到指定网页。
- 使用 'browser_screenshot' 工具截取网页截图。
- 使用 'browser_click' 工具点击网页上的元素。
- 使用 'browser_evaluate' 工具执行 JavaScript 代码。
- LLM 可以通过资源 URI 访问服务器提供的资源。例如:
- 'console://logs' 可以访问浏览器控制台日志。
- 'screenshot://<screenshot-name>' 可以访问名为 '<screenshot-name>' 的屏幕截图。
请注意:本服务器主要设计用于与支持 MCP 协议的 LLM 客户端(如 Claude)配合使用。具体使用方式和工具调用方法请参考您的 LLM 客户端的文档。
信息
分类
网页与API