使用说明

项目简介

MCP Server Playwright 是一个基于 Model Context Protocol (MCP) 的服务器,它利用 Playwright 浏览器自动化库,为大型语言模型 (LLM) 提供与网页交互的能力。通过此服务器,LLM 可以浏览网页、填写表单、点击元素、截取屏幕截图,并执行 JavaScript 代码,从而扩展 LLM 在 Web 环境中的应用场景。

主要功能点

  • 网页浏览和导航:允许 LLM 控制浏览器访问指定的 URL。
  • 网页元素交互:支持点击网页元素(通过 CSS 选择器或文本内容)、填写表单、选择下拉选项等操作,使 LLM 能够与网页进行互动。
  • 网页内容获取:能够截取整个网页或特定元素的屏幕截图,并将截图作为资源提供给 LLM。
  • JavaScript 代码执行:允许 LLM 在浏览器环境中执行 JavaScript 代码,获取更深层次的网页信息或执行复杂操作。
  • 实时日志监控:提供浏览器控制台日志的实时访问,帮助 LLM 理解网页运行状态和调试。
  • 资源管理:将浏览器控制台日志和屏幕截图作为可访问的资源进行管理,方便 LLM 获取和利用。

安装步骤

  1. 确保已安装 Node.js 和 npm。
  2. 打开终端,运行以下命令安装 MCP Server Playwright:
    npx @automatalabs/mcp-server-playwright install
    此命令会自动检测您的操作系统(Windows 或 macOS),并更新 Claude 客户端的配置文件,完成服务器的安装和配置。

服务器配置

对于 MCP 客户端(例如 Claude),需要在其配置文件中添加服务器配置信息。安装步骤通常会自动完成此配置。以下是配置示例,您可以在客户端的配置文件中找到 'mcpServers' 字段并添加 'playwright' 服务器的配置:

{
  "mcpServers": {
    "playwright": {
      "command": "npx",  // 启动 MCP Server Playwright 的命令,通常为 npx
      "args": ["-y", "@automatalabs/mcp-server-playwright"] // 启动命令的参数,这里指定了要执行的 npm 包
    }
  }
}

基本使用方法

  1. 启动 MCP Server Playwright 服务器。通常在安装后,服务器会在需要时自动启动,或者您可以根据客户端的指示手动启动。
  2. 在支持 MCP 协议的 LLM 客户端中,配置并连接到名为 'playwright' 的 MCP 服务器。客户端会根据配置文件中的 'command' 和 'args' 启动服务器。
  3. LLM 可以通过调用预定义的工具来控制浏览器。例如:
    • 使用 'browser_navigate' 工具导航到指定网页。
    • 使用 'browser_screenshot' 工具截取网页截图。
    • 使用 'browser_click' 工具点击网页上的元素。
    • 使用 'browser_evaluate' 工具执行 JavaScript 代码。
  4. LLM 可以通过资源 URI 访问服务器提供的资源。例如:
    • 'console://logs' 可以访问浏览器控制台日志。
    • 'screenshot://<screenshot-name>' 可以访问名为 '<screenshot-name>' 的屏幕截图。

请注意:本服务器主要设计用于与支持 MCP 协议的 LLM 客户端(如 Claude)配合使用。具体使用方式和工具调用方法请参考您的 LLM 客户端的文档。

信息

分类

网页与API