Puppeteer MCP服务器 - 网页与API类MCP服务器 | MCP搜索

关键词

网页自动化浏览器控制 Puppeteer 网页抓取 AI工具自动化工具

使用说明

项目简介

本项目是一个基于Model Context Protocol (MCP) 的服务器实现，它将 Puppeteer 强大的浏览器自动化能力封装成一系列工具，通过MCP协议提供给LLM客户端使用。这使得LLM可以通过调用这些工具，实现自动化的网页浏览、信息抓取、用户交互等任务。

主要功能点

网页导航: 打开指定URL的网页。
元素操作: 模拟用户点击网页元素、在输入框中输入文本。
内容提取: 获取网页内容，支持提取纯文本、HTML或结构化DOM信息。
页面控制: 网页滚动、等待元素加载、检测验证码。
文件下载: 下载网页上的图片和文件到本地。

安装步骤

本项目是 Saiki 项目的一部分，作为Saiki的功能扩展而存在，无需单独安装。要使用 Puppeteer MCP 服务器，您需要先安装 Saiki 项目：

克隆仓库:

git clone https://github.com/truffle-ai/saiki
cd saiki

安装依赖并构建:

npm install
npm run build

服务器配置

要让MCP客户端（例如Saiki本身或其他兼容客户端）连接到 Puppeteer MCP 服务器，您需要在客户端的配置文件中添加服务器配置信息。以下是一个 'mcp.json' 配置示例，用于配置一个名为 "puppeteer" 的服务器连接：

{
  "mcpServers": {
    "puppeteer": {
      "type": "stdio",
      "command": "node",
      "args": ["./dist/src/servers/puppeteerServer.js"]
    }
  }
}

配置参数说明:

server name: 'puppeteer' (服务器名称，可以自定义)
type: 'stdio' (连接类型，表示使用标准输入输出流)
command: 'node' (启动服务器的命令，这里使用 Node.js 运行 JavaScript 文件)
args: '["./dist/src/servers/puppeteerServer.js"]' (传递给 'node' 命令的参数，指向编译后的 Puppeteer MCP 服务器 JavaScript 文件路径。请根据实际文件路径调整)

注意: 请确保 'puppeteerServer.js' 文件路径正确，该文件位于 Saiki 项目编译后的 'dist' 目录下。

基本使用方法

启动 Puppeteer MCP 服务器: 无需手动启动，当 Saiki 客户端尝试连接到 "puppeteer" 服务器时，会自动启动。
配置 MCP 客户端: 在 MCP 客户端（如 Saiki）的配置文件中，添加上述服务器配置信息。
使用 LLM 指令调用工具: 通过自然语言指令，指示 LLM 客户端调用 Puppeteer MCP 服务器提供的工具，例如：
- "导航到 https://www.example.com" (对应 'puppeteer_navigate' 工具)
- "点击页面上的 '搜索' 按钮" (对应 'puppeteer_click' 工具)
- "获取当前页面的主要内容" (对应 'puppeteer_get_content' 工具)

LLM 将会解析指令，并根据工具描述和参数，调用 Puppeteer MCP 服务器执行相应的浏览器自动化操作。

信息

分类

网页与API