使用说明

项目简介

Prysm MCP Server 是一个基于 Model Context Protocol (MCP) 构建的服务器应用,旨在为 AI 助手(如 Claude、Cursor 等 MCP 客户端)提供强大的网页内容抓取能力。它允许 AI 助手通过标准化的 MCP 协议,调用服务器提供的工具来高效、灵活地从互联网上抓取信息,并支持多种输出格式,方便后续分析和利用。

主要功能点

  • 多种抓取模式: 提供专注模式、平衡模式和深度模式,满足不同场景下的抓取需求,例如快速抓取主要内容、均衡抓取或彻底抓取。
  • 灵活的内容格式: 支持将抓取结果格式化为 Markdown、HTML 或 JSON,方便在不同应用场景中使用。
  • 图片支持: 可选提取甚至下载网页中的图片,并支持设置图片数量和大小限制。
  • 智能滚动: 针对单页应用(SPA)提供滚动配置,确保内容加载完整。
  • 响应式设计: 能够适应不同的网站布局和结构,提高抓取成功率。
  • 文件输出: 支持将格式化后的结果保存到指定目录,方便本地存储和管理。

安装步骤

  1. 安装 Node.js 和 npm: 确保您的系统已安装 Node.js 和 npm (Node Package Manager)。
  2. 全局安装 Prysm MCP Server: 打开终端或命令提示符,运行以下命令安装 Prysm MCP Server:
    npm install -g @pinkpixel/prysm-mcp
    或者,您也可以选择安装标准版本:
    npm install -g prysm-mcp
    如果需要从源代码构建,请参考仓库 README 中的指引。

服务器配置

MCP 客户端(如 Cursor、Claude 等)需要配置 MCP 服务器的启动命令才能连接 Prysm MCP Server。以下是 'mcp.json' 配置文件的示例,展示了如何配置 Prysm MCP Server。您需要根据您的实际安装方式和需求选择合适的配置,并将其添加到您的 MCP 客户端的配置文件中。

{
  "mcpServers": {
    "prysm-scraper": {  // 服务器名称,在 MCP 客户端中引用
      "description": "Prysm web scraper", // 服务器描述,方便识别
      "command": "npx",  // 启动服务器的命令,这里使用 npx 运行 npm 包
      "args": [  // 命令参数
        "-y",   // npx 参数,自动确认安装包
        "@pinkpixel/prysm-mcp" // 要运行的 npm 包名称,即 Prysm MCP Server
      ]
    }
  }
}

配置说明:

  • '"prysm-scraper"': 为服务器定义一个名称,这个名称将在 MCP 客户端的配置中被引用。您可以自定义服务器名称。
  • '"description"': 对该服务器配置的简短描述,帮助用户区分不同的服务器配置。
  • '"command": "npx"': 指定用于启动服务器的命令为 'npx','npx' 可以方便地运行 npm 包,无需全局安装。
  • '"args"': 一个字符串数组,包含了传递给 'npx' 命令的参数。
    • '"-y"': 是 'npx' 的参数,用于自动确认安装要运行的 npm 包,避免交互式提示。
    • '"@pinkpixel/prysm-mcp"': 指定要通过 'npx' 运行的 npm 包名称,即 '@pinkpixel/prysm-mcp',这是 Prysm MCP Server 的 npm 包名。

更多配置选项: 您还可以参考仓库 README 中的 'mcp.json' 示例,根据需要配置本地开发模式、自定义输出目录等高级选项。例如,您可以设置环境变量 'PRYSM_OUTPUT_DIR' 来指定抓取结果的默认输出目录。

基本使用方法

  1. 启动 Prysm MCP Server: 当 MCP 客户端配置好 Prysm MCP Server 后,客户端会自动启动服务器。您通常无需手动启动服务器。

  2. 在 MCP 客户端中使用工具: 在支持 MCP 协议的 AI 助手(如 Cursor、Claude 等)中,您可以使用自然语言指令调用 Prysm MCP Server 提供的工具,例如:

    • 抓取网页内容: 'Please scrape https://example.com using the focused mode'
    • 格式化抓取结果: 'Format the scraped data as markdown'
    • 使用深度模式抓取: 'Please scrape https://example.com using the deep mode with maximum scrolls'

    具体的工具名称和可用参数请参考仓库 README 的 "🛠️ Tools" 部分。AI 助手会解析您的指令,并根据 MCP 协议与 Prysm MCP Server 通信,执行相应的网页抓取和格式化操作,并将结果返回给您。

注意: Prysm MCP Server 作为一个 MCP 服务器,其主要用途是为 MCP 客户端提供服务,您通常不需要直接与服务器交互,而是通过支持 MCP 协议的客户端来使用其功能。

信息

分类

网页与API