使用说明

项目简介

MCP NPX Fetch 是一个基于 Model Context Protocol (MCP) 的服务器实现,旨在为 LLM 应用提供便捷的网络内容抓取和格式转换能力。通过该服务器,LLM 可以轻松获取网页内容,并将其转换为 HTML, JSON, 纯文本或 Markdown 等多种格式,以满足不同的应用场景需求。

主要功能点

  • 通用内容抓取: 支持抓取 HTML, JSON, 纯文本和 Markdown 等多种格式的网页内容。
  • 自定义请求头: 允许用户自定义 HTTP 请求头,以支持身份验证或其他特殊请求需求。
  • 内置格式转换: 能够自动将抓取的网页内容转换为所需的格式,方便 LLM 应用直接使用。
  • MCP 兼容: 完全兼容 Model Context Protocol,可以与 Claude Desktop 等 MCP 客户端无缝集成。
  • 工具丰富: 提供 'fetch_html', 'fetch_json', 'fetch_txt', 'fetch_markdown' 等多个工具,满足不同的抓取和转换需求。

安装步骤

  1. 全局安装 (推荐):

    npm install -g @tokenizin/mcp-npx-fetch

    安装完成后,即可在命令行中使用 'mcp-npx-fetch' 命令启动服务器。

  2. 直接使用 NPX:

    npx @tokenizin/mcp-npx-fetch

    无需全局安装,即可通过 NPX 临时运行服务器。

服务器配置

MCP 服务器需要配置到 MCP 客户端中才能使用。以 Claude Desktop 为例,需要在其配置文件 'claude_desktop_config.json' 中添加以下服务器配置信息。

{
  "mcpServers": {
    "fetch": {
      "command": "npx",
      "args": ["-y", "@tokenizin/mcp-npx-fetch"]
    }
  }
}

配置参数说明:

  • 'server name': 'fetch' (服务器名称,可以自定义,用于在客户端中标识该服务器)
  • 'command': 'npx' (启动服务器的命令,这里使用 npx 运行 npm 包)
  • 'args': '["-y", "@tokenizin/mcp-npx-fetch"]' (命令参数,'-y' 参数用于自动确认安装,'@tokenizin/mcp-npx-fetch' 是要运行的 npm 包名称)

基本使用方法

  1. 启动服务器: 根据安装方式,在命令行中运行 'mcp-npx-fetch' 或 'npx @tokenizin/mcp-npx-fetch' 命令启动 MCP 服务器。

  2. 配置客户端: 将上述服务器配置信息添加到 MCP 客户端(如 Claude Desktop)的配置文件中。

  3. 调用工具: 在 MCP 客户端中,可以通过调用以下工具来抓取和转换网页内容:

    • 'fetch_html': 抓取网页并返回 HTML 内容。
    • 'fetch_json': 抓取 URL 并解析 JSON 数据。
    • 'fetch_txt': 抓取网页并返回纯文本内容 (移除 HTML 标签和脚本)。
    • 'fetch_markdown': 抓取网页并转换为 Markdown 格式。

    调用工具时,需要提供 'url' 参数 (目标网址),还可以选择性提供 'headers' 参数 (自定义请求头)。具体的参数格式请参考仓库文档或工具的 inputSchema 定义。

信息

分类

网页与API