使用说明
项目简介
MCP NPX Fetch 是一个基于 Model Context Protocol (MCP) 的服务器实现,旨在为 LLM 应用提供便捷的网络内容抓取和格式转换能力。通过该服务器,LLM 可以轻松获取网页内容,并将其转换为 HTML, JSON, 纯文本或 Markdown 等多种格式,以满足不同的应用场景需求。
主要功能点
- 通用内容抓取: 支持抓取 HTML, JSON, 纯文本和 Markdown 等多种格式的网页内容。
- 自定义请求头: 允许用户自定义 HTTP 请求头,以支持身份验证或其他特殊请求需求。
- 内置格式转换: 能够自动将抓取的网页内容转换为所需的格式,方便 LLM 应用直接使用。
- MCP 兼容: 完全兼容 Model Context Protocol,可以与 Claude Desktop 等 MCP 客户端无缝集成。
- 工具丰富: 提供 'fetch_html', 'fetch_json', 'fetch_txt', 'fetch_markdown' 等多个工具,满足不同的抓取和转换需求。
安装步骤
-
全局安装 (推荐):
npm install -g @tokenizin/mcp-npx-fetch安装完成后,即可在命令行中使用 'mcp-npx-fetch' 命令启动服务器。
-
直接使用 NPX:
npx @tokenizin/mcp-npx-fetch无需全局安装,即可通过 NPX 临时运行服务器。
服务器配置
MCP 服务器需要配置到 MCP 客户端中才能使用。以 Claude Desktop 为例,需要在其配置文件 'claude_desktop_config.json' 中添加以下服务器配置信息。
{ "mcpServers": { "fetch": { "command": "npx", "args": ["-y", "@tokenizin/mcp-npx-fetch"] } } }
配置参数说明:
- 'server name': 'fetch' (服务器名称,可以自定义,用于在客户端中标识该服务器)
- 'command': 'npx' (启动服务器的命令,这里使用 npx 运行 npm 包)
- 'args': '["-y", "@tokenizin/mcp-npx-fetch"]' (命令参数,'-y' 参数用于自动确认安装,'@tokenizin/mcp-npx-fetch' 是要运行的 npm 包名称)
基本使用方法
-
启动服务器: 根据安装方式,在命令行中运行 'mcp-npx-fetch' 或 'npx @tokenizin/mcp-npx-fetch' 命令启动 MCP 服务器。
-
配置客户端: 将上述服务器配置信息添加到 MCP 客户端(如 Claude Desktop)的配置文件中。
-
调用工具: 在 MCP 客户端中,可以通过调用以下工具来抓取和转换网页内容:
- 'fetch_html': 抓取网页并返回 HTML 内容。
- 'fetch_json': 抓取 URL 并解析 JSON 数据。
- 'fetch_txt': 抓取网页并返回纯文本内容 (移除 HTML 标签和脚本)。
- 'fetch_markdown': 抓取网页并转换为 Markdown 格式。
调用工具时,需要提供 'url' 参数 (目标网址),还可以选择性提供 'headers' 参数 (自定义请求头)。具体的参数格式请参考仓库文档或工具的 inputSchema 定义。
信息
分类
网页与API