网站地图 MCP 服务器

这是一个基于 Model Context Protocol (MCP) 的服务器,专注于提供网站地图(Sitemap)相关的能力。通过集成此服务器,支持 MCP 的大型语言模型 (LLM) 客户端(如 Claude Desktop, Cursor 等)可以直接获取、解析和分析任何网站的 sitemap,从而帮助 LLM 更好地理解网站结构、发现页面、进行 SEO 分析等任务。

主要功能点

  • 抓取和解析 sitemap: 从指定 URL 获取网站的 XML sitemap 文件,并解析其结构和内容。
  • 获取页面列表: 提供按分页获取 sitemap 中包含的页面 URL 列表的功能,支持按路径或特定的子 sitemap 进行过滤。
  • 统计信息分析: 提供网站 sitemap 的综合统计数据,包括总页面数、子 sitemap 数量、页面优先级、最后修改时间等。
  • 直接解析内容: 支持直接输入 sitemap 的 XML 或文本内容进行解析。
  • Prompt 模板: 内置多种预设的 Prompt 模板,方便 LLM 执行常见的 sitemap 分析任务,例如健康检查、URL 提取、缺失内容分析、结构可视化等。

安装步骤

  1. 确保您的系统已安装 'uv' 包管理器(如果未安装,请参考其官方文档进行安装)。
  2. 大多数支持 MCP 的 LLM 客户端(如 Claude Desktop, Cursor)允许您在设置中直接配置 MCP 服务器。按照您使用的客户端文档找到 MCP 服务器配置部分。

服务器配置

MCP 服务器需要通过支持 MCP 的客户端进行配置和连接。您需要在您的 MCP 客户端的配置文件中添加一个条目来指向此服务器。

以下是配置所需信息的示例,请根据您的客户端说明将其添加到相应的 JSON 配置文件中:

  • 服务器名称 (Server Name): 您可以为此服务器指定一个名称,例如 '"sitemap"'。
  • 启动命令 (Command): 客户端需要执行的命令来启动服务器。对于此项目,通常是 '"uvx"'。
  • 命令参数 (Args): 启动命令所需的参数。对于此项目,参数是 '["sitemap-mcp-server"]'。
  • 环境变量 (Env): 可以设置环境变量来配置服务器的行为,例如指定传输协议。常见的设置是 '{"TRANSPORT": "stdio"}' 或 '{"TRANSPORT": "sse"}'。请注意,'stdio' 是通过标准输入输出通信,而 'sse' (Server-Sent Events) 通常需要服务器监听一个端口。

请查阅您的 MCP 客户端文档,了解如何在 JSON 配置文件中组织这些信息。

例如,在 Claude Desktop 的 'claude_desktop_config.json' 文件的 '"mcpServers"' 部分中,您可能会看到类似这样的结构(但请勿直接复制此代码块,而是根据您的客户端文档格式配置上述信息):

{
  "mcpServers": {
    "sitemap": {
      "command": "uvx",
      "args": ["sitemap-mcp-server"],
      "env": { "TRANSPORT": "stdio" }
    }
    // 可能有其他服务器配置
  }
}

配置完成后,重启您的 MCP 客户端,服务器应该会自动启动并注册其工具和 Prompt 模板。

基本使用方法

连接配置成功后,此 MCP 服务器提供的功能将集成到您的 LLM 客户端界面中:

  1. 使用 Prompt 模板: 在客户端的聊天界面中,查找或访问“模板”功能。您应该能看到此服务器提供的 Prompt 模板列表(例如,“分析 Sitemap”、“检查 Sitemap 健康”等)。选择一个模板,然后根据提示输入网站 URL 或其他必要信息。LLM 将使用服务器提供的模板和工具来完成任务。
  2. 直接调用工具: 如果您的客户端支持直接调用工具,您可以让 LLM 直接使用 'get_sitemap_tree', 'get_sitemap_pages', 'get_sitemap_stats', 'parse_sitemap_content' 等工具,并提供相应的参数(如网站 URL)。LLM 将获得结构化的 JSON 数据作为工具调用结果。

通过上述方式,您可以使用 LLM 轻松地探索和分析网站的结构和内容。

信息

分类

网页与API