Wayback MCP Server

使用说明

项目简介

Wayback MCP Server 是一个基于 Model Context Protocol (MCP) 构建的服务器,它充当 MCP 客户端和 互联网档案馆时光机 (Wayback Machine) 之间的桥梁。通过此服务器,LLM 应用可以利用 MCP 协议的标准方式,便捷地访问互联网档案馆的历史网页数据。该服务器提供工具 (Tools) 用于检索网页快照信息和获取存档页面内容,并支持资源 (Resources) 模板直接访问存档网页。

主要功能点

  1. 检索网页快照 (get_snapshots 工具)

    • 允许 LLM 查询指定 URL 在 Wayback Machine 中的历史快照列表。
    • 支持按时间范围、快照数量和 URL 匹配类型进行过滤。
  2. 获取存档网页内容 (get_archived_page 工具)

    • 允许 LLM 获取指定 URL 和时间戳的存档网页内容。
    • 可以选择获取包含或不包含 Wayback Machine 标头的原始网页内容。
  3. 访问存档网页资源 (wayback:// 资源模板)

    • 提供 'wayback://{url}/{timestamp}' 格式的资源 URI,允许 LLM 直接访问特定 URL 和时间戳的存档网页内容。

安装步骤

  1. 克隆仓库

    git clone https://github.com/Cyreslab-AI/wayback-mcp-server.git
    cd wayback-mcp-server
  2. 安装依赖

    npm install
  3. 构建项目

    npm run build

服务器配置

要将 Wayback MCP Server 添加到 MCP 客户端,您需要在客户端的 MCP 设置文件中配置服务器信息。以下是一个示例配置,您需要根据实际情况修改 'command' 和 'args' 中的路径:

{
  "mcpServers": {
    "wayback-machine": {
      "command": "node",  // 启动服务器的命令,这里使用 Node.js 运行
      "args": ["/path/to/wayback-server/build/index.js"], // 启动命令的参数,指向构建后的服务器入口文件。请将 "/path/to/wayback-server" 替换为您的仓库实际路径
      "env": {},         // 环境变量,当前配置为空
      "disabled": false,  // 是否禁用该服务器,false 表示启用
      "autoApprove": []  // 自动批准的工具列表,当前配置为空
    }
  }
}

配置参数说明:

  • 'server name': 服务器名称,例如 '"wayback-machine"',在客户端调用工具或资源时使用。
  • 'command': 运行服务器的命令,通常为 Node.js 环境下的 'node'。
  • 'args': 命令参数,指向服务器入口文件 'build/index.js' 的绝对路径。请务必将 '/path/to/wayback-server' 替换为仓库在您本地文件系统中的实际路径。
  • 'env': 服务器运行所需的环境变量,默认为空。
  • 'disabled': 设置为 'false' 表示启用该服务器。
  • 'autoApprove': 自动批准的工具列表,允许客户端无需用户确认即可调用这些工具,默认为空。

基本使用方法

配置完成后,您可以在 MCP 客户端中使用以下方法来使用 Wayback MCP Server 提供的功能:

  1. 使用 'get_snapshots' 工具检索网页快照:

    use_mcp_tool(
      server_name="wayback-machine",
      tool_name="get_snapshots",
      arguments={
        "url": "example.com",
        "from": "20230101",
        "to": "20231231"
      }
    )

    这将调用 'wayback-machine' 服务器的 'get_snapshots' 工具,检索 'example.com' 在 2023 年的网页快照列表。

  2. 使用 'get_archived_page' 工具获取存档网页内容:

    use_mcp_tool(
      server_name="wayback-machine",
      tool_name="get_archived_page",
      arguments={
        "url": "example.com",
        "timestamp": "20231026100000"
      }
    )

    这将获取 'example.com' 在 2023 年 10 月 26 日 10:00:00 的存档网页内容。

  3. 使用 'wayback://' 资源模板访问存档网页:

    access_mcp_resource(
      server_name="wayback-machine",
      uri="wayback://example.com/20231026100000"
    )

    这将直接访问 'wayback://example.com/20231026100000' 资源,获取对应的存档网页内容。

请根据您的 MCP 客户端的具体使用方式调用上述函数或方法,并根据需要调整工具参数和资源 URI。

服务器信息