使用说明

项目简介

Wayback MCP Server 是一个基于 Model Context Protocol (MCP) 构建的服务器,它充当 MCP 客户端和 互联网档案馆时光机 (Wayback Machine) 之间的桥梁。通过此服务器,LLM 应用可以利用 MCP 协议的标准方式,便捷地访问互联网档案馆的历史网页数据。该服务器提供工具 (Tools) 用于检索网页快照信息和获取存档页面内容,并支持资源 (Resources) 模板直接访问存档网页。

主要功能点

  1. 检索网页快照 (get_snapshots 工具)

    • 允许 LLM 查询指定 URL 在 Wayback Machine 中的历史快照列表。
    • 支持按时间范围、快照数量和 URL 匹配类型进行过滤。
  2. 获取存档网页内容 (get_archived_page 工具)

    • 允许 LLM 获取指定 URL 和时间戳的存档网页内容。
    • 可以选择获取包含或不包含 Wayback Machine 标头的原始网页内容。
  3. 访问存档网页资源 (wayback:// 资源模板)

    • 提供 'wayback://{url}/{timestamp}' 格式的资源 URI,允许 LLM 直接访问特定 URL 和时间戳的存档网页内容。

安装步骤

  1. 克隆仓库

    git clone https://github.com/Cyreslab-AI/wayback-mcp-server.git
    cd wayback-mcp-server
  2. 安装依赖

    npm install
  3. 构建项目

    npm run build

服务器配置

要将 Wayback MCP Server 添加到 MCP 客户端,您需要在客户端的 MCP 设置文件中配置服务器信息。以下是一个示例配置,您需要根据实际情况修改 'command' 和 'args' 中的路径:

{
  "mcpServers": {
    "wayback-machine": {
      "command": "node",  // 启动服务器的命令,这里使用 Node.js 运行
      "args": ["/path/to/wayback-server/build/index.js"], // 启动命令的参数,指向构建后的服务器入口文件。请将 "/path/to/wayback-server" 替换为您的仓库实际路径
      "env": {},         // 环境变量,当前配置为空
      "disabled": false,  // 是否禁用该服务器,false 表示启用
      "autoApprove": []  // 自动批准的工具列表,当前配置为空
    }
  }
}

配置参数说明:

  • 'server name': 服务器名称,例如 '"wayback-machine"',在客户端调用工具或资源时使用。
  • 'command': 运行服务器的命令,通常为 Node.js 环境下的 'node'。
  • 'args': 命令参数,指向服务器入口文件 'build/index.js' 的绝对路径。请务必将 '/path/to/wayback-server' 替换为仓库在您本地文件系统中的实际路径。
  • 'env': 服务器运行所需的环境变量,默认为空。
  • 'disabled': 设置为 'false' 表示启用该服务器。
  • 'autoApprove': 自动批准的工具列表,允许客户端无需用户确认即可调用这些工具,默认为空。

基本使用方法

配置完成后,您可以在 MCP 客户端中使用以下方法来使用 Wayback MCP Server 提供的功能:

  1. 使用 'get_snapshots' 工具检索网页快照:

    use_mcp_tool(
      server_name="wayback-machine",
      tool_name="get_snapshots",
      arguments={
        "url": "example.com",
        "from": "20230101",
        "to": "20231231"
      }
    )

    这将调用 'wayback-machine' 服务器的 'get_snapshots' 工具,检索 'example.com' 在 2023 年的网页快照列表。

  2. 使用 'get_archived_page' 工具获取存档网页内容:

    use_mcp_tool(
      server_name="wayback-machine",
      tool_name="get_archived_page",
      arguments={
        "url": "example.com",
        "timestamp": "20231026100000"
      }
    )

    这将获取 'example.com' 在 2023 年 10 月 26 日 10:00:00 的存档网页内容。

  3. 使用 'wayback://' 资源模板访问存档网页:

    access_mcp_resource(
      server_name="wayback-machine",
      uri="wayback://example.com/20231026100000"
    )

    这将直接访问 'wayback://example.com/20231026100000' 资源,获取对应的存档网页内容。

请根据您的 MCP 客户端的具体使用方式调用上述函数或方法,并根据需要调整工具参数和资源 URI。

信息

分类

网页与API