使用说明
项目简介
Wayback MCP Server 是一个基于 Model Context Protocol (MCP) 构建的服务器,它充当 MCP 客户端和 互联网档案馆时光机 (Wayback Machine) 之间的桥梁。通过此服务器,LLM 应用可以利用 MCP 协议的标准方式,便捷地访问互联网档案馆的历史网页数据。该服务器提供工具 (Tools) 用于检索网页快照信息和获取存档页面内容,并支持资源 (Resources) 模板直接访问存档网页。
主要功能点
-
检索网页快照 (get_snapshots 工具):
- 允许 LLM 查询指定 URL 在 Wayback Machine 中的历史快照列表。
- 支持按时间范围、快照数量和 URL 匹配类型进行过滤。
-
获取存档网页内容 (get_archived_page 工具):
- 允许 LLM 获取指定 URL 和时间戳的存档网页内容。
- 可以选择获取包含或不包含 Wayback Machine 标头的原始网页内容。
-
访问存档网页资源 (wayback:// 资源模板):
- 提供 'wayback://{url}/{timestamp}' 格式的资源 URI,允许 LLM 直接访问特定 URL 和时间戳的存档网页内容。
安装步骤
-
克隆仓库
git clone https://github.com/Cyreslab-AI/wayback-mcp-server.git cd wayback-mcp-server -
安装依赖
npm install -
构建项目
npm run build
服务器配置
要将 Wayback MCP Server 添加到 MCP 客户端,您需要在客户端的 MCP 设置文件中配置服务器信息。以下是一个示例配置,您需要根据实际情况修改 'command' 和 'args' 中的路径:
{ "mcpServers": { "wayback-machine": { "command": "node", // 启动服务器的命令,这里使用 Node.js 运行 "args": ["/path/to/wayback-server/build/index.js"], // 启动命令的参数,指向构建后的服务器入口文件。请将 "/path/to/wayback-server" 替换为您的仓库实际路径 "env": {}, // 环境变量,当前配置为空 "disabled": false, // 是否禁用该服务器,false 表示启用 "autoApprove": [] // 自动批准的工具列表,当前配置为空 } } }
配置参数说明:
- 'server name': 服务器名称,例如 '"wayback-machine"',在客户端调用工具或资源时使用。
- 'command': 运行服务器的命令,通常为 Node.js 环境下的 'node'。
- 'args': 命令参数,指向服务器入口文件 'build/index.js' 的绝对路径。请务必将 '/path/to/wayback-server' 替换为仓库在您本地文件系统中的实际路径。
- 'env': 服务器运行所需的环境变量,默认为空。
- 'disabled': 设置为 'false' 表示启用该服务器。
- 'autoApprove': 自动批准的工具列表,允许客户端无需用户确认即可调用这些工具,默认为空。
基本使用方法
配置完成后,您可以在 MCP 客户端中使用以下方法来使用 Wayback MCP Server 提供的功能:
-
使用 'get_snapshots' 工具检索网页快照:
use_mcp_tool( server_name="wayback-machine", tool_name="get_snapshots", arguments={ "url": "example.com", "from": "20230101", "to": "20231231" } )这将调用 'wayback-machine' 服务器的 'get_snapshots' 工具,检索 'example.com' 在 2023 年的网页快照列表。
-
使用 'get_archived_page' 工具获取存档网页内容:
use_mcp_tool( server_name="wayback-machine", tool_name="get_archived_page", arguments={ "url": "example.com", "timestamp": "20231026100000" } )这将获取 'example.com' 在 2023 年 10 月 26 日 10:00:00 的存档网页内容。
-
使用 'wayback://' 资源模板访问存档网页:
access_mcp_resource( server_name="wayback-machine", uri="wayback://example.com/20231026100000" )这将直接访问 'wayback://example.com/20231026100000' 资源,获取对应的存档网页内容。
请根据您的 MCP 客户端的具体使用方式调用上述函数或方法,并根据需要调整工具参数和资源 URI。
信息
分类
网页与API