Web Research Server 使用说明

项目简介

Web Research Server 是一个基于 Model Context Protocol (MCP) 构建的应用后端，旨在为大型语言模型 (LLM) 提供实时的网络信息检索能力。通过集成 Google 搜索、网页内容提取和屏幕截图功能，该服务器允许 LLM 客户端（如 Claude）访问和利用最新的网络信息，从而提升 LLM 在需要实时数据支持任务中的性能。

主要功能点

Google 搜索集成：支持通过 Google 搜索引擎进行关键词搜索，快速获取网络信息。
网页内容提取：能够访问指定的网页 URL，并提取网页的主要内容，转换为 Markdown 格式以便 LLM 理解和处理。
屏幕截图：可以捕获当前访问网页的屏幕截图，作为资源提供给 LLM，用于视觉信息的理解或辅助分析。
研究会话跟踪：服务器会跟踪用户的研究会话，记录搜索查询、访问页面、提取内容和屏幕截图等信息，方便用户回顾和管理研究过程。
资源管理：将屏幕截图和研究会话信息作为 MCP 资源进行管理和提供，LLM 客户端可以通过标准化的方式访问这些资源。
预置 Prompt 模板：提供 'agentic-research' Prompt 模板，引导 LLM 进行深入的网络研究，并与用户进行交互式的研究方向调整。

安装步骤

确保已安装 Claude Desktop app 客户端。
打开 Claude Desktop app 的配置文件 'claude_desktop_config.json'。该文件通常位于：
- macOS: '~/Library/Application\ Support/Claude/claude_desktop_config.json'
- (其他操作系统请参考 Claude Desktop app 的文档)
在 'claude_desktop_config.json' 文件中，找到 '"mcpServers"' 字段（如果不存在则手动创建），并添加以下配置信息。

服务器配置

{
  "mcpServers": {
    "webresearch": {
      "command": "npx",
      "args": ["-y", "@mzxrai/mcp-webresearch@latest"]
    }
  }
}

配置参数说明：

'"webresearch"': 为当前 MCP 服务器配置项自定义的名称，可以根据需要修改。
'"command": "npx"': 指定启动服务器的命令为 'npx'，用于执行 npm 包。
'"args": ["-y", "@mzxrai/mcp-webresearch@latest"]': 'npx' 命令的参数，用于安装并运行最新版本的 '@mzxrai/mcp-webresearch' npm 包。'-y' 参数表示自动确认安装过程中的提示。

注意：请确保你的系统已安装 Node.js 和 npm。

基本使用方法

启动 Claude Desktop app 客户端。
与 Claude 开始对话，当你的 Prompt 涉及到需要网络信息时，Web Research Server 将自动为 Claude 提供网络搜索和信息提取能力。
使用预置 Prompt 模板 'agentic-research' 进行深入研究：
- 在 Claude 聊天输入框中，点击 Paperclip 图标。
- 选择 “Choose an integration” -> “webresearch” -> “agentic-research”。
- 按照 Prompt 的引导，输入研究主题，Claude 将使用 Web Research Server 进行深入的网络研究，并与你进行交互。
直接在 Prompt 中使用网络信息需求：
- 你也可以直接在 Prompt 中提出需要网络信息的问题，例如：“搜索今天关于人工智能的新闻”，“访问维基百科关于量子力学的页面并提取内容”。Web Research Server 会根据 Claude 的请求，自动调用相应的工具进行网络搜索或页面访问。
访问资源：
- 点击 Claude 聊天输入框中的 Paperclip 图标，选择 “MCP Resources”。
- 你可以查看和访问 Web Research Server 提供的资源，包括网页屏幕截图和研究会话摘要。屏幕截图以图片形式展示，研究会话摘要则提供 JSON 格式的会话信息，包含搜索查询、访问过的页面链接等。

工具 (Tools)

Web Research Server 提供了以下工具供 LLM 调用：

'search_google': 执行 Google 搜索并返回搜索结果。
- 参数: '{ query: string }'，'query' 为搜索关键词。
'visit_page': 访问指定的网页 URL 并提取网页内容。
- 参数: '{ url: string, takeScreenshot?: boolean }'，'url' 为网页 URL，'takeScreenshot' (可选) 为布尔值，指示是否需要截取网页屏幕截图。
'take_screenshot': 截取当前页面的屏幕截图。
- 无需参数。

Prompt 模板 (Prompts)

'agentic-research': 一个引导 LLM 进行迭代式网络研究的 Prompt 模板。它指示 LLM 从广泛的搜索开始，逐步细化研究方向，优先考虑高质量的权威来源，并在研究过程中与用户保持沟通，引用来源 URL。

资源 (Resources)

Web Research Server 将以下内容作为 MCP 资源提供：

屏幕截图: 通过 'take_screenshot' 工具或 'visit_page' 工具（当 'takeScreenshot' 参数为 'true' 时）捕获的网页屏幕截图。
研究会话: 记录当前研究会话的摘要信息，包括搜索查询、访问过的页面、提取的内容和屏幕截图的元数据。

建议

如果不使用 'agentic-research' Prompt 模板，在进行通用主题研究时，建议在 Prompt 中指定高质量的信息来源，例如 “从路透社或美联社获取今日新闻”，以提高搜索结果的质量。

问题

该项目目前处于 pre-alpha 阶段，可能存在 bug。如果遇到问题，可以查看 Claude Desktop 的 MCP 日志：'tail -n 20 -f ~/Library/Logs/Claude/mcp*.log' (macOS)。

关键词