Web Research Server 使用说明

项目简介

Web Research Server 是一个基于 Model Context Protocol (MCP) 构建的应用后端,旨在为大型语言模型 (LLM) 提供实时的网络信息检索能力。通过集成 Google 搜索、网页内容提取和屏幕截图功能,该服务器允许 LLM 客户端(如 Claude)访问和利用最新的网络信息,从而提升 LLM 在需要实时数据支持任务中的性能。

主要功能点

  • Google 搜索集成:支持通过 Google 搜索引擎进行关键词搜索,快速获取网络信息。
  • 网页内容提取:能够访问指定的网页 URL,并提取网页的主要内容,转换为 Markdown 格式以便 LLM 理解和处理。
  • 屏幕截图:可以捕获当前访问网页的屏幕截图,作为资源提供给 LLM,用于视觉信息的理解或辅助分析。
  • 研究会话跟踪:服务器会跟踪用户的研究会话,记录搜索查询、访问页面、提取内容和屏幕截图等信息,方便用户回顾和管理研究过程。
  • 资源管理:将屏幕截图和研究会话信息作为 MCP 资源进行管理和提供,LLM 客户端可以通过标准化的方式访问这些资源。
  • 预置 Prompt 模板:提供 'agentic-research' Prompt 模板,引导 LLM 进行深入的网络研究,并与用户进行交互式的研究方向调整。

安装步骤

  1. 确保已安装 Claude Desktop app 客户端。
  2. 打开 Claude Desktop app 的配置文件 'claude_desktop_config.json'。该文件通常位于:
    • macOS: '~/Library/Application\ Support/Claude/claude_desktop_config.json'
    • (其他操作系统请参考 Claude Desktop app 的文档)
  3. 在 'claude_desktop_config.json' 文件中,找到 '"mcpServers"' 字段(如果不存在则手动创建),并添加以下配置信息。

服务器配置

{
  "mcpServers": {
    "webresearch": {
      "command": "npx",
      "args": ["-y", "@mzxrai/mcp-webresearch@latest"]
    }
  }
}

配置参数说明:

  • '"webresearch"': 为当前 MCP 服务器配置项自定义的名称,可以根据需要修改。
  • '"command": "npx"': 指定启动服务器的命令为 'npx',用于执行 npm 包。
  • '"args": ["-y", "@mzxrai/mcp-webresearch@latest"]': 'npx' 命令的参数,用于安装并运行最新版本的 '@mzxrai/mcp-webresearch' npm 包。'-y' 参数表示自动确认安装过程中的提示。

注意:请确保你的系统已安装 Node.js 和 npm。

基本使用方法

  1. 启动 Claude Desktop app 客户端。
  2. 与 Claude 开始对话,当你的 Prompt 涉及到需要网络信息时,Web Research Server 将自动为 Claude 提供网络搜索和信息提取能力。
  3. 使用预置 Prompt 模板 'agentic-research' 进行深入研究
    • 在 Claude 聊天输入框中,点击 Paperclip 图标
    • 选择 “Choose an integration” -> “webresearch” -> “agentic-research”
    • 按照 Prompt 的引导,输入研究主题,Claude 将使用 Web Research Server 进行深入的网络研究,并与你进行交互。
  4. 直接在 Prompt 中使用网络信息需求
    • 你也可以直接在 Prompt 中提出需要网络信息的问题,例如:“搜索今天关于人工智能的新闻”,“访问维基百科关于量子力学的页面并提取内容”。Web Research Server 会根据 Claude 的请求,自动调用相应的工具进行网络搜索或页面访问。
  5. 访问资源
    • 点击 Claude 聊天输入框中的 Paperclip 图标,选择 “MCP Resources”
    • 你可以查看和访问 Web Research Server 提供的资源,包括网页屏幕截图和研究会话摘要。屏幕截图以图片形式展示,研究会话摘要则提供 JSON 格式的会话信息,包含搜索查询、访问过的页面链接等。

工具 (Tools)

Web Research Server 提供了以下工具供 LLM 调用:

  1. 'search_google': 执行 Google 搜索并返回搜索结果。
    • 参数: '{ query: string }','query' 为搜索关键词。
  2. 'visit_page': 访问指定的网页 URL 并提取网页内容。
    • 参数: '{ url: string, takeScreenshot?: boolean }','url' 为网页 URL,'takeScreenshot' (可选) 为布尔值,指示是否需要截取网页屏幕截图。
  3. 'take_screenshot': 截取当前页面的屏幕截图。
    • 无需参数。

Prompt 模板 (Prompts)

  • 'agentic-research': 一个引导 LLM 进行迭代式网络研究的 Prompt 模板。它指示 LLM 从广泛的搜索开始,逐步细化研究方向,优先考虑高质量的权威来源,并在研究过程中与用户保持沟通,引用来源 URL。

资源 (Resources)

Web Research Server 将以下内容作为 MCP 资源提供:

  1. 屏幕截图: 通过 'take_screenshot' 工具或 'visit_page' 工具(当 'takeScreenshot' 参数为 'true' 时)捕获的网页屏幕截图。
  2. 研究会话: 记录当前研究会话的摘要信息,包括搜索查询、访问过的页面、提取的内容和屏幕截图的元数据。

建议

  • 如果不使用 'agentic-research' Prompt 模板,在进行通用主题研究时,建议在 Prompt 中指定高质量的信息来源,例如 “从路透社或美联社获取今日新闻”,以提高搜索结果的质量。

问题

  • 该项目目前处于 pre-alpha 阶段,可能存在 bug。如果遇到问题,可以查看 Claude Desktop 的 MCP 日志:'tail -n 20 -f ~/Library/Logs/Claude/mcp*.log' (macOS)。

信息

分类

网页与API