Web Research Server 使用说明
项目简介
Web Research Server 是一个基于 Model Context Protocol (MCP) 构建的应用后端,旨在为大型语言模型 (LLM) 提供实时的网络信息检索能力。通过集成 Google 搜索、网页内容提取和屏幕截图功能,该服务器允许 LLM 客户端(如 Claude)访问和利用最新的网络信息,从而提升 LLM 在需要实时数据支持任务中的性能。
主要功能点
- Google 搜索集成:支持通过 Google 搜索引擎进行关键词搜索,快速获取网络信息。
- 网页内容提取:能够访问指定的网页 URL,并提取网页的主要内容,转换为 Markdown 格式以便 LLM 理解和处理。
- 屏幕截图:可以捕获当前访问网页的屏幕截图,作为资源提供给 LLM,用于视觉信息的理解或辅助分析。
- 研究会话跟踪:服务器会跟踪用户的研究会话,记录搜索查询、访问页面、提取内容和屏幕截图等信息,方便用户回顾和管理研究过程。
- 资源管理:将屏幕截图和研究会话信息作为 MCP 资源进行管理和提供,LLM 客户端可以通过标准化的方式访问这些资源。
- 预置 Prompt 模板:提供 'agentic-research' Prompt 模板,引导 LLM 进行深入的网络研究,并与用户进行交互式的研究方向调整。
安装步骤
- 确保已安装 Claude Desktop app 客户端。
- 打开 Claude Desktop app 的配置文件 'claude_desktop_config.json'。该文件通常位于:
- macOS: '~/Library/Application\ Support/Claude/claude_desktop_config.json'
- (其他操作系统请参考 Claude Desktop app 的文档)
- 在 'claude_desktop_config.json' 文件中,找到 '"mcpServers"' 字段(如果不存在则手动创建),并添加以下配置信息。
服务器配置
{ "mcpServers": { "webresearch": { "command": "npx", "args": ["-y", "@mzxrai/mcp-webresearch@latest"] } } }
配置参数说明:
- '"webresearch"': 为当前 MCP 服务器配置项自定义的名称,可以根据需要修改。
- '"command": "npx"': 指定启动服务器的命令为 'npx',用于执行 npm 包。
- '"args": ["-y", "@mzxrai/mcp-webresearch@latest"]': 'npx' 命令的参数,用于安装并运行最新版本的 '@mzxrai/mcp-webresearch' npm 包。'-y' 参数表示自动确认安装过程中的提示。
注意:请确保你的系统已安装 Node.js 和 npm。
基本使用方法
- 启动 Claude Desktop app 客户端。
- 与 Claude 开始对话,当你的 Prompt 涉及到需要网络信息时,Web Research Server 将自动为 Claude 提供网络搜索和信息提取能力。
- 使用预置 Prompt 模板 'agentic-research' 进行深入研究:
- 在 Claude 聊天输入框中,点击 Paperclip 图标。
- 选择 “Choose an integration” -> “webresearch” -> “agentic-research”。
- 按照 Prompt 的引导,输入研究主题,Claude 将使用 Web Research Server 进行深入的网络研究,并与你进行交互。
- 直接在 Prompt 中使用网络信息需求:
- 你也可以直接在 Prompt 中提出需要网络信息的问题,例如:“搜索今天关于人工智能的新闻”,“访问维基百科关于量子力学的页面并提取内容”。Web Research Server 会根据 Claude 的请求,自动调用相应的工具进行网络搜索或页面访问。
- 访问资源:
- 点击 Claude 聊天输入框中的 Paperclip 图标,选择 “MCP Resources”。
- 你可以查看和访问 Web Research Server 提供的资源,包括网页屏幕截图和研究会话摘要。屏幕截图以图片形式展示,研究会话摘要则提供 JSON 格式的会话信息,包含搜索查询、访问过的页面链接等。
工具 (Tools)
Web Research Server 提供了以下工具供 LLM 调用:
- 'search_google': 执行 Google 搜索并返回搜索结果。
- 参数: '{ query: string }','query' 为搜索关键词。
- 'visit_page': 访问指定的网页 URL 并提取网页内容。
- 参数: '{ url: string, takeScreenshot?: boolean }','url' 为网页 URL,'takeScreenshot' (可选) 为布尔值,指示是否需要截取网页屏幕截图。
- 'take_screenshot': 截取当前页面的屏幕截图。
- 无需参数。
Prompt 模板 (Prompts)
- 'agentic-research': 一个引导 LLM 进行迭代式网络研究的 Prompt 模板。它指示 LLM 从广泛的搜索开始,逐步细化研究方向,优先考虑高质量的权威来源,并在研究过程中与用户保持沟通,引用来源 URL。
资源 (Resources)
Web Research Server 将以下内容作为 MCP 资源提供:
- 屏幕截图: 通过 'take_screenshot' 工具或 'visit_page' 工具(当 'takeScreenshot' 参数为 'true' 时)捕获的网页屏幕截图。
- 研究会话: 记录当前研究会话的摘要信息,包括搜索查询、访问过的页面、提取的内容和屏幕截图的元数据。
建议
- 如果不使用 'agentic-research' Prompt 模板,在进行通用主题研究时,建议在 Prompt 中指定高质量的信息来源,例如 “从路透社或美联社获取今日新闻”,以提高搜索结果的质量。
问题
- 该项目目前处于 pre-alpha 阶段,可能存在 bug。如果遇到问题,可以查看 Claude Desktop 的 MCP 日志:'tail -n 20 -f ~/Library/Logs/Claude/mcp*.log' (macOS)。
信息
分类
网页与API