项目简介

DocReader MCP 工具是一个基于 Model Context Protocol (MCP) 构建的应用后端，专为大型语言模型（LLMs）设计。它允许LLMs通过标准化的接口访问和处理文档内容，支持从指定文档网站进行搜索、内容提取和信息总结，从而帮助LLM更准确地回答与文档相关的问题。

主要功能点

搜索文档： 在指定的文档网站中查找与用户查询最相关的页面。
提取内容： 从指定的网页链接中提取主要文本内容。
总结信息： 根据之前搜索和提取到的内容，对用户的问题进行总结性回答。
一键阅读文档： 整合搜索、提取和总结步骤，一步完成从指定文档网站获取信息并回答问题的流程。

安装步骤

确保您的系统已安装 Python 3.7 或更高版本。

克隆或下载 DocReaderMCP 仓库到您的本地计算机。
使用终端或命令行进入仓库所在的目录。

执行以下命令安装所需的Python库：

pip install fastmcp beautifulsoup4 requests openai python-dotenv

在仓库的根目录下创建一个名为 '.env' 的文件，并在其中添加您的API Key，用于访问LLM服务（例如，OpenAI 或 NetMind）：
```
API_KEY=您的API_KEY_在此
```
请将 '您的API_KEY_在此' 替换为您实际的API Key。

服务器配置

DocReader 是一个为MCP客户端（如某些支持MCP的LLM应用或IDE插件）提供服务的MCP服务器。要使用它，您通常不需要手动启动服务器，而是需要在您的MCP客户端中进行配置。

配置时，客户端会要求您指定如何启动 DocReader MCP 工具作为一个独立的进程。您需要提供：

服务器名称 (Server Name): 给这个工具起一个易于识别的名称，例如 'DocReader'。
启动命令 (Command): 用于执行 DocReader 脚本的命令。如果您安装了 'fastmcp' CLI，可以使用 'fastmcp' 作为命令。您也可以直接使用 'python' 命令。
启动参数 (Arguments): 传递给启动命令的参数列表。
- 如果 Command 是 'fastmcp'，参数列表通常是 'run' 和 'DocReader.py' 文件相对于您的当前目录的路径，例如 '["run", "DocReader.py"]'。
- 如果 Command 是 'python'，参数列表就是 'DocReader.py' 文件相对于您的当前目录的路径，例如 '["DocReader.py"]'。
描述 (Description): （可选）通常客户端可以自动获取，用于显示工具的功能说明。

请根据您的客户端界面和实际文件路径进行配置。客户端会负责在需要时启动 DocReader 服务器进程并通过标准输入/输出（Stdio）与它通信。

基本使用方法

一旦DocReader MCP工具在您的LLM客户端中成功配置并启动，LLM就可以通过MCP协议调用其提供的工具函数。

您可以直接向LLM提出关于某个文档网站的问题，例如：“请使用 DocReader 工具，从 [文档网站URL] 中找到关于 [某个主题] 的信息，并回答我 [我的问题]”。LLM会识别出您的意图，并自动调用 'read_doc' 工具，提供文档URL和您的问题作为参数。DocReader 服务器将执行搜索、提取和总结的整个流程，并将最终答案返回给LLM，再由LLM呈现给您。

或者，如果LLM或客户端支持更精细的工具调用，它也可以分步骤调用：先调用 'search_docs' 找到相关页面URL，然后调用 'extract_content' 获取页面内容，最后调用 'summarize_findings' 根据内容回答问题。

具体的交互方式取决于您使用的LLM客户端如何集成和呈现MCP工具的能力。

关键词

项目简介

主要功能点

安装步骤

服务器配置

基本使用方法

信息