项目简介
DocReader MCP 工具是一个基于 Model Context Protocol (MCP) 构建的应用后端,专为大型语言模型(LLMs)设计。它允许LLMs通过标准化的接口访问和处理文档内容,支持从指定文档网站进行搜索、内容提取和信息总结,从而帮助LLM更准确地回答与文档相关的问题。
主要功能点
- 搜索文档: 在指定的文档网站中查找与用户查询最相关的页面。
- 提取内容: 从指定的网页链接中提取主要文本内容。
- 总结信息: 根据之前搜索和提取到的内容,对用户的问题进行总结性回答。
- 一键阅读文档: 整合搜索、提取和总结步骤,一步完成从指定文档网站获取信息并回答问题的流程。
安装步骤
确保您的系统已安装 Python 3.7 或更高版本。
- 克隆或下载 DocReaderMCP 仓库到您的本地计算机。
- 使用终端或命令行进入仓库所在的目录。
- 执行以下命令安装所需的Python库:
pip install fastmcp beautifulsoup4 requests openai python-dotenv - 在仓库的根目录下创建一个名为 '.env' 的文件,并在其中添加您的API Key,用于访问LLM服务(例如,OpenAI 或 NetMind):
请将 '您的API_KEY_在此' 替换为您实际的API Key。API_KEY=您的API_KEY_在此
服务器配置
DocReader 是一个为MCP客户端(如某些支持MCP的LLM应用或IDE插件)提供服务的MCP服务器。要使用它,您通常不需要手动启动服务器,而是需要在您的MCP客户端中进行配置。
配置时,客户端会要求您指定如何启动 DocReader MCP 工具作为一个独立的进程。您需要提供:
- 服务器名称 (Server Name): 给这个工具起一个易于识别的名称,例如 'DocReader'。
- 启动命令 (Command): 用于执行 DocReader 脚本的命令。如果您安装了 'fastmcp' CLI,可以使用 'fastmcp' 作为命令。您也可以直接使用 'python' 命令。
- 启动参数 (Arguments): 传递给启动命令的参数列表。
- 如果 Command 是 'fastmcp',参数列表通常是 'run' 和 'DocReader.py' 文件相对于您的当前目录的路径,例如 '["run", "DocReader.py"]'。
- 如果 Command 是 'python',参数列表就是 'DocReader.py' 文件相对于您的当前目录的路径,例如 '["DocReader.py"]'。
- 描述 (Description): (可选)通常客户端可以自动获取,用于显示工具的功能说明。
请根据您的客户端界面和实际文件路径进行配置。客户端会负责在需要时启动 DocReader 服务器进程并通过标准输入/输出(Stdio)与它通信。
基本使用方法
一旦DocReader MCP工具在您的LLM客户端中成功配置并启动,LLM就可以通过MCP协议调用其提供的工具函数。
您可以直接向LLM提出关于某个文档网站的问题,例如:“请使用 DocReader 工具,从 [文档网站URL] 中找到关于 [某个主题] 的信息,并回答我 [我的问题]”。LLM会识别出您的意图,并自动调用 'read_doc' 工具,提供文档URL和您的问题作为参数。DocReader 服务器将执行搜索、提取和总结的整个流程,并将最终答案返回给LLM,再由LLM呈现给您。
或者,如果LLM或客户端支持更精细的工具调用,它也可以分步骤调用:先调用 'search_docs' 找到相关页面URL,然后调用 'extract_content' 获取页面内容,最后调用 'summarize_findings' 根据内容回答问题。
具体的交互方式取决于您使用的LLM客户端如何集成和呈现MCP工具的能力。
信息
分类
AI与计算