PaperSearch (arXiv) MCP 服务器使用说明
项目简介
PaperSearch 是一个实现了 Model Context Protocol (MCP) 的服务器,专注于提供 arXiv 论文搜索功能。它允许用户通过 MCP 客户端调用 'papersearch' 工具,根据关键词、研究领域和时间范围检索 arXiv 上的最新学术论文,并以结构化的文本形式返回检索结果。
主要功能点
- arXiv 论文搜索: 核心功能是连接 arXiv 数据库,根据用户指定的条件(关键词、研究领域、时间范围等)搜索相关的学术论文。
- 关键词和领域过滤: 支持通过关键词在论文标题和摘要中进行检索,并可指定研究领域进行筛选,提高搜索结果的准确性。
- 相关性排序: 根据关键词计算论文的相关性得分,并根据得分和发布日期对搜索结果进行排序,优先展示更相关的最新论文。
- 结果格式化: 将搜索到的论文信息(标题、作者、摘要、发布日期、分类、链接等)格式化为易于阅读的文本,方便 LLM 理解和展示。
- MCP 协议支持: 完全兼容 MCP 协议,可以通过标准的 JSON-RPC 协议与 MCP 客户端通信,实现工具注册、调用等功能。
安装步骤
- 克隆仓库
git clone https://github.com/Lincest/mcp-papersearch.git cd mcp-papersearch - 创建并激活虚拟环境 (推荐)
python -m venv venv source venv/bin/activate # Linux/macOS venv\Scripts\activate # Windows - 安装依赖
虽然仓库中没有 'requirements.txt' 文件,但根据代码内容,你需要安装 'mcp' 和 'arxiv' 库。
pip install mcp arxiv
服务器配置
为了让 MCP 客户端能够连接到 PaperSearch 服务器,您需要在客户端配置中添加以下服务器信息。这是一个 JSON 格式的配置示例,您需要将其添加到您的 MCP 客户端的服务器配置中。
{ "serverName": "papersearch", "command": "/path/to/python", // 请替换为您的 Python 解释器路径 "args": [ "-m", "papersearch.server" ] }
配置参数说明:
- '"serverName"': 服务器的名称,客户端使用此名称来标识和调用该服务器,设置为 '"papersearch"'。
- '"command"': 启动 PaperSearch 服务器的命令。这里需要指定您系统中 Python 解释器的完整路径。
- 查找 Python 路径的方法:
- Linux/macOS: 在终端中输入 'which python3' 或 'which python' (取决于您的 Python 版本和别名设置) 可以找到 Python 解释器的路径,例如 '/usr/bin/python3' 或 '/usr/local/bin/python3'。
- Windows: 在命令提示符或 PowerShell 中输入 'where python' 可以找到 Python 解释器的路径,例如 'C:\Python39\python.exe' 或 'C:\Users\YourUsername\AppData\Local\Programs\Python\Python39\python.exe'。
- 请将 '/path/to/python' 替换为您实际的 Python 解释器路径。
- 查找 Python 路径的方法:
- '"args"': 传递给 Python 解释器的参数,用于启动 PaperSearch 服务器。
- '"-m papersearch.server"' 表示以模块的方式运行 'papersearch.server' 模块。Python 将会查找名为 'papersearch.server' 的模块并执行它。这实际上会执行 'src/papersearch/server.py' 文件中的 'main()' 函数,从而启动 PaperSearch MCP 服务器。
配置示例 (假设 Python 路径为 '/usr/bin/python3'):
{ "serverName": "papersearch", "command": "/usr/bin/python3", "args": [ "-m", "papersearch.server" ] }
基本使用方法
- 启动服务器: 配置好 MCP 客户端后,当客户端需要使用 'papersearch' 工具时,会自动启动 PaperSearch 服务器。您无需手动运行服务器,它会根据客户端的请求按需启动。
- 调用 'papersearch' 工具: 在您的 MCP 客户端中,可以使用 'papersearch' 作为工具名称来调用论文搜索功能。您可以传递以下参数来控制搜索行为:
- 'days': 搜索最近多少天内发布的论文 (默认 7 天)。
- 'query_type': 搜索类型,可以是 "moe" (默认,搜索 Mixture of Experts 相关论文),也可以直接输入 arXiv ID (例如 "2103.03404") 精确查找。
- 'max_results': 返回的最大论文数量 (默认 100 篇)。
- 'field': 指定研究领域,例如 "cs.AI" (人工智能), "cs.CV" (计算机视觉) 等。如果不指定则搜索所有领域。
- 'keywords': 关键词列表,用于在论文标题和摘要中进行检索。
工具调用示例 (JSON 格式,用于 MCP 客户端):
{ "tool_calls": [ { "name": "papersearch", "arguments": { "keywords": ["large language model", "prompt engineering"], "days": 30, "max_results": 10 } } ] }
这个示例会搜索最近 30 天内,标题或摘要包含 "large language model" 或 "prompt engineering" 关键词的论文,最多返回 10 篇结果。
通过配置和调用 'papersearch' 工具,您可以在支持 MCP 协议的 LLM 应用中轻松集成 arXiv 论文搜索功能,为 LLM 提供最新的学术信息。
信息
分类
网页与API