PaperSearch (arXiv) MCP 服务器使用说明

项目简介

PaperSearch 是一个实现了 Model Context Protocol (MCP) 的服务器,专注于提供 arXiv 论文搜索功能。它允许用户通过 MCP 客户端调用 'papersearch' 工具,根据关键词、研究领域和时间范围检索 arXiv 上的最新学术论文,并以结构化的文本形式返回检索结果。

主要功能点

  • arXiv 论文搜索: 核心功能是连接 arXiv 数据库,根据用户指定的条件(关键词、研究领域、时间范围等)搜索相关的学术论文。
  • 关键词和领域过滤: 支持通过关键词在论文标题和摘要中进行检索,并可指定研究领域进行筛选,提高搜索结果的准确性。
  • 相关性排序: 根据关键词计算论文的相关性得分,并根据得分和发布日期对搜索结果进行排序,优先展示更相关的最新论文。
  • 结果格式化: 将搜索到的论文信息(标题、作者、摘要、发布日期、分类、链接等)格式化为易于阅读的文本,方便 LLM 理解和展示。
  • MCP 协议支持: 完全兼容 MCP 协议,可以通过标准的 JSON-RPC 协议与 MCP 客户端通信,实现工具注册、调用等功能。

安装步骤

  1. 克隆仓库
    git clone https://github.com/Lincest/mcp-papersearch.git
    cd mcp-papersearch
  2. 创建并激活虚拟环境 (推荐)
    python -m venv venv
    source venv/bin/activate  # Linux/macOS
    venv\Scripts\activate  # Windows
  3. 安装依赖 虽然仓库中没有 'requirements.txt' 文件,但根据代码内容,你需要安装 'mcp' 和 'arxiv' 库。
    pip install mcp arxiv

服务器配置

为了让 MCP 客户端能够连接到 PaperSearch 服务器,您需要在客户端配置中添加以下服务器信息。这是一个 JSON 格式的配置示例,您需要将其添加到您的 MCP 客户端的服务器配置中。

{
  "serverName": "papersearch",
  "command": "/path/to/python",  // 请替换为您的 Python 解释器路径
  "args": [
    "-m",
    "papersearch.server"
  ]
}

配置参数说明:

  • '"serverName"': 服务器的名称,客户端使用此名称来标识和调用该服务器,设置为 '"papersearch"'。
  • '"command"': 启动 PaperSearch 服务器的命令。这里需要指定您系统中 Python 解释器的完整路径。
    • 查找 Python 路径的方法:
      • Linux/macOS: 在终端中输入 'which python3' 或 'which python' (取决于您的 Python 版本和别名设置) 可以找到 Python 解释器的路径,例如 '/usr/bin/python3' 或 '/usr/local/bin/python3'。
      • Windows: 在命令提示符或 PowerShell 中输入 'where python' 可以找到 Python 解释器的路径,例如 'C:\Python39\python.exe' 或 'C:\Users\YourUsername\AppData\Local\Programs\Python\Python39\python.exe'。
    • 请将 '/path/to/python' 替换为您实际的 Python 解释器路径。
  • '"args"': 传递给 Python 解释器的参数,用于启动 PaperSearch 服务器。
    • '"-m papersearch.server"' 表示以模块的方式运行 'papersearch.server' 模块。Python 将会查找名为 'papersearch.server' 的模块并执行它。这实际上会执行 'src/papersearch/server.py' 文件中的 'main()' 函数,从而启动 PaperSearch MCP 服务器。

配置示例 (假设 Python 路径为 '/usr/bin/python3'):

{
  "serverName": "papersearch",
  "command": "/usr/bin/python3",
  "args": [
    "-m",
    "papersearch.server"
  ]
}

基本使用方法

  1. 启动服务器: 配置好 MCP 客户端后,当客户端需要使用 'papersearch' 工具时,会自动启动 PaperSearch 服务器。您无需手动运行服务器,它会根据客户端的请求按需启动。
  2. 调用 'papersearch' 工具: 在您的 MCP 客户端中,可以使用 'papersearch' 作为工具名称来调用论文搜索功能。您可以传递以下参数来控制搜索行为:
    • 'days': 搜索最近多少天内发布的论文 (默认 7 天)。
    • 'query_type': 搜索类型,可以是 "moe" (默认,搜索 Mixture of Experts 相关论文),也可以直接输入 arXiv ID (例如 "2103.03404") 精确查找。
    • 'max_results': 返回的最大论文数量 (默认 100 篇)。
    • 'field': 指定研究领域,例如 "cs.AI" (人工智能), "cs.CV" (计算机视觉) 等。如果不指定则搜索所有领域。
    • 'keywords': 关键词列表,用于在论文标题和摘要中进行检索。

工具调用示例 (JSON 格式,用于 MCP 客户端):

{
  "tool_calls": [
    {
      "name": "papersearch",
      "arguments": {
        "keywords": ["large language model", "prompt engineering"],
        "days": 30,
        "max_results": 10
      }
    }
  ]
}

这个示例会搜索最近 30 天内,标题或摘要包含 "large language model" 或 "prompt engineering" 关键词的论文,最多返回 10 篇结果。

通过配置和调用 'papersearch' 工具,您可以在支持 MCP 协议的 LLM 应用中轻松集成 arXiv 论文搜索功能,为 LLM 提供最新的学术信息。

信息

分类

网页与API