使用说明

项目简介

Paper Search MCP (Model Context Protocol) 服务器是一个基于 Python 的后端应用,旨在为大型语言模型 (LLM) 客户端提供学术论文检索和下载的功能。通过集成此 MCP 服务器,LLM 能够利用其提供的工具,扩展自身在学术研究领域的知识和能力,例如在对话中搜索最新的论文、下载 PDF 文件,甚至读取论文内容。

主要功能点

  • 多平台论文搜索: 支持从 arXiv, PubMed, bioRxiv 和 Google Scholar 多个学术平台搜索论文。
  • 论文信息标准化: 返回统一格式的论文元数据,方便 LLM 理解和处理。
  • PDF 下载: 支持从 arXiv 和 bioRxiv 下载论文 PDF 文件。
  • 论文内容读取: 支持读取 arXiv 和 bioRxiv 论文的 PDF 内容,提取文本信息。
  • 易于集成: 使用 MCP 协议,可以方便地与支持 MCP 协议的 LLM 客户端(如 Claude Desktop)集成。

安装步骤

  1. 安装 'paper-search-mcp' 包: 打开终端,运行以下命令安装 'paper-search-mcp' 包。

    uv add paper-search-mcp

    或者使用 pip:

    pip install paper-search-mcp
  2. 配置 Claude Desktop (或其他 MCP 客户端): 如果你的 LLM 客户端是 Claude Desktop,你需要修改其配置文件以连接到 Paper Search MCP 服务器。

    • 找到 Claude Desktop 的配置文件,通常位于:
      • macOS: '~/Library/Application Support/Claude/claude_desktop_config.json'
      • Windows: '%APPDATA%\Claude\claude_desktop_config.json'
    • 打开 'claude_desktop_config.json' 文件,在 'mcpServers' 字段中添加 'paper_search_server' 的配置。如果 'mcpServers' 字段不存在,请手动创建。

    配置文件内容示例:

    {
      "mcpServers": {
        "paper_search_server": {
          "command": "uv",
          "args": [
            "run",
            "-m",
            "paper_search_mcp.server"
          ]
        }
      }
    }

    配置参数说明:

    • '"paper_search_server"': 服务器名称,可以自定义,用于在客户端中标识该服务器。
    • '"command": "uv"': 启动服务器的命令,这里假设你使用 'uv' 运行 Python 模块。如果你使用 'pip' 安装,并且希望使用 'python' 命令,可以修改为 '"command": "python"'。
    • '"args": [...]': 命令参数列表。
      • '"run"': 'uv run' 的子命令,用于运行 Python 模块。 如果使用 'python' 命令,则不需要此参数。
      • '"-m"': Python 模块参数,表示运行模块。
      • '"paper_search_mcp.server"': 要运行的 Python 模块名称,指向 'paper_search_mcp' 包中的 'server.py' 文件。

    注意: '"command"' 和 '"args"' 的配置需要根据你的 Python 环境和包管理工具进行调整。 如果你使用虚拟环境,可能需要指定虚拟环境的 Python 解释器路径。

基本使用方法

配置完成后,你的 MCP 客户端(如 Claude Desktop)应该能够检测到 'paper_search_server'。 你可以通过客户端的功能调用 Paper Search MCP 服务器提供的工具,例如:

  • 搜索论文: 使用 'search_arxiv', 'search_pubmed', 'search_biorxiv' 或 'search_google_scholar' 工具,并提供关键词 (query) 和最大返回结果数 (max_results) 作为参数,例如:

    {
      "tool_call": {
        "tool_name": "search_arxiv",
        "parameters": {
          "query": "transformer networks",
          "max_results": 5
        }
      }
    }

    服务器会返回包含论文元数据的 JSON 列表。

  • 下载 PDF: 使用 'download_arxiv' 或 'download_biorxiv' 工具,并提供论文 ID (paper_id) 和保存路径 (save_path) 作为参数,例如:

    {
      "tool_call": {
        "tool_name": "download_arxiv",
        "parameters": {
          "paper_id": "2302.01234",
          "save_path": "./my_papers"
        }
      }
    }

    服务器会返回 PDF 文件的保存路径。

  • 读取论文内容: 使用 'read_arxiv_paper' 或 'read_biorxiv_paper' 工具,并提供论文 ID (paper_id) 和保存路径 (save_path) 作为参数,例如:

    {
      "tool_call": {
        "tool_name": "read_arxiv_paper",
        "parameters": {
          "paper_id": "2302.01234",
          "save_path": "./my_papers"
        }
      }
    }

    服务器会返回论文的文本内容。

请参考 MCP 客户端的文档,了解如何在对话或工作流中调用和使用这些工具。

信息

分类

网页与API