使用说明

项目简介

ArXiv Analyst 是一个基于 Model Context Protocol (MCP) 构建的模块化AI研究助手,包含 ArXiv Server 和 DocLing Server 两个 MCP 服务器。ArXiv Server 专注于提供学术论文检索功能,允许用户通过关键词在 ArXiv 数据库中搜索相关论文,并返回论文的标题、摘要、发布日期和 PDF 链接等信息。该服务器旨在作为 LLM 应用的后端,提供结构化的学术信息资源访问能力。

主要功能点

  • 学术论文检索: 通过关键词查询 ArXiv 数据库,快速找到相关的学术论文。
  • 结构化信息返回: 以清晰的格式返回论文标题、摘要、日期和 PDF 链接等关键信息,方便 LLM 理解和利用。
  • MCP 协议支持: 采用标准的 MCP 协议,易于与各种 MCP 客户端集成,实现模块化和可扩展的 AI 应用架构。
  • Docker 容器化部署: 提供 Dockerfile,支持容器化部署,简化安装和运行过程。

安装步骤

  1. 克隆仓库: 首先克隆 ArXiv-Analyst 仓库到本地:

    git clone https://github.com/devjothish/ArXiv-Analyst.git
    cd ArXiv-Analyst
  2. 构建 Docker 镜像: 进入 'arxiv_server' 目录,构建 ArXiv Server 的 Docker 镜像:

    cd arxiv_server
    docker build -t arxiv-server .
    cd ..

    如果需要使用 DocLing Server,也需要进入 'docling_server' 目录构建 DocLing Server 的 Docker 镜像 (仓库中未提供 'docling_server' 目录,此处假设存在并参考 'arxiv_server' 构建方式):

    cd docling_server # 假设存在 docling_server 目录
    docker build -t docling-server .
    cd ..
  3. 运行 Docker 容器: 运行 ArXiv Server 的 Docker 容器,并将服务器端口映射到宿主机:

    docker run -d -p 8080:8080 arxiv-server

    如果构建了 DocLing Server 镜像,也需要运行 DocLing Server 的 Docker 容器(假设 DocLing Server 端口为 8081):

    docker run -d -p 8081:8081 docling-server

    确保 Docker 容器成功运行,ArXiv Server 默认监听 8080 端口,DocLing Server 默认监听 8081 端口(根据实际代码调整)。

服务器配置

对于 MCP 客户端(例如 'client_server.py'),需要配置连接 ArXiv Server 的信息。以下是客户端配置示例 (JSON 格式):

{
  "servers": {
    "arxiv": {
      "url": "http://localhost:8080/sse",
      "transport": "sse"
    }
    // 如果使用了 DocLing Server,则添加 DocLing Server 的配置
    // , "docling": {
    //   "url": "http://localhost:8081/sse",
    //   "transport": "sse"
    // }
  }
}

配置参数说明:

  • '"servers"': 包含所有 MCP 服务器配置信息的根节点。
  • '"arxiv"': 为 ArXiv Server 定义的服务器名称,客户端代码中通过此名称引用该服务器。
  • '"url"': ArXiv Server 的 SSE (Server-Sent Events) 协议 endpoint 地址。这里假设 ArXiv Server 运行在本地,端口为 8080,并使用 SSE 协议。请根据实际部署情况修改 IP 地址和端口。
  • '"transport"': 指定客户端与服务器通信的传输协议,这里设置为 '"sse"'。

注意:

  • 实际客户端配置可能需要根据具体的 MCP 客户端库和使用方式进行调整。
  • 如果 ArXiv Server 部署在远程服务器,需要将 '"url"' 中的 'localhost' 替换为服务器的 IP 地址或域名。
  • 如果使用了 DocLing Server,请参考 ArXiv Server 的配置方式,添加 DocLing Server 的配置信息,并确保服务器名称 '"docling"' 与客户端代码中引用的名称一致。

基本使用方法

  1. 启动 MCP 服务器: 按照上述安装步骤启动 ArXiv Server (和 DocLing Server)。
  2. 配置 MCP 客户端: 在 MCP 客户端 (例如 'client_server.py') 中,根据服务器配置示例配置 ArXiv Server 的连接信息。
  3. 运行 MCP 客户端: 运行 MCP 客户端,客户端将通过 MCP 协议与 ArXiv Server 通信,调用 ArXiv Server 提供的工具 (例如 'search_arxiv') 来检索学术论文。
  4. 通过 UI 交互: 通过 Streamlit UI ('streamlit_app.py') 与客户端交互,输入研究问题,系统将调用 ArXiv Server 的功能检索论文,并将结果返回给用户。

示例操作:

在 Streamlit UI 中,输入研究问题,例如 "Find recent papers on GPT models",系统将调用 ArXiv Server 的 'search_arxiv' 工具,检索 ArXiv 数据库中关于 GPT 模型的最新论文,并将检索结果显示在 UI 界面上。

信息

分类

网页与API