项目简介 arXiv MCP 服务器是一个功能强大的后端应用,专为研究人员和AI助手设计,旨在简化arXiv学术论文的发现、分析和数据管理流程。它通过Model Context Protocol (MCP) 标准,提供了一个结构化的接口,让LLM客户端能够轻松访问和操作arXiv数据,进行语义搜索、引用分析、趋势跟踪及多种格式的数据导出。
主要功能点
- 高级论文搜索: 支持关键词、作者、分类等多种方式进行论文检索,并提供语义搜索、主题建模和趋势跟踪功能。
- 引文分析: 构建引文网络,分析作者影响力、期刊影响,并识别热门研究主题。
- AI助手支持: 提供论文摘要、趋势报告、引文溯源和问答等AI辅助功能,提升研究效率。
- 多格式数据导出: 支持BibTeX, RIS, JSON, CSV, Markdown等多种常用学术和数据格式,方便与其他工具集成。
- MCP驱动架构: 遵循Model Context Protocol标准,确保数据、提示和AI代理之间的一致性上下文共享和可扩展性。
- 可扩展性: 支持插件和适配器,可扩展新的数据源、导出格式和自定义AI模型。
- REST API和CLI: 提供编程接口和命令行工具,便于自动化和集成。
安装步骤
- 系统要求: 支持Linux, macOS或Windows操作系统,需要安装Python环境(具体版本请参考项目文档)。
- 下载发布版本: 从项目的Releases页面下载适用于您平台的最新发布包。
- 解压并运行安装器: 将下载的压缩包解压到您选择的目录,然后运行包中提供的安装程序或设置脚本。
- Docker快速启动 (推荐): 如果您使用Docker,可以通过以下命令快速启动服务器:
这将在本地8080端口启动MCP服务器。docker run --rm -it -p 8080:8080 arxiv-mcp-server:latest
服务器配置 MCP客户端可以通过 JSON-RPC over Stdio 协议连接到 'arxiv-mcp-server'。以下是MCP客户端连接此服务器所需的典型配置信息:
{ "name": "ArXiv MCP Server", "command": "python", "args": ["path/to/arxiv-mcp-server/main.py", "server"], "description": "arXiv Model Context Protocol Server for paper search and analysis." }
- 'name': 服务器的名称,用于客户端识别。
- 'command': 启动服务器的可执行命令。这里是'python'。
- 'args': 传递给'command'的参数列表。'["path/to/arxiv-mcp-server/main.py", "server"]' 表示运行位于指定路径的'main.py'文件,并传入'server'参数以启动服务器模式。请将'path/to/arxiv-mcp-server'替换为'main.py'文件在您系统中的实际路径。
- 'description': 服务器的简要描述。
基本使用方法 服务器启动后,MCP客户端即可通过上述配置连接并调用其提供的工具。以下是一些通过MCP客户端调用服务器功能的示例(客户端侧的逻辑):
-
搜索论文: 调用 'search_arxiv' 工具,提供 'query' (搜索查询) 和 'max_results' (最大结果数) 参数。 例如,搜索关于 "quantum computing" 的20篇论文。
-
获取论文详情: 调用 'get_paper' 工具,提供 'arxiv_id' (arXiv论文ID) 参数。 例如,获取ID为 "2103.XXXX" 的论文详情。
-
导出论文: 调用 'export_papers' 工具,提供 'arxiv_ids' (arXiv论文ID列表)、'format' (导出格式,如 "bibtex", "json", "csv", "markdown") 和 'include_abstract' (是否包含摘要) 参数。 例如,将多篇论文导出为BibTeX格式。
-
分析趋势: 调用 'analyze_trends' 工具,提供 'category' (arXiv分类,如 "cs.AI")、'time_period' (时间范围,如 "3_months") 和 'analysis_type' (分析类型,如 "publication_count")。 例如,分析"cs.AI"类别在过去3个月的出版数量趋势。
-
比较论文: 调用 'compare_papers' 工具,提供 'arxiv_ids' (arXiv论文ID列表) 和 'comparison_fields' (比较字段列表)。 例如,比较两篇论文的作者和摘要。
信息
分类
AI与计算