项目简介

DR Tulu MCP服务器是一个基于Model Context Protocol (MCP) 构建的智能研究助手后端系统。它通过标准化的JSON-RPC接口为LLM客户端提供上下文信息和功能调用能力。

主要功能

  • 学术论文搜索:通过Semantic Scholar API搜索学术文献
  • 网页内容抓取:支持Serper、Jina和Crawl4AI等多种网页解析方式
  • 文档重排序:使用VLLM托管的reranker模型对文档进行相关性排序
  • PubMed检索:专门针对医学和科学论文的搜索
  • 密集段落检索:通过massive-serve API进行大规模文档搜索
  • 多协议支持:支持Stdio、HTTP、SSE和Streamable-HTTP等多种传输协议

安装步骤

  1. 环境准备

    cd agent/
    conda create -n dr_agent python=3.10 -y && conda activate dr_agent
    uv pip install -e .
  2. API密钥配置

    export SERPER_API_KEY="your_key"    # https://serper.dev/
    export S2_API_KEY="your_key"        # https://api.semanticscholar.org/
    export JINA_API_KEY="your_key"        # https://jina.ai/reader/

服务器配置

MCP服务器支持以下配置:

{
  "server_name": "RL-RAG MCP",
  "command": "python -m dr_agent.mcp_backend.main",
  "args": [
    "--transport", "http",        # 传输协议:stdio/http/sse/streamable-http
    "--port", 8000,                   # HTTP传输端口
  "--host", "127.0.0.1",                 # 绑定地址
  "--path", "/mcp",                     # HTTP端点路径
  "--log-level", "info"                 # 日志级别
}

基本使用方法

  1. 启动MCP服务器
    python -m dr_agent.mcp_backend.main --transport http --port 8000

2. **基本使用方法**:
 - 服务器启动后,MCP客户端可以通过配置的传输协议连接
- 客户端需要提供必要的API密钥以访问各种搜索服务
- 服务器提供健康检查端点 '/health',可通过curl测试连接状态

3. **工具调用**:客户端可以通过MCP协议调用以下工具:
 - 'semantic_scholar_search' - 学术论文搜索
 - 'serper_google_webpage_search' - 通用网页搜索
 - 'vllm_hosted_reranker' - 文档相关性重排序
- **缓存支持**:内置API响应缓存机制,可通过环境变量控制

该服务器是DR Tulu项目的重要组成部分,为深度研究任务提供可靠的数据访问和工具调用能力。

信息

分类

网页与API