SOTA Tracker MCP 服务器

使用说明(简明易懂的操作指南)

  • 项目简介

    • 该仓库实现了一个以 MCP 协议为核心的后端服务器,聚合了多源的模型信息、场景化的硬件感知推荐,以及一组对 LLM 客户端有用的工具函数(如查询 SOTA、检查模型新旧、比较模型、最近发布、硬件筛选等)。
    • 服务器支持多种传输方式(如标准输入输出、HTTP),用于在不同的客户端环境中使用。
  • 主要功能点

    • MCP 资源(Resources): 提供模型类别、禁用清单等信息检索入口。
    • MCP 工具(Tools): 提供 query_sota、check_freshness、get_forbidden、compare_models、recent_releases、configure_hardware、query_sota_for_hardware、get_model_recommendation、get_best_in_class 等能力,便于 LLM 客户端调用外部功能和查询数据。
    • Prompt 模板/渲染: 通过返回结构化文本来呈现 SOTA 信息及推荐结果,方便集成到对话流中。
    • 硬件感知与资源管理: 根据当前 VRAM、RAM、CPU 等配置对本地模型进行筛选和推荐。
    • 数据刷新与缓存:内置缓存管理,支持按分类的数据刷新、缓存状态查询等。
    • MCP 服务器与客户端的对接:通过 MCP 的装载与装饰器(@mcp.tool、@mcp.resource)暴露能力,客户端通过 MCP 请求调用。
  • 安装与运行

    • 安装环境:需要 Python 3.x,安装依赖(仓库中包含 requirements.txt,需按需安装)。
    • 运行方式:
      • 开发/交互模式:直接运行 python server.py
      • HTTP 模式:运行时加上参数 --http,服务器将以 HTTP 传输暴露接口
    • 启动示例(非代码块说明,供理解):
      • 在命令行执行 python server.py(打开 STDIO 传输)
      • 或以 http 传输启动,访问 /health、/docs 等端点进行测试
  • 服务器配置(MCP 客户端使用的配置示例) 为了让 MCP 客户端知道如何启动并连接到该服务器,请将以下 JSON 配置提供给 MCP 客户端使用: { "mcpServers": { "sota-tracker": { "command": "python", "args": ["server.py"] } /* 该配置指定服务器名称为 sota-tracker,启动命令为 python,参数为 server.py; 客户端在连接时会使用该启动信息来建立与 MCP 服务器的 JSON-RPC 通道。 */ } }

  • 基本使用方法

    • 启动后,与 MCP 客户端建立连接即可开始查询或调用能力。
    • 客户端可以按需调用以下工具(示例,不同客户端调用方式略有差异):
      • query_sota(category, open_source_only)
      • check_freshness(model_name)
      • get_forbidden()
      • compare_models(model_a, model_b)
      • recent_releases(days, open_source_only)
      • refresh_data(category)
      • cache_status()
      • configure_hardware(...)
      • query_sota_for_hardware(category, concurrent_vram_gb, concurrent_workload)
      • get_model_recommendation(task, concurrent_workload)
      • get_best_in_class(category)
    • 若需通过 Claude/其它对话型客户端使用,内部文本输出已按常见格式组织,便于直接展示给用户或进一步处理。

服务器信息