• 项目简介 IPFS Datasets Python 是一个基于去中心化基础设施的综合性AI数据平台。它集成了数学定理证明、AI驱动的文档处理 (GraphRAG)、通用媒体处理、知识图谱智能以及去中心化存储 (IPFS) 等多种先进功能。其核心是一个功能全面的 Model Context Protocol (MCP) 服务器,旨在以标准化方式向 LLM 客户端提供上下文信息和外部功能调用。

  • 主要功能点

    • 完整的 MCP 服务器实现: 提供一个功能完备的 MCP 服务器后端,通过 JSON-RPC 协议与 LLM 客户端通信。
    • 200+ 集成工具: 托管并管理大量 AI 开发和数据处理工具,支持 LLM 调用外部功能,例如数据集操作、IPFS 文件管理、向量搜索、知识图谱构建、文档处理和媒体处理等。
    • 去中心化数据平台: 所有数据存储和操作都原生支持 IPFS,实现内容寻址和数据去中心化。
    • 高级AI功能: 包括自然语言到形式化逻辑的定理证明、生产级 GraphRAG 文档智能、跨平台多媒体处理和知识图谱增强的检索与推理。
    • 安全与治理: 提供全面的审计日志、安全溯源追踪和访问控制功能。
    • 会话管理与能力声明: 服务器负责管理客户端会话,并声明其提供的资源和工具能力。
  • 安装步骤

    1. 克隆仓库:
      git clone https://github.com/endomorphosis/ipfs_datasets_py.git
      cd ipfs_datasets_py
    2. 安装核心依赖:
      python install.py --quick
    3. 安装完整功能: (根据需求选择,'[all]' 包含所有功能,可能需要较长时间和资源)
      pip install ipfs-datasets-py[all]
    4. 验证安装:
      python dependency_health_checker.py check
  • 服务器配置 MCP 客户端连接 MCP 服务器需要以下配置信息。这些配置以 JSON 格式提供,供客户端建立连接时使用。

    {
      "server_name": "IPFS Datasets MCP Server",
      "command": "python",
      "args": ["-m", "ipfs_datasets_py.mcp_server", "--port", "8080"],
      "description": "用于IPFS数据集去中心化AI数据平台,提供全面的AI工具和数据服务。",
      "protocol": "json-rpc"
    }

    参数注释:

    • 'server_name': MCP 服务器的友好名称。
    • 'command': 启动 MCP 服务器的主命令。这里是 'python'。
    • 'args': 传递给 'command' 的参数列表。
      • '-m ipfs_datasets_py.mcp_server': 以模块形式运行 'ipfs_datasets_py' 包中的 'mcp_server'。
      • '--port 8080': 指定 MCP 服务器监听的端口号,可根据实际需求修改。
    • 'description': 服务器功能的简要描述。
    • 'protocol': 服务器通信协议,这里是 'json-rpc'。
  • 基本使用方法

    1. 启动 MCP 服务器: 在项目根目录下运行以下命令来启动 MCP 服务器。服务器将监听指定端口,等待客户端连接。
      python -m ipfs_datasets_py.mcp_server --port 8080
      (或者,如果希望同时启动带界面的 Dashboard)
      python -m ipfs_datasets_py.mcp_dashboard --port 8899
    2. 通过 MCP 客户端连接: 使用您偏好的 MCP 客户端(如基于 LLM 的代理)配置上述 JSON 信息,以连接到 IPFS Datasets MCP 服务器。
    3. 探索可用工具: 客户端连接后,可以请求服务器的能力声明,获取所有可用的工具列表,并根据需要调用这些工具。 例如,客户端可以调用 'dataset_tools' 中的 'load_dataset' 工具来加载数据,或调用 'ipfs_tools' 中的 'pin_to_ipfs' 来操作 IPFS 资源。

信息

分类

AI与计算