-
项目简介 IPFS Datasets Python 是一个基于去中心化基础设施的综合性AI数据平台。它集成了数学定理证明、AI驱动的文档处理 (GraphRAG)、通用媒体处理、知识图谱智能以及去中心化存储 (IPFS) 等多种先进功能。其核心是一个功能全面的 Model Context Protocol (MCP) 服务器,旨在以标准化方式向 LLM 客户端提供上下文信息和外部功能调用。
-
主要功能点
- 完整的 MCP 服务器实现: 提供一个功能完备的 MCP 服务器后端,通过 JSON-RPC 协议与 LLM 客户端通信。
- 200+ 集成工具: 托管并管理大量 AI 开发和数据处理工具,支持 LLM 调用外部功能,例如数据集操作、IPFS 文件管理、向量搜索、知识图谱构建、文档处理和媒体处理等。
- 去中心化数据平台: 所有数据存储和操作都原生支持 IPFS,实现内容寻址和数据去中心化。
- 高级AI功能: 包括自然语言到形式化逻辑的定理证明、生产级 GraphRAG 文档智能、跨平台多媒体处理和知识图谱增强的检索与推理。
- 安全与治理: 提供全面的审计日志、安全溯源追踪和访问控制功能。
- 会话管理与能力声明: 服务器负责管理客户端会话,并声明其提供的资源和工具能力。
-
安装步骤
- 克隆仓库:
git clone https://github.com/endomorphosis/ipfs_datasets_py.git cd ipfs_datasets_py - 安装核心依赖:
python install.py --quick - 安装完整功能: (根据需求选择,'[all]' 包含所有功能,可能需要较长时间和资源)
pip install ipfs-datasets-py[all] - 验证安装:
python dependency_health_checker.py check
- 克隆仓库:
-
服务器配置 MCP 客户端连接 MCP 服务器需要以下配置信息。这些配置以 JSON 格式提供,供客户端建立连接时使用。
{ "server_name": "IPFS Datasets MCP Server", "command": "python", "args": ["-m", "ipfs_datasets_py.mcp_server", "--port", "8080"], "description": "用于IPFS数据集去中心化AI数据平台,提供全面的AI工具和数据服务。", "protocol": "json-rpc" }参数注释:
- 'server_name': MCP 服务器的友好名称。
- 'command': 启动 MCP 服务器的主命令。这里是 'python'。
- 'args': 传递给 'command' 的参数列表。
- '-m ipfs_datasets_py.mcp_server': 以模块形式运行 'ipfs_datasets_py' 包中的 'mcp_server'。
- '--port 8080': 指定 MCP 服务器监听的端口号,可根据实际需求修改。
- 'description': 服务器功能的简要描述。
- 'protocol': 服务器通信协议,这里是 'json-rpc'。
-
基本使用方法
- 启动 MCP 服务器:
在项目根目录下运行以下命令来启动 MCP 服务器。服务器将监听指定端口,等待客户端连接。
(或者,如果希望同时启动带界面的 Dashboard)python -m ipfs_datasets_py.mcp_server --port 8080python -m ipfs_datasets_py.mcp_dashboard --port 8899 - 通过 MCP 客户端连接: 使用您偏好的 MCP 客户端(如基于 LLM 的代理)配置上述 JSON 信息,以连接到 IPFS Datasets MCP 服务器。
- 探索可用工具: 客户端连接后,可以请求服务器的能力声明,获取所有可用的工具列表,并根据需要调用这些工具。 例如,客户端可以调用 'dataset_tools' 中的 'load_dataset' 工具来加载数据,或调用 'ipfs_tools' 中的 'pin_to_ipfs' 来操作 IPFS 资源。
- 启动 MCP 服务器:
在项目根目录下运行以下命令来启动 MCP 服务器。服务器将监听指定端口,等待客户端连接。
信息
分类
AI与计算