项目简介
Apache Iceberg MCP 服务器是一个基于 Model Context Protocol (MCP) 的服务,专门用于连接和操作 Apache Iceberg 数据湖。它让 AI 助手能够通过标准化的方式访问 Iceberg 目录中的数据,支持数据查询、表管理和命名空间操作。
主要功能
- 表管理:列出表、查看表元数据、创建和删除表
- 数据操作:读取表内容、写入数据(追加或覆盖)、下载数据到文件
- 命名空间管理:创建、列出和删除命名空间
- SQL 查询:通过 DuckDB 执行 SQL 查询 Iceberg 表
- 快照管理:查看表的快照历史,支持时间旅行查询
- 文件导出:支持将查询结果导出为 CSV、Parquet、Feather 等格式
安装步骤
-
使用 uv 包管理器安装:
uvx iceberg-mcp-server -
或者使用 pipx 等其他 Python 包运行器
服务器配置
将以下配置信息添加到你的 MCP 客户端配置文件中:
{ "mcp_servers": { "iceberg": { "command": "uvx", "args": ["iceberg-mcp-server"] } }
基本使用方法
-
配置 Iceberg 目录:在 '~/.pyiceberg.yaml' 文件中设置你的 Iceberg 目录连接信息:
catalog: default: uri: "你的目录URI" token: "你的认证令牌" warehouse: "你的仓库路径" -
环境变量(可选):
- 'ICEBERG_CATALOG':指定要加载的目录名称(默认为 "default")
- 'SENTRY_DSN':用于错误监控(可选)
-
连接后即可使用:AI 助手可以通过 MCP 协议调用各种工具来操作你的 Iceberg 数据湖
信息
分类
数据库与文件