项目简介

Apache Iceberg MCP 服务器是一个基于 Model Context Protocol (MCP) 的服务,专门用于连接和操作 Apache Iceberg 数据湖。它让 AI 助手能够通过标准化的方式访问 Iceberg 目录中的数据,支持数据查询、表管理和命名空间操作。

主要功能

  • 表管理:列出表、查看表元数据、创建和删除表
  • 数据操作:读取表内容、写入数据(追加或覆盖)、下载数据到文件
  • 命名空间管理:创建、列出和删除命名空间
  • SQL 查询:通过 DuckDB 执行 SQL 查询 Iceberg 表
  • 快照管理:查看表的快照历史,支持时间旅行查询
  • 文件导出:支持将查询结果导出为 CSV、Parquet、Feather 等格式

安装步骤

  1. 使用 uv 包管理器安装:

    uvx iceberg-mcp-server
  2. 或者使用 pipx 等其他 Python 包运行器

服务器配置

将以下配置信息添加到你的 MCP 客户端配置文件中:

{
  "mcp_servers": {
    "iceberg": {
      "command": "uvx",
      "args": ["iceberg-mcp-server"]
    }
}

基本使用方法

  1. 配置 Iceberg 目录:在 '~/.pyiceberg.yaml' 文件中设置你的 Iceberg 目录连接信息:

    catalog:
      default:
        uri: "你的目录URI"
        token: "你的认证令牌"
        warehouse: "你的仓库路径"
  2. 环境变量(可选):

    • 'ICEBERG_CATALOG':指定要加载的目录名称(默认为 "default")
    • 'SENTRY_DSN':用于错误监控(可选)
  3. 连接后即可使用:AI 助手可以通过 MCP 协议调用各种工具来操作你的 Iceberg 数据湖

信息

分类

数据库与文件