使用说明

项目简介

databricks-mcp 是一个实验性的 Model Context Protocol (MCP) 服务器,旨在桥接大型语言模型 (LLM) 和 Databricks API。它允许 LLM 通过标准化的 MCP 协议调用 Databricks API 的功能,例如管理和查询 Databricks 工作区中的资源。

主要功能点

  • 工具注册与执行: 目前提供了一个 'list_jobs' 工具,允许 LLM 客户端列出 Databricks 工作区中的作业。
  • Databricks API 集成: 通过 Databricks API 访问和操作 Databricks 工作区资源。
  • MCP 协议支持: 实现了 MCP 服务器的核心功能,能够处理 MCP 客户端的请求并返回符合 MCP 协议的响应。

安装步骤

  1. 安装 uv: 按照 uv 仓库的说明安装 'uv' 包管理器。

  2. 克隆仓库: 将 databricks-mcp 仓库克隆到本地:

    git clone https://github.com/gweakliem/databricks-mcp.git
    cd databricks-mcp
  3. 配置环境变量:

    • 复制 '.env' 示例文件并创建 '.env' 文件:
      cp server/example.env server/.env
    • 编辑 'server/.env' 文件,填入您的 Databricks 工作区 URL ('DATABRICKS_API_HOST') 和个人访问令牌 ('DATABRICKS_API_TOKEN')。 您需要在 Databricks 用户设置的 "开发者" 选项卡下创建个人访问令牌。
  4. 安装依赖: 使用 'uv sync' 安装项目依赖。

    uv sync

服务器配置

以下 JSON 配置信息用于 MCP 客户端连接到 databricks-mcp 服务器。您需要将此配置添加到您的 MCP 客户端配置中。

{
  "server_name": "databricks",
  "command": "uv",
  "args": ["run", "server/databricks.py"]
}

配置参数说明:

  • 'server_name': 服务器名称,可以自定义,例如 "databricks"。
  • 'command': 启动服务器的命令,这里使用 'uv' 运行 Python 脚本。
  • 'args': 命令参数,指定 'uv run' 命令执行的脚本路径,即 'server/databricks.py'。

基本使用方法

  1. 启动服务器: 在仓库根目录下运行以下命令启动 MCP 服务器:

    uv run server/databricks.py

    服务器成功启动后,您应该能在终端看到日志输出,例如 "Starting Databricks API server" 和 "Running Databricks API"。

  2. 配置 MCP 客户端: 根据您的 MCP 客户端软件的文档,配置服务器连接信息,将上面提供的 JSON 配置添加到客户端的服务器配置中。

  3. 调用工具: 使用 MCP 客户端连接到 'databricks' 服务器后,您可以发现并调用 'list_jobs' 工具。 'list_jobs' 工具允许您列出 Databricks 工作区中的作业。 具体的工具调用方法请参考您的 MCP 客户端软件的使用说明。 例如,您可能需要指定 'limit' (返回作业数量限制), 'name_filter' (按名称过滤作业), 和 'page_token' (用于分页查询) 等参数。

注意: 这是一个实验性项目,目前只实现了 'list_jobs' 工具,未来可能会扩展更多 Databricks API 的功能。

信息

分类

商业系统