使用说明
项目简介
databricks-mcp 是一个实验性的 Model Context Protocol (MCP) 服务器,旨在桥接大型语言模型 (LLM) 和 Databricks API。它允许 LLM 通过标准化的 MCP 协议调用 Databricks API 的功能,例如管理和查询 Databricks 工作区中的资源。
主要功能点
- 工具注册与执行: 目前提供了一个 'list_jobs' 工具,允许 LLM 客户端列出 Databricks 工作区中的作业。
- Databricks API 集成: 通过 Databricks API 访问和操作 Databricks 工作区资源。
- MCP 协议支持: 实现了 MCP 服务器的核心功能,能够处理 MCP 客户端的请求并返回符合 MCP 协议的响应。
安装步骤
-
安装 uv: 按照 uv 仓库的说明安装 'uv' 包管理器。
-
克隆仓库: 将 databricks-mcp 仓库克隆到本地:
git clone https://github.com/gweakliem/databricks-mcp.git cd databricks-mcp -
配置环境变量:
- 复制 '.env' 示例文件并创建 '.env' 文件:
cp server/example.env server/.env - 编辑 'server/.env' 文件,填入您的 Databricks 工作区 URL ('DATABRICKS_API_HOST') 和个人访问令牌 ('DATABRICKS_API_TOKEN')。 您需要在 Databricks 用户设置的 "开发者" 选项卡下创建个人访问令牌。
- 复制 '.env' 示例文件并创建 '.env' 文件:
-
安装依赖: 使用 'uv sync' 安装项目依赖。
uv sync
服务器配置
以下 JSON 配置信息用于 MCP 客户端连接到 databricks-mcp 服务器。您需要将此配置添加到您的 MCP 客户端配置中。
{ "server_name": "databricks", "command": "uv", "args": ["run", "server/databricks.py"] }
配置参数说明:
- 'server_name': 服务器名称,可以自定义,例如 "databricks"。
- 'command': 启动服务器的命令,这里使用 'uv' 运行 Python 脚本。
- 'args': 命令参数,指定 'uv run' 命令执行的脚本路径,即 'server/databricks.py'。
基本使用方法
-
启动服务器: 在仓库根目录下运行以下命令启动 MCP 服务器:
uv run server/databricks.py服务器成功启动后,您应该能在终端看到日志输出,例如 "Starting Databricks API server" 和 "Running Databricks API"。
-
配置 MCP 客户端: 根据您的 MCP 客户端软件的文档,配置服务器连接信息,将上面提供的 JSON 配置添加到客户端的服务器配置中。
-
调用工具: 使用 MCP 客户端连接到 'databricks' 服务器后,您可以发现并调用 'list_jobs' 工具。 'list_jobs' 工具允许您列出 Databricks 工作区中的作业。 具体的工具调用方法请参考您的 MCP 客户端软件的使用说明。 例如,您可能需要指定 'limit' (返回作业数量限制), 'name_filter' (按名称过滤作业), 和 'page_token' (用于分页查询) 等参数。
注意: 这是一个实验性项目,目前只实现了 'list_jobs' 工具,未来可能会扩展更多 Databricks API 的功能。
信息
分类
商业系统