项目简介
这是一个基于Model Context Protocol (MCP) 的Microsoft Purview服务器,允许AI助手如Claude、Cline等通过自然语言界面执行复杂的数据治理工作流。
主要功能
- 实体管理: 创建、读取、更新、删除Purview数据目录中的实体
- 业务术语表: 管理业务术语、类别和层次结构
- 统一目录管理: 治理域、数据产品、OKRs、关键数据元素等
- 数据血缘: 跟踪数据流向,支持CSV批量导入
- 搜索与发现: 关键字搜索、自动完成、分面搜索等
- 集合管理: 组织资产到集合层次结构中
- 类型定义: 获取和管理实体类型模式
- 关系管理: 创建实体间的关系链接
- 账户配置: 获取Purview账户属性和设置
- Microsoft Learn集成: 搜索官方文档和学习内容
安装步骤
- 克隆仓库:
git clone https://github.com/Keayoub/pvw-cli.git cd pvw-cli
- 安装依赖:
pip install -r requirements.txt
- 设置环境变量:
# 必需配置 export PURVIEW_ACCOUNT_NAME="您的Purview账户名称" export PURVIEW_ACCOUNT_ID="您的Purview账户ID(通常为Azure租户ID) export PURVIEW_RESOURCE_GROUP="您的资源组名称"
服务器配置
MCP客户端需要配置以下信息来连接此服务器:
服务器名称: 'purview-mcp-server'
启动命令: 'python'
参数:
- 服务器路径:'tools/PurviewMCPServer/server.py'
认证方式:
- Azure CLI认证(推荐交互式使用)
- 服务主体认证(推荐自动化/CI/CD)
- 托管身份认证(Azure环境自动使用)
关键环境变量:
- 'PURVIEW_ACCOUNT_NAME' - Purview账户名称(必需)
- 'AZURE_TENANT_ID' - Azure租户ID(可选)
- 'AZURE_REGION' - Azure区域(可选)
基本使用方法
- 确保已安装Python 3.8+和必要的依赖包
- 配置正确的Purview账户信息
- 通过MCP客户端启动服务器连接
注意事项:
- 确保Azure CLI已登录('az login')或提供正确的服务主体凭据
- 服务器启动后将自动提供20+个工具给AI助手使用
信息
分类
开发者工具