使用说明
项目简介
'mcp-server-data-wrangler' 是一个基于 Model Context Protocol (MCP) 的服务器,专注于数据处理和分析任务。它提供了一系列工具,用于对数据进行预处理、转换和分析,以便更好地服务于大型语言模型 (LLM) 应用。
主要功能点
- 数据统计分析: 能够计算数据的均值、中位数、最大值、最小值、标准差、方差、分位数、总和、计数等统计指标。
- 数据形状和大小: 可以获取数据的行列数(形状)以及估计数据在不同单位下的存储大小。
- 数据模式: 能够提取数据文件的schema信息,了解各列的数据类型。
- 多种文件格式支持: 支持 CSV, TSV, Parquet 等常见数据文件格式。
安装步骤
- 克隆仓库:
git clone https://github.com/shibuiwilliam/mcp-server-data-wrangler.git - 进入仓库目录:
cd mcp-server-data-wrangler - 创建并激活虚拟环境 (可选,但推荐):
python -m venv .venv source .venv/bin/activate # 或 .venv\Scripts\activate (Windows) - 安装依赖:
pip install -e ".[dev]"
服务器配置
MCP客户端需要配置 MCP服务器的启动命令及其参数,以便与其建立连接。以下是 'mcp-server-data-wrangler' 的JSON配置信息示例:
{ "data-wrangler": { // 服务名称,可以自定义 "command": "uv", // 启动命令,使用 uvx 运行时为 uv "args": [ "--directory", "/path/to/mcp-server-data-wrangler/src/mcp_server_data_wrangler", // MCP服务器代码路径,请替换为实际路径 "run", "mcp-server-data-wrangler" // 运行参数,指定运行 mcp-server-data-wrangler ] } }
注意:
- 'server name' 可以自定义,例如 '"data-wrangler"'。
- 'command' 通常设置为 '"uv"',如果使用 'uvx' 运行时。
- 'args' 中的 '/path/to/mcp-server-data-wrangler/src/mcp_server_data_wrangler' 必须替换为实际的仓库本地路径,指向 'src/mcp_server_data_wrangler' 目录。
基本使用方法
此MCP服务器作为后端,需要通过MCP客户端进行调用。客户端可以向服务器发送JSON-RPC请求,调用服务器提供的各种数据处理工具。例如,要获取数据文件的形状,客户端可以调用名为 'data_shape' 的工具,并提供数据文件路径作为参数。具体的工具名称、参数和使用方式,可以参考仓库的 'src/mcp_server_data_wrangler/tools/tools.py' 文件中 'MCPServerDataWrangler.tools()' 方法的定义,或者通过 MCP Inspector 工具查看服务器暴露的工具列表和Schema。
信息
分类
AI与计算