使用说明

项目简介

'mcp-server-data-wrangler' 是一个基于 Model Context Protocol (MCP) 的服务器,专注于数据处理和分析任务。它提供了一系列工具,用于对数据进行预处理、转换和分析,以便更好地服务于大型语言模型 (LLM) 应用。

主要功能点

  • 数据统计分析: 能够计算数据的均值、中位数、最大值、最小值、标准差、方差、分位数、总和、计数等统计指标。
  • 数据形状和大小: 可以获取数据的行列数(形状)以及估计数据在不同单位下的存储大小。
  • 数据模式: 能够提取数据文件的schema信息,了解各列的数据类型。
  • 多种文件格式支持: 支持 CSV, TSV, Parquet 等常见数据文件格式。

安装步骤

  1. 克隆仓库
    git clone https://github.com/shibuiwilliam/mcp-server-data-wrangler.git
  2. 进入仓库目录
    cd mcp-server-data-wrangler
  3. 创建并激活虚拟环境 (可选,但推荐):
    python -m venv .venv
    source .venv/bin/activate   # 或 .venv\Scripts\activate (Windows)
  4. 安装依赖
    pip install -e ".[dev]"

服务器配置

MCP客户端需要配置 MCP服务器的启动命令及其参数,以便与其建立连接。以下是 'mcp-server-data-wrangler' 的JSON配置信息示例:

{
  "data-wrangler": {  // 服务名称,可以自定义
    "command": "uv",  // 启动命令,使用 uvx 运行时为 uv
    "args": [
      "--directory",
      "/path/to/mcp-server-data-wrangler/src/mcp_server_data_wrangler", // MCP服务器代码路径,请替换为实际路径
      "run",
      "mcp-server-data-wrangler" // 运行参数,指定运行 mcp-server-data-wrangler
    ]
  }
}

注意:

  • 'server name' 可以自定义,例如 '"data-wrangler"'。
  • 'command' 通常设置为 '"uv"',如果使用 'uvx' 运行时。
  • 'args' 中的 '/path/to/mcp-server-data-wrangler/src/mcp_server_data_wrangler' 必须替换为实际的仓库本地路径,指向 'src/mcp_server_data_wrangler' 目录。

基本使用方法

此MCP服务器作为后端,需要通过MCP客户端进行调用。客户端可以向服务器发送JSON-RPC请求,调用服务器提供的各种数据处理工具。例如,要获取数据文件的形状,客户端可以调用名为 'data_shape' 的工具,并提供数据文件路径作为参数。具体的工具名称、参数和使用方式,可以参考仓库的 'src/mcp_server_data_wrangler/tools/tools.py' 文件中 'MCPServerDataWrangler.tools()' 方法的定义,或者通过 MCP Inspector 工具查看服务器暴露的工具列表和Schema。

信息

分类

AI与计算