使用说明

项目简介

MarkItDown MCP Server 是一个基于 Model Context Protocol (MCP) 的服务器,它使用 MarkItDown 工具将各种文件格式转换为 Markdown 文本。此服务器旨在为大型语言模型 (LLM) 应用提供文档转换服务,使其能够理解和处理多种格式的文档内容。

主要功能点

  • 多格式支持: 支持 PDF, PowerPoint, Word, Excel, 图片 (EXIF 元数据和 OCR), 音频 (EXIF 元数据和语音转录), HTML, 文本格式 (CSV, JSON, XML), ZIP 文件等多种文件格式。
  • Markdown 转换: 将上述格式的文件转换为 Markdown 文本,方便 LLM 理解和处理文档内容。
  • MCP 协议支持: 遵循 MCP 协议,可以与任何兼容 MCP 协议的客户端集成,如 Zed Editor 等。
  • Prompt 接口: 提供 '/md <file>' 命令,允许客户端通过 Prompt 方式请求文件转换服务。

安装步骤

手动安装

  1. 克隆仓库: 将 GitHub 仓库 'https://github.com/KorigamiK/markitdown_mcp_server' 克隆到本地。
  2. 安装依赖: 在克隆的仓库目录下,运行 'uv install' 命令安装项目依赖。 (请确保已安装 'uv' 包管理器)

通过 Smithery 安装 (Claude Desktop 自动安装)

npx -y @smithery/cli install @KorigamiK/markitdown_mcp_server --client claude

服务器配置

要将 MarkItDown MCP Server 集成到 MCP 客户端(例如 Zed Editor),您需要配置客户端以连接到此服务器。以下是针对 Zed Editor 的 'settings.json' 配置示例,展示了如何配置服务器的启动命令。

"context_servers": {
  "markitdown_mcp": {
    "settings": {},
    "command": {
      "path": "uv",  // 服务器启动命令,这里使用 uv 包管理器运行脚本
      "args": [
        "--directory",  // 指定工作目录
        "/path/to/markitdown_mcp_server", //  请替换为 MarkItDown MCP Server 仓库的本地路径
        "run",          //  uv run 命令,用于运行 Python 脚本
        "markitdown_mcp_server"  //  指定要运行的 Python 模块名,对应仓库中的 src/markitdown_mcp_server/__init__.py
      ]
    }
  }
}

配置说明:

  • '"path": "uv"': 指定用于启动服务器的命令为 'uv',你需要确保你的系统安装了 'uv' 包管理器,并且 'uv' 命令在你的 PATH 环境变量中。
  • '"args": [...]': 'args' 数组包含了传递给 'uv' 命令的参数。
    • '"--directory", "/path/to/markitdown_mcp_server"': 指定 'uv' 命令的工作目录为 MarkItDown MCP Server 仓库的根目录。请务必将 '/path/to/markitdown_mcp_server' 替换为你实际的仓库路径。
    • '"run", "markitdown_mcp_server"': 指示 'uv' 运行 'markitdown_mcp_server' 模块,这会执行 'src/markitdown_mcp_server/init.py' 文件中的 'main()' 函数,从而启动 MCP 服务器。

注意: 你需要根据你的实际环境和 MCP 客户端的要求进行相应的配置调整。例如,如果你的 MCP 客户端支持其他连接方式(如 WebSocket, SSE),并且服务器也支持,你可能需要修改配置以使用这些连接方式。

基本使用方法

  1. 启动服务器: 根据上述配置,在 MCP 客户端中启动 'markitdown_mcp' 服务器。服务器将在后台运行并等待客户端请求。
  2. 发送 Prompt 请求: 在 MCP 客户端中,可以使用 '/md <file>' 命令向服务器发送文件转换请求。
    • 将 '<file>' 替换为你要转换的文件的 URI 或本地文件路径。例如,要转换名为 'document.pdf' 的文件,可以发送命令 '/md document.pdf'。
  3. 接收 Markdown 结果: 服务器会将指定文件转换为 Markdown 格式,并将结果作为 Prompt 响应返回给 MCP 客户端。客户端可以接收并展示转换后的 Markdown 内容。

示例命令:

/md my_report.docx

信息

分类

数据库与文件