项目简介

Document Processing Server 是一个基于 Model Context Protocol (MCP) 构建的服务器,旨在为大型语言模型 (LLM) 应用提供强大的文档处理能力。它通过标准化的 MCP 协议与客户端通信,允许 LLM 客户端调用各种文档处理工具,例如读取不同格式的文档、进行文档格式转换、处理文本内容以及操作 HTML 文件。

主要功能点

  • 文档读取: 支持读取 DOCX, PDF, TXT, HTML, CSV 等多种文档格式。
  • 文档转换: 提供 DOCX 到 HTML/PDF,HTML 到 TXT/Markdown,以及 PDF 合并和分割等转换功能。
  • 文本处理: 支持多编码转换 (UTF-8, Big5, GBK),文本格式化和清理,文本比较和差异生成,以及按行或分隔符分割文本。
  • HTML 处理: 提供 HTML 清理和格式化,资源 (图片、链接、视频) 提取,以及结构保留的 HTML 转换。

安装步骤

通过 Smithery 安装 (推荐 Claude Desktop 用户)

如果您使用 Claude Desktop,可以通过 Smithery 自动安装 Document Processing Server。

  1. 打开终端,复制并执行以下命令:

    npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude

手动安装

  1. 确保您已安装 Node.js 和 npm。

  2. 打开终端,执行以下命令全局安装 Document Processing Server:

    npm install -g @cablate/mcp-doc-forge

服务器配置

为了让 MCP 客户端(例如 Dive Desktop)连接到 Document Processing Server,您需要提供以下配置信息。这些信息通常在 MCP 客户端的 "添加 MCP 服务器" 或类似的设置中配置。

{
  "serverName": "document-processing-server",  // 自定义服务器名称,在客户端中用于标识
  "command": "mcp-doc-forge",                 // 启动服务器的命令,全局安装后可以直接使用命令名
  "args": [],                                  // 启动命令的参数,本服务器无需额外参数
  "enabled": true                              // 设置为 true 启用该服务器配置
}

配置参数说明:

  • 'serverName': 服务器名称,您可以自定义,用于在 MCP 客户端中区分不同的服务器。
  • 'command': 启动 Document Processing Server 的命令。全局安装后,'mcp-doc-forge' 命令可以直接在终端中运行。
  • 'args': 启动命令的参数。对于 Document Processing Server,默认情况下不需要额外的启动参数,所以设置为空数组 '[]' 即可。
  • 'enabled': 指示该服务器配置是否启用。设置为 'true' 表示启用,MCP 客户端会尝试连接到该服务器。

Dive Desktop 配置示例:

如果您使用 Dive Desktop 作为 MCP 客户端,可以按照以下步骤添加 Document Processing Server:

  1. 在 Dive Desktop 中,点击 "+ Add MCP Server"。
  2. 复制粘贴上述 JSON 配置信息到 Dive Desktop 的配置框中。
  3. 点击 "Save" 保存配置。

基本使用方法

命令行 (CLI)

全局安装后,您可以在终端中直接运行以下命令启动 Document Processing Server:

mcp-doc-forge

服务器成功启动后,它将监听来自 MCP 客户端的请求。

与 MCP 客户端集成 (例如 Dive Desktop)

  1. 启动服务器: 按照上述 "命令行 (CLI)" 方式启动 Document Processing Server,或者通过 Dive Desktop 等客户端自动启动 (如果客户端支持)。

  2. 客户端配置: 在 MCP 客户端(例如 Dive Desktop)中,配置并启用 Document Processing Server。确保客户端配置中的 'command' 和 'args' 与 "服务器配置" 部分的说明一致。

  3. 使用工具: 在 MCP 客户端中,您应该能够看到 Document Processing Server 提供的各种文档处理工具。根据您的需求选择相应的工具,并提供工具所需的输入参数(例如文件路径)。

    例如,在 Dive Desktop 中,您可以在 Prompt 中使用 '@tool_code' 或类似语法调用 Document Processing Server 提供的工具,例如:

    请读取文件 @file[path/to/your/document.docx] 的内容并总结。

    或者使用更明确的工具调用方式:

    @tool document_reader(filePath: "path/to/your/document.pdf")

    具体的工具调用方式取决于您使用的 MCP 客户端的功能和语法。请参考您使用的 MCP 客户端的文档来了解如何调用 MCP 服务器提供的工具。

注意:

  • Document Processing Server 默认使用 Stdio (标准输入输出) 作为传输协议与 MCP 客户端通信。
  • 服务器启动后,会在终端输出 "MCP Doc Forge Server is running" 表示服务器已成功运行。
  • 工具执行生成的文件通常会保存在您指定的 'outputDir' 目录下,并在响应中返回文件路径。您可能需要在 MCP 客户端中使用 "blank_link" 或类似机制来下载和访问这些生成的文件。

信息

分类

开发者工具