项目简介

Document Processing Server 是一个基于 Model Context Protocol (MCP) 构建的服务器，旨在为大型语言模型 (LLM) 应用提供强大的文档处理能力。它通过标准化的 MCP 协议与客户端通信，允许 LLM 客户端调用各种文档处理工具，例如读取不同格式的文档、进行文档格式转换、处理文本内容以及操作 HTML 文件。

主要功能点

文档读取: 支持读取 DOCX, PDF, TXT, HTML, CSV 等多种文档格式。
文档转换: 提供 DOCX 到 HTML/PDF，HTML 到 TXT/Markdown，以及 PDF 合并和分割等转换功能。
文本处理: 支持多编码转换 (UTF-8, Big5, GBK)，文本格式化和清理，文本比较和差异生成，以及按行或分隔符分割文本。
HTML 处理: 提供 HTML 清理和格式化，资源 (图片、链接、视频) 提取，以及结构保留的 HTML 转换。

安装步骤

通过 Smithery 安装 (推荐 Claude Desktop 用户)

如果您使用 Claude Desktop，可以通过 Smithery 自动安装 Document Processing Server。

打开终端，复制并执行以下命令：

npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude

手动安装

确保您已安装 Node.js 和 npm。

打开终端，执行以下命令全局安装 Document Processing Server：

npm install -g @cablate/mcp-doc-forge

服务器配置

为了让 MCP 客户端（例如 Dive Desktop）连接到 Document Processing Server，您需要提供以下配置信息。这些信息通常在 MCP 客户端的 "添加 MCP 服务器" 或类似的设置中配置。

{
  "serverName": "document-processing-server",  // 自定义服务器名称，在客户端中用于标识
  "command": "mcp-doc-forge",                 // 启动服务器的命令，全局安装后可以直接使用命令名
  "args": [],                                  // 启动命令的参数，本服务器无需额外参数
  "enabled": true                              // 设置为 true 启用该服务器配置
}

配置参数说明:

'serverName': 服务器名称，您可以自定义，用于在 MCP 客户端中区分不同的服务器。
'command': 启动 Document Processing Server 的命令。全局安装后，'mcp-doc-forge' 命令可以直接在终端中运行。
'args': 启动命令的参数。对于 Document Processing Server，默认情况下不需要额外的启动参数，所以设置为空数组 '[]' 即可。
'enabled': 指示该服务器配置是否启用。设置为 'true' 表示启用，MCP 客户端会尝试连接到该服务器。

Dive Desktop 配置示例:

如果您使用 Dive Desktop 作为 MCP 客户端，可以按照以下步骤添加 Document Processing Server：

在 Dive Desktop 中，点击 "+ Add MCP Server"。
复制粘贴上述 JSON 配置信息到 Dive Desktop 的配置框中。
点击 "Save" 保存配置。

基本使用方法

命令行 (CLI)

全局安装后，您可以在终端中直接运行以下命令启动 Document Processing Server：

mcp-doc-forge

服务器成功启动后，它将监听来自 MCP 客户端的请求。

与 MCP 客户端集成 (例如 Dive Desktop)

启动服务器: 按照上述 "命令行 (CLI)" 方式启动 Document Processing Server，或者通过 Dive Desktop 等客户端自动启动 (如果客户端支持)。
客户端配置: 在 MCP 客户端（例如 Dive Desktop）中，配置并启用 Document Processing Server。确保客户端配置中的 'command' 和 'args' 与 "服务器配置" 部分的说明一致。
使用工具: 在 MCP 客户端中，您应该能够看到 Document Processing Server 提供的各种文档处理工具。根据您的需求选择相应的工具，并提供工具所需的输入参数（例如文件路径）。

例如，在 Dive Desktop 中，您可以在 Prompt 中使用 '@tool_code' 或类似语法调用 Document Processing Server 提供的工具，例如：
```
请读取文件 @file[path/to/your/document.docx] 的内容并总结。
```
或者使用更明确的工具调用方式：
```
@tool document_reader(filePath: "path/to/your/document.pdf")
```
具体的工具调用方式取决于您使用的 MCP 客户端的功能和语法。请参考您使用的 MCP 客户端的文档来了解如何调用 MCP 服务器提供的工具。

注意:

Document Processing Server 默认使用 Stdio (标准输入输出) 作为传输协议与 MCP 客户端通信。
服务器启动后，会在终端输出 "MCP Doc Forge Server is running" 表示服务器已成功运行。
工具执行生成的文件通常会保存在您指定的 'outputDir' 目录下，并在响应中返回文件路径。您可能需要在 MCP 客户端中使用 "blank_link" 或类似机制来下载和访问这些生成的文件。

关键词