使用说明
项目简介
Handwriting OCR MCP Server 是一个基于 Model Context Protocol (MCP) 构建的服务器,旨在将 Handwriting OCR 强大的手写文字识别 API 以标准化的方式提供给各类 LLM 客户端,例如 Claude Desktop。通过此服务器,LLM 应用可以方便地调用 Handwriting OCR 的服务,实现文档上传、识别状态查询以及获取识别文本等功能。
主要功能点
- 文档上传: 支持上传图片和 PDF 文档至 Handwriting OCR API 进行手写文字识别。
- 状态查询: 查询已上传文档的识别状态,了解处理进度。
- 获取文本: 获取已完成识别的文档的文本内容,以 Markdown 格式返回。
安装步骤
- 安装 Node.js: 确保你的系统已安装 Node.js (推荐版本 18.x 或更高)。
- 获取 API Token: 访问 Handwriting OCR Platform 并注册账号,在 API 设置中获取 API Token。
- 安装 MCP Server: 可以通过 Smithery 自动安装,或者手动配置 Claude Desktop 的 'mcpServers'。
服务器配置
以下是 Claude Desktop 'mcpServers' 的手动配置示例,用于连接 Handwriting OCR MCP Server。你需要将 'API_TOKEN' 替换为你自己的 API Token,并将 'args' 中的路径 '/Users/mateo/Local/Code/MCP/handwriting-ocr/build/index.js' 替换为你的 'index.js' 文件的实际路径。
{ "mcpServers": { "handwriting-ocr": { "command": "node", "args": [ "/path/to/handwriting-ocr-mcp-server/build/index.js" // 请替换为你的 index.js 文件路径 ], "env": { "API_TOKEN": "YOUR_API_TOKEN" // 请替换为你的 Handwriting OCR API Token }, "disabled": false, "autoApprove": [] } } }
基本使用方法
- 启动 MCP 服务器。
- 在支持 MCP 协议的 LLM 客户端(如 Claude Desktop)中配置并连接到 Handwriting OCR MCP 服务器。
- 在 LLM 应用中,可以使用以下工具调用 Handwriting OCR 服务:
- 'upload_document': 上传文档进行识别。
- 'check_status': 查询文档识别状态,需要文档 ID。
- 'get_text': 获取文档识别结果,需要文档 ID。
信息
分类
AI与计算