使用说明
项目简介
Orion Vision MCP Server 是一个实现了 Model Context Protocol (MCP) 的服务器,旨在为大型语言模型(LLM)客户端提供强大的文档处理能力。它利用 Azure Form Recognizer 服务,能够分析各种文档并从中提取结构化数据,从而扩展 LLM 在信息获取和处理方面的能力。
主要功能点
- 文档分析: 使用 Azure Form Recognizer 分析文档内容,并返回 JSON 格式的结构化数据。
- 表单数据提取: 支持从多种类型的表单(如收据、发票、身份证等)中提取数据,并以结构化形式提供。
- 易于集成: 兼容 Cline, Cursor, Claude Desktop 等多种 MCP 客户端,可以通过简单的配置快速集成到现有的 LLM 工作流程中。
- 标准化协议: 基于 MCP 标准协议,确保与各种 MCP 客户端的互操作性和兼容性。
安装步骤
- 安装 Node.js: 确保你的系统中安装了 Node.js (v20 或更高版本)。
- 安装 Orion Vision MCP Server: 打开终端,运行以下命令即可安装并启动服务器:
这将使用 'npx' 直接运行最新版本的 Orion Vision MCP Server,无需全局安装。npx -y orion-vision-mcp@latest
服务器配置
为了让 MCP 客户端(如 Cline, Cursor, Claude Desktop)连接到 Orion Vision MCP Server,你需要在客户端中配置服务器信息。以下是通用的配置信息,你需要将其添加到 MCP 客户端的服务器配置文件中。请务必替换 'environmentVariables' 中的 'your-form-recognizer-endpoint' 和 'your-form-recognizer-key' 为你自己的 Azure Form Recognizer 凭据。
{ "serverName": "orion-vision-mcp", "command": "npx", "args": ["-y", "orion-vision-mcp@latest"], "environmentVariables": { "AZURE_FORM_RECOGNIZER_ENDPOINT": "your-form-recognizer-endpoint", // 替换为你的 Azure Form Recognizer 终结点 "AZURE_FORM_RECOGNIZER_KEY": "your-form-recognizer-key" // 替换为你的 Azure Form Recognizer 密钥 } }
配置说明:
- 'serverName': 服务器的名称,可以自定义,用于在客户端中标识该服务器。
- 'command': 启动服务器的命令,这里使用 'npx' 运行 'orion-vision-mcp@latest'。
- 'args': 传递给 'command' 的参数,这里为空。
- 'environmentVariables': 设置环境变量,用于配置 Azure Form Recognizer 的连接信息。
- 'AZURE_FORM_RECOGNIZER_ENDPOINT': 你的 Azure Form Recognizer 服务终结点 URL。
- 'AZURE_FORM_RECOGNIZER_KEY': 你的 Azure Form Recognizer 服务密钥。
基本使用方法
成功配置并启动 Orion Vision MCP Server 后,在 MCP 客户端中,你可以通过自然语言指令调用服务器提供的工具。例如,在 Claude Desktop 应用中,你可以这样提问:
- 'Analyze the document at "https://example.com/document.pdf" using Azure Form Recognizer.' (分析文档)
- 'Extract data from the invoice at "https://example.com/invoice.pdf".' (提取发票数据)
服务器将使用 Azure Form Recognizer 处理文档,并将分析结果返回给客户端。你可以在客户端中进一步利用这些结构化数据。
信息
分类
AI与计算