使用说明

项目简介

Orion Vision MCP Server 是一个实现了 Model Context Protocol (MCP) 的服务器,旨在为大型语言模型(LLM)客户端提供强大的文档处理能力。它利用 Azure Form Recognizer 服务,能够分析各种文档并从中提取结构化数据,从而扩展 LLM 在信息获取和处理方面的能力。

主要功能点

  • 文档分析: 使用 Azure Form Recognizer 分析文档内容,并返回 JSON 格式的结构化数据。
  • 表单数据提取: 支持从多种类型的表单(如收据、发票、身份证等)中提取数据,并以结构化形式提供。
  • 易于集成: 兼容 Cline, Cursor, Claude Desktop 等多种 MCP 客户端,可以通过简单的配置快速集成到现有的 LLM 工作流程中。
  • 标准化协议: 基于 MCP 标准协议,确保与各种 MCP 客户端的互操作性和兼容性。

安装步骤

  1. 安装 Node.js: 确保你的系统中安装了 Node.js (v20 或更高版本)。
  2. 安装 Orion Vision MCP Server: 打开终端,运行以下命令即可安装并启动服务器:
    npx -y orion-vision-mcp@latest
    这将使用 'npx' 直接运行最新版本的 Orion Vision MCP Server,无需全局安装。

服务器配置

为了让 MCP 客户端(如 Cline, Cursor, Claude Desktop)连接到 Orion Vision MCP Server,你需要在客户端中配置服务器信息。以下是通用的配置信息,你需要将其添加到 MCP 客户端的服务器配置文件中。请务必替换 'environmentVariables' 中的 'your-form-recognizer-endpoint' 和 'your-form-recognizer-key' 为你自己的 Azure Form Recognizer 凭据

{
  "serverName": "orion-vision-mcp",
  "command": "npx",
  "args": ["-y", "orion-vision-mcp@latest"],
  "environmentVariables": {
    "AZURE_FORM_RECOGNIZER_ENDPOINT": "your-form-recognizer-endpoint", // 替换为你的 Azure Form Recognizer 终结点
    "AZURE_FORM_RECOGNIZER_KEY": "your-form-recognizer-key"  // 替换为你的 Azure Form Recognizer 密钥
  }
}

配置说明:

  • 'serverName': 服务器的名称,可以自定义,用于在客户端中标识该服务器。
  • 'command': 启动服务器的命令,这里使用 'npx' 运行 'orion-vision-mcp@latest'。
  • 'args': 传递给 'command' 的参数,这里为空。
  • 'environmentVariables': 设置环境变量,用于配置 Azure Form Recognizer 的连接信息。
    • 'AZURE_FORM_RECOGNIZER_ENDPOINT': 你的 Azure Form Recognizer 服务终结点 URL。
    • 'AZURE_FORM_RECOGNIZER_KEY': 你的 Azure Form Recognizer 服务密钥。

基本使用方法

成功配置并启动 Orion Vision MCP Server 后,在 MCP 客户端中,你可以通过自然语言指令调用服务器提供的工具。例如,在 Claude Desktop 应用中,你可以这样提问:

  • 'Analyze the document at "https://example.com/document.pdf" using Azure Form Recognizer.' (分析文档)
  • 'Extract data from the invoice at "https://example.com/invoice.pdf".' (提取发票数据)

服务器将使用 Azure Form Recognizer 处理文档,并将分析结果返回给客户端。你可以在客户端中进一步利用这些结构化数据。

信息

分类

AI与计算