使用说明

  • 项目简介: Rhubarb 是一个轻量级的 Python 框架,旨在简化使用多模态大型语言模型(LLM)和嵌入模型构建文档和视频理解应用程序的过程。Rhubarb MCP 服务是该框架的后端实现,通过 Model Context Protocol (MCP) 标准化协议,将 Rhubarb 的所有功能(文档分析、视频处理、实体提取、文档分类等)以工具和资源的形式暴露给兼容的 LLM 客户端,如 Cline 或 Claude Desktop。

  • 主要功能点:

    • 文档分析: 支持对 PDF、DOCX、TIFF、PNG、JPG 等格式的文档进行问答、流式聊天、总结、结构化数据提取、命名实体识别(NER)和 PII 识别。
    • 视频分析: 支持对 MP4、AVI、MOV 等常见视频格式进行总结、实体提取、动作分析和文本提取。
    • 上下文管理: 内置会话记忆功能,可在交互中保持聊天历史。
    • 可扩展性: 支持自定义系统提示、JSON 模式输出,并可处理大型文档(通过滑动窗口方法)。
    • 云原生集成: 原生支持 Amazon Bedrock 模型,并可配置 AWS 认证。
  • 安装步骤: Rhubarb MCP 服务在首次使用时会自动安装,无需单独的安装步骤。您的 MCP 客户端会通过 'uvx' 命令自动获取和安装必要的 Python 包。

  • 服务器配置: 您的 MCP 客户端(例如 Cline)需要一个 JSON 格式的配置来启动 Rhubarb MCP 服务器。以下是您需要配置的关键信息及其说明,请根据您的实际情况进行填写:

    1. 服务器名称 (Server Name): 您可以在客户端配置中为 Rhubarb 服务器指定一个易于识别的名称,例如 '"rhubarb"'。
    2. 启动命令 (Command): 用于启动服务器的命令,通常是 '"uvx"'。
    3. 启动参数 (Args): 一个包含多个字符串的列表,用于指定服务器的启动参数:
      • '"pyrhubarb-mcp@latest"': 这是启动 Rhubarb MCP 服务器的应用程序标识符,表示使用最新版本。
      • '"--aws-profile", "您的AWS配置文件名"': (认证方式之一,与Access Key二选一) 指定用于 AWS 认证的配置文件名称,例如 'my-profile'。
      • '"--aws-access-key-id", "您的Access Key ID"' 和 '"--aws-secret-access-key", "您的Secret Access Key"': (认证方式之一,与AWS Profile二选一) 您也可以选择直接提供 AWS Access Key ID 和 Secret Access Key 进行认证。
      • '"--aws-region", "您的AWS区域"': 指定 Rhubarb 服务器连接 AWS 服务所在的区域,例如 'us-east-1'。
      • '"--default-model", "默认使用的LLM模型"': 设置服务器在处理请求时默认使用的 LLM 模型。例如,'claude-sonnet' 适用于文档分析,'nova-lite' 适用于视频分析。
      • '"--enable-cri"': (可选) 如果需要启用跨区域推理功能,请添加此参数(无需额外值)。
      • '"--default-bucket", "S3桶名"': (可选) 为文档分类功能指定一个默认的 Amazon S3 存储桶名称。

    示例(您的 MCP 客户端配置可能类似如下,请将占位符替换为您的实际信息):

    {
      "myRhubarbServer": {
        "command": "uvx",
        "args": [
          "pyrhubarb-mcp@latest",
          "--aws-profile", "your-aws-profile-name",
          "--aws-region", "us-east-1",
          "--default-model", "claude-sonnet"
        ]
      }
    }
  • 基本使用方法: 配置完成后,您可以在 MCP 客户端中直接与 Rhubarb 服务器交互。客户端会自动发现 Rhubarb 服务器提供的工具和资源。您可以通过客户端界面或直接的 JSON-RPC 请求,调用 Rhubarb 提供的工具来执行文档问答、视频分析、实体提取等任务。

    例如,要分析一个文档,您可以通过客户端调用 'analyze_document' 工具,并提供 'file_path' (文档的本地路径或 S3 URI)和 'message' (您的请求或问题)参数。服务器将返回处理结果。

信息

分类

AI与计算