项目简介

Read Images 是一个基于 Model Context Protocol (MCP) 构建的服务器,它允许大型语言模型 (LLM) 客户端调用工具来分析图像。该服务器利用 OpenRouter API 接入多种视觉模型,例如 Claude 3.5 Sonnet 和 Claude 3 Opus,为用户提供强大的图像理解能力。

主要功能点

  • 图像分析: 使用先进的视觉模型分析图像内容。
  • 模型选择: 支持配置和动态选择不同的OpenRouter视觉模型。
  • 问题定制: 允许用户自定义关于图像的提问。
  • 图像优化: 自动调整图像大小和优化质量,以提高处理效率。
  • 错误处理: 提供详细的错误信息,方便问题诊断。

安装步骤

  1. 安装 Node.js 和 npm: 确保你的系统已安装 Node.js 和 npm。
  2. 安装软件包: 在命令行中运行以下命令安装 'read_images' 软件包:
    npm install @catalystneuro/mcp_read_images

服务器配置

要将 'read_images' 服务器添加到 MCP 客户端(例如 Claude IDE),你需要在客户端的 MCP 设置文件中进行配置。以下是一个配置示例,通常 MCP 客户端的配置文件位于 '~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json' (VSCode 示例路径)。

{
  "mcpServers": {
    "read_images": {
      "command": "read_images",
      "env": {
        "OPENROUTER_API_KEY": "YOUR_OPENROUTER_API_KEY",
        "OPENROUTER_MODEL": "anthropic/claude-3.5-sonnet"
      },
      "disabled": false,
      "autoApprove": []
    }
  }
}

请务必将 'YOUR_OPENROUTER_API_KEY' 替换为你从 OpenRouter 获取的 API 密钥。 'command' 字段指定了启动 MCP 服务器的命令,通常为安装的 npm 包名 'read_images'。'env' 字段用于设置环境变量,其中 'OPENROUTER_API_KEY' 是必需的,用于访问 OpenRouter API,'OPENROUTER_MODEL' 是可选的,用于设置默认使用的视觉模型。

基本使用方法

配置完成后,你可以在 MCP 客户端中使用 'analyze_image' 工具来分析图像。以下是一个使用示例:

use_mcp_tool({
  server_name: "read_images",
  tool_name: "analyze_image",
  arguments: {
    image_path: "/path/to/your/image.jpg",
    question: "图像里有什么?"
  }
});

请确保 'image_path' 参数提供的是绝对路径。你可以根据需要修改 'question' 参数来定制你的图像分析需求。 如果需要指定使用的模型,可以添加 'model' 参数:

use_mcp_tool({
  server_name: "read_images",
  tool_name: "analyze_image",
  arguments: {
    image_path: "/path/to/your/image.jpg",
    question: "这张图片的主要颜色是什么?",
    model: "anthropic/claude-3-opus-20240229"
  }
});

信息

分类

AI与计算