项目简介

Read Images 是一个基于 Model Context Protocol (MCP) 构建的服务器，它允许大型语言模型 (LLM) 客户端调用工具来分析图像。该服务器利用 OpenRouter API 接入多种视觉模型，例如 Claude 3.5 Sonnet 和 Claude 3 Opus，为用户提供强大的图像理解能力。

主要功能点

图像分析: 使用先进的视觉模型分析图像内容。
模型选择: 支持配置和动态选择不同的OpenRouter视觉模型。
问题定制: 允许用户自定义关于图像的提问。
图像优化: 自动调整图像大小和优化质量，以提高处理效率。
错误处理: 提供详细的错误信息，方便问题诊断。

安装步骤

安装 Node.js 和 npm: 确保你的系统已安装 Node.js 和 npm。

安装软件包: 在命令行中运行以下命令安装 'read_images' 软件包：

npm install @catalystneuro/mcp_read_images

服务器配置

要将 'read_images' 服务器添加到 MCP 客户端（例如 Claude IDE），你需要在客户端的 MCP 设置文件中进行配置。以下是一个配置示例，通常 MCP 客户端的配置文件位于 '~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json' (VSCode 示例路径)。

{
  "mcpServers": {
    "read_images": {
      "command": "read_images",
      "env": {
        "OPENROUTER_API_KEY": "YOUR_OPENROUTER_API_KEY",
        "OPENROUTER_MODEL": "anthropic/claude-3.5-sonnet"
      },
      "disabled": false,
      "autoApprove": []
    }
  }
}

请务必将 'YOUR_OPENROUTER_API_KEY' 替换为你从 OpenRouter 获取的 API 密钥。 'command' 字段指定了启动 MCP 服务器的命令，通常为安装的 npm 包名 'read_images'。'env' 字段用于设置环境变量，其中 'OPENROUTER_API_KEY' 是必需的，用于访问 OpenRouter API，'OPENROUTER_MODEL' 是可选的，用于设置默认使用的视觉模型。

基本使用方法

配置完成后，你可以在 MCP 客户端中使用 'analyze_image' 工具来分析图像。以下是一个使用示例：

use_mcp_tool({
  server_name: "read_images",
  tool_name: "analyze_image",
  arguments: {
    image_path: "/path/to/your/image.jpg",
    question: "图像里有什么？"
  }
});

请确保 'image_path' 参数提供的是绝对路径。你可以根据需要修改 'question' 参数来定制你的图像分析需求。如果需要指定使用的模型，可以添加 'model' 参数：

use_mcp_tool({
  server_name: "read_images",
  tool_name: "analyze_image",
  arguments: {
    image_path: "/path/to/your/image.jpg",
    question: "这张图片的主要颜色是什么？",
    model: "anthropic/claude-3-opus-20240229"
  }
});

关键词

项目简介

主要功能点

安装步骤

服务器配置

基本使用方法

信息