项目简介
Read Images 是一个基于 Model Context Protocol (MCP) 构建的服务器,它允许大型语言模型 (LLM) 客户端调用工具来分析图像。该服务器利用 OpenRouter API 接入多种视觉模型,例如 Claude 3.5 Sonnet 和 Claude 3 Opus,为用户提供强大的图像理解能力。
主要功能点
- 图像分析: 使用先进的视觉模型分析图像内容。
- 模型选择: 支持配置和动态选择不同的OpenRouter视觉模型。
- 问题定制: 允许用户自定义关于图像的提问。
- 图像优化: 自动调整图像大小和优化质量,以提高处理效率。
- 错误处理: 提供详细的错误信息,方便问题诊断。
安装步骤
- 安装 Node.js 和 npm: 确保你的系统已安装 Node.js 和 npm。
- 安装软件包: 在命令行中运行以下命令安装 'read_images' 软件包:
npm install @catalystneuro/mcp_read_images
服务器配置
要将 'read_images' 服务器添加到 MCP 客户端(例如 Claude IDE),你需要在客户端的 MCP 设置文件中进行配置。以下是一个配置示例,通常 MCP 客户端的配置文件位于 '~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json' (VSCode 示例路径)。
{ "mcpServers": { "read_images": { "command": "read_images", "env": { "OPENROUTER_API_KEY": "YOUR_OPENROUTER_API_KEY", "OPENROUTER_MODEL": "anthropic/claude-3.5-sonnet" }, "disabled": false, "autoApprove": [] } } }
请务必将 'YOUR_OPENROUTER_API_KEY' 替换为你从 OpenRouter 获取的 API 密钥。 'command' 字段指定了启动 MCP 服务器的命令,通常为安装的 npm 包名 'read_images'。'env' 字段用于设置环境变量,其中 'OPENROUTER_API_KEY' 是必需的,用于访问 OpenRouter API,'OPENROUTER_MODEL' 是可选的,用于设置默认使用的视觉模型。
基本使用方法
配置完成后,你可以在 MCP 客户端中使用 'analyze_image' 工具来分析图像。以下是一个使用示例:
use_mcp_tool({ server_name: "read_images", tool_name: "analyze_image", arguments: { image_path: "/path/to/your/image.jpg", question: "图像里有什么?" } });
请确保 'image_path' 参数提供的是绝对路径。你可以根据需要修改 'question' 参数来定制你的图像分析需求。 如果需要指定使用的模型,可以添加 'model' 参数:
use_mcp_tool({ server_name: "read_images", tool_name: "analyze_image", arguments: { image_path: "/path/to/your/image.jpg", question: "这张图片的主要颜色是什么?", model: "anthropic/claude-3-opus-20240229" } });
信息
分类
AI与计算