项目简介
MCP图像生成服务器是一个功能强大的后端服务,旨在将Google Gemini 2.5 Flash的先进图像生成和编辑能力无缝集成到Claude Code、Cursor等支持Model Context Protocol (MCP) 的AI开发工具中。它通过标准化的MCP协议与AI助手通信,将复杂的图像操作抽象为简单的工具调用,从而提升开发效率和AI应用的创造力。
主要功能点
- AI驱动的图像生成: 依据文本描述生成全新图像,利用Google Gemini 2.5 Flash Image Preview实现高品质输出。
- 智能提示词优化: 自动使用Google Gemini 2.0 Flash优化用户的提示词,添加摄影和艺术细节,丰富光线、构图和氛围描述,最大化图像生成质量。
- 图像编辑: 基于自然语言指令对现有图像进行变换和修改,智能保持原始风格和视觉一致性。
- 高级选项: 支持多图像混合以创建复合场景、跨代角色一致性保持,以及集成世界知识以获取更准确的上下文。
- 多种输出格式: 支持PNG、JPEG、WebP等多种主流图像格式。
- 文件输出: 生成的图像将以文件形式保存到指定目录,方便访问和集成。
安装步骤
- 安装Node.js: 确保您的系统已安装Node.js 20或更高版本。
- 获取Gemini API Key: 访问 Google AI Studio 获取您的Gemini API密钥。
- 安装MCP图像生成器: MCP图像生成器通常无需全局安装,可直接通过 'npx' 命令运行,这在配置MCP客户端时会自动处理。
服务器配置
MCP服务器需要配置才能被您的AI客户端(如Claude Code或Cursor)发现并连接。以下是配置的关键信息:
-
针对Claude Code: 在命令行中运行以下命令添加MCP服务器。
- 'claude mcp add mcp-image': 添加名为 'mcp-image' 的MCP服务器。
- '--env GEMINI_API_KEY=your-api-key': 设置您的Google Gemini API密钥。请务必替换 'your-api-key'。
- '--env IMAGE_OUTPUT_DIR=/absolute/path/to/images': 设置生成图像的输出目录。请替换为绝对路径。
- '-- npx -y mcp-image': 这是MCP服务器的启动命令。 如果您想禁用自动提示词优化功能,可以添加 '--env SKIP_PROMPT_ENHANCEMENT=true'。 示例命令行:
claude mcp add mcp-image --env GEMINI_API_KEY=your-api-key --env IMAGE_OUTPUT_DIR=/absolute/path/to/images -- npx -y mcp-image -
针对Cursor: 在Cursor的设置文件(全局: '~/.cursor/mcp.json' 或项目特定: '.cursor/mcp.json')中添加以下JSON配置片段。
- '"mcp-image"': MCP服务器的名称。
- '"command": "npx"': 启动服务器的命令。
- '"args": ["-y", "mcp-image"]': 启动命令的参数。
- '"env"': 环境变量配置。
- '"GEMINI_API_KEY": "your_gemini_api_key_here"': 您的Google Gemini API密钥。请替换 'your_gemini_api_key_here'。
- '"IMAGE_OUTPUT_DIR": "/absolute/path/to/images"': 生成图像的输出目录。请替换为绝对路径。
- '"SKIP_PROMPT_ENHANCEMENT": "false"': 控制是否跳过提示词优化(设置为 '"true"' 禁用)。 Cursor 配置示例 (JSON):
{ "mcpServers": { "mcp-image": { "command": "npx", "args": ["-y", "mcp-image"], "env": { "GEMINI_API_KEY": "your_gemini_api_key_here", "IMAGE_OUTPUT_DIR": "/absolute/path/to/images", "SKIP_PROMPT_ENHANCEMENT": "false" } } } }注意: 'IMAGE_OUTPUT_DIR' 必须是一个绝对路径(例如,'/Users/username/images'),而非相对路径。如果未指定,默认为当前工作目录下的 './output' 目录,该目录会自动创建。
基本使用方法
配置完成后,您可以在AI助手(如Claude Code或Cursor)中直接使用自然语言指令来生成和编辑图像。AI助手会识别并调用MCP服务器提供的 'generate_image' 工具。
-
基本图像生成: 直接向AI助手描述您想要生成的图像内容。
"生成一幅日落时分的宁静山水画,湖面倒映着夕阳"MCP服务器会自动优化此提示,加入丰富的光线、构图等细节。
-
图像编辑: 提供现有图像的绝对路径和编辑指令。
"编辑这张图片,让人物面向右侧" (同时,AI助手会识别并提供参数 inputImagePath: "/path/to/image.jpg") -
高级特性调用: 在提示中说明高级功能需求,AI助手会相应地传递参数。
"生成一张中世纪骑士的肖像画,并在后续变化中保持角色形象一致性" (同时,AI助手会识别并提供参数 maintainCharacterConsistency: true)
信息
分类
AI与计算