使用说明
项目简介
Gemini 图像生成 MCP 服务器是一个基于 Model Context Protocol (MCP) 构建的后端服务,旨在扩展 Claude Desktop 的功能,使其能够利用 Google Gemini AI 模型生成图像。通过注册 'generate_image' 工具,该服务器允许 Claude Desktop 用户通过自然语言指令,调用 Gemini API 生成高质量的图像,并将图像保存到本地文件系统。
主要功能点
- 图像生成服务: 集成 Google Gemini API,提供强大的文本到图像生成能力。
- Claude Desktop 集成: 通过 MCP 协议无缝对接 Claude Desktop 应用,扩展其图像处理能力。
- 易于安装和配置: 提供安装向导和手动配置选项,简化服务器部署过程。
- 可定制的参数: 支持调整图像生成的风格、温度等参数,满足多样化的创作需求。
- 详细日志记录: 提供调试日志,方便用户监控服务器运行状态和排查问题。
安装步骤
- 安装 Node.js: 确保您的系统已安装 Node.js (16.x 或更高版本)。
- 全局安装 (推荐): 打开终端,运行命令 'npm install -g gemini-mcp-server' 进行全局安装。
- 运行安装向导: 安装完成后,运行命令 'npx gemini-mcp-setup' 启动配置向导。向导将引导您完成 Gemini API 密钥、图像保存目录等关键配置。
服务器配置 (Claude Desktop)
要将 Gemini MCP 服务器连接到 Claude Desktop,您需要编辑 Claude Desktop 的配置文件 '~/.config/claude/claude_desktop_config.json',添加或修改 'mcpServers' 部分。以下是一个配置示例,您需要根据实际安装路径进行调整。
"mcpServers": { "gemini-image": { "command": "/bin/bash", "args": [ "-c", "/path/to/your/gemini-mcp-wrapper.sh" // wrapper 脚本路径,安装向导可以自动创建。如果手动配置,请确保路径正确。 ], "env": { "GEMINI_API_KEY": "YOUR_GEMINI_API_KEY_HERE", // 您的 Gemini API 密钥,推荐通过安装向导或环境变量配置,避免直接写入配置文件。 "DEBUG": "true" // 可选:启用调试日志,方便问题排查。 } } }
配置说明:
- '"gemini-image"': 服务器名称,在 Claude Desktop 内部用于标识该 MCP 服务器。
- '"command"': 启动服务器的命令,通常为 Bash shell。
- '"args"': 传递给 'command' 的参数数组。这里使用 '-c' 参数执行一个 shell 命令,即 wrapper 脚本的路径。
- '"env"': 传递给服务器进程的环境变量。
- '"GEMINI_API_KEY"': 必须配置,您的 Google Gemini API 密钥。
- '"DEBUG"': 可选,设置为 '"true"' 启用调试模式。
注意: 安装向导 ('npx gemini-mcp-setup') 可以自动创建 'gemini-mcp-wrapper.sh' 脚本并尝试更新 'claude_desktop_config.json' 文件。如果您选择手动配置,请确保脚本路径和 API 密钥配置正确。
基本使用方法
- 重启 Claude Desktop: 完成配置后,重启 Claude Desktop 应用使配置生效。
- 发起图像生成请求: 在 Claude Desktop 的聊天界面中,使用自然语言指令要求 Claude 生成图像。例如:
- "Generate an image of a mountain landscape at sunset" (生成一张日落时分山景的图片)
- "Create a picture of a futuristic city with flying cars" (创作一张未来城市,有飞行汽车的图片)
- "Make an illustration of a cat playing piano" (画一张猫弹钢琴的插画)
Claude 将调用 Gemini MCP 服务器,使用 Gemini API 生成图像,并将图像保存到您配置的输出目录下,同时在聊天界面中提供图像文件路径。
高级用法
您可以在提示语中添加更多参数来定制图像生成效果,例如:
- 风格 (Style): 指定图像风格,如 "realistic" (真实的), "artistic" (艺术的), "minimalistic" (极简的) 等。
- 温度 (Temperature): 控制生成图像的随机性和创造性,取值范围 0.0-1.0,值越低图像越可预测,值越高越有创意。
示例: "Generate an image of a cyberpunk city with neon lights in a realistic style with temperature 0.7" (生成一张霓虹灯赛博朋克城市风格的真实感图像,温度为 0.7)
信息
分类
AI与计算