使用说明

项目简介

Gemini 图像生成 MCP 服务器是一个基于 Model Context Protocol (MCP) 构建的后端服务,旨在扩展 Claude Desktop 的功能,使其能够利用 Google Gemini AI 模型生成图像。通过注册 'generate_image' 工具,该服务器允许 Claude Desktop 用户通过自然语言指令,调用 Gemini API 生成高质量的图像,并将图像保存到本地文件系统。

主要功能点

  • 图像生成服务: 集成 Google Gemini API,提供强大的文本到图像生成能力。
  • Claude Desktop 集成: 通过 MCP 协议无缝对接 Claude Desktop 应用,扩展其图像处理能力。
  • 易于安装和配置: 提供安装向导和手动配置选项,简化服务器部署过程。
  • 可定制的参数: 支持调整图像生成的风格、温度等参数,满足多样化的创作需求。
  • 详细日志记录: 提供调试日志,方便用户监控服务器运行状态和排查问题。

安装步骤

  1. 安装 Node.js: 确保您的系统已安装 Node.js (16.x 或更高版本)。
  2. 全局安装 (推荐): 打开终端,运行命令 'npm install -g gemini-mcp-server' 进行全局安装。
  3. 运行安装向导: 安装完成后,运行命令 'npx gemini-mcp-setup' 启动配置向导。向导将引导您完成 Gemini API 密钥、图像保存目录等关键配置。

服务器配置 (Claude Desktop)

要将 Gemini MCP 服务器连接到 Claude Desktop,您需要编辑 Claude Desktop 的配置文件 '~/.config/claude/claude_desktop_config.json',添加或修改 'mcpServers' 部分。以下是一个配置示例,您需要根据实际安装路径进行调整。

"mcpServers": {
  "gemini-image": {
    "command": "/bin/bash",
    "args": [
      "-c",
      "/path/to/your/gemini-mcp-wrapper.sh"  //  wrapper 脚本路径,安装向导可以自动创建。如果手动配置,请确保路径正确。
    ],
    "env": {
      "GEMINI_API_KEY": "YOUR_GEMINI_API_KEY_HERE", // 您的 Gemini API 密钥,推荐通过安装向导或环境变量配置,避免直接写入配置文件。
      "DEBUG": "true" // 可选:启用调试日志,方便问题排查。
    }
  }
}

配置说明:

  • '"gemini-image"': 服务器名称,在 Claude Desktop 内部用于标识该 MCP 服务器。
  • '"command"': 启动服务器的命令,通常为 Bash shell。
  • '"args"': 传递给 'command' 的参数数组。这里使用 '-c' 参数执行一个 shell 命令,即 wrapper 脚本的路径。
  • '"env"': 传递给服务器进程的环境变量。
    • '"GEMINI_API_KEY"': 必须配置,您的 Google Gemini API 密钥。
    • '"DEBUG"': 可选,设置为 '"true"' 启用调试模式。

注意: 安装向导 ('npx gemini-mcp-setup') 可以自动创建 'gemini-mcp-wrapper.sh' 脚本并尝试更新 'claude_desktop_config.json' 文件。如果您选择手动配置,请确保脚本路径和 API 密钥配置正确。

基本使用方法

  1. 重启 Claude Desktop: 完成配置后,重启 Claude Desktop 应用使配置生效。
  2. 发起图像生成请求: 在 Claude Desktop 的聊天界面中,使用自然语言指令要求 Claude 生成图像。例如:
    • "Generate an image of a mountain landscape at sunset" (生成一张日落时分山景的图片)
    • "Create a picture of a futuristic city with flying cars" (创作一张未来城市,有飞行汽车的图片)
    • "Make an illustration of a cat playing piano" (画一张猫弹钢琴的插画)

Claude 将调用 Gemini MCP 服务器,使用 Gemini API 生成图像,并将图像保存到您配置的输出目录下,同时在聊天界面中提供图像文件路径。

高级用法

您可以在提示语中添加更多参数来定制图像生成效果,例如:

  • 风格 (Style): 指定图像风格,如 "realistic" (真实的), "artistic" (艺术的), "minimalistic" (极简的) 等。
  • 温度 (Temperature): 控制生成图像的随机性和创造性,取值范围 0.0-1.0,值越低图像越可预测,值越高越有创意。

示例: "Generate an image of a cyberpunk city with neon lights in a realistic style with temperature 0.7" (生成一张霓虹灯赛博朋克城市风格的真实感图像,温度为 0.7)

信息

分类

AI与计算