Gemini图像生成MCP服务器

关键词

图像生成文生图 Gemini AI工具 Roo Code

使用说明

项目简介

本项目是一个实现了Model Context Protocol (MCP) 协议的服务器，旨在为支持MCP协议的LLM客户端（如Roo Code）提供图像生成功能。它利用Google Gemini 2.0 Flash模型，允许用户通过简单的文本描述生成图像。

主要功能点

文生图能力: 通过 'generate_image' 工具，根据文本prompt生成图像。
参数可控: 支持调整图像生成的温度、topP、topK和最大输出tokens等参数，以控制生成结果的随机性和多样性。
易于集成: 提供简单的安装和配置步骤，方便集成到Roo Code 和 Claude Desktop 等MCP客户端。
Web界面: 内置简单的Web界面，用于测试图像生成功能。

安装步骤

安装Node.js: 确保已安装 Node.js 18 或更高版本。
获取API Key: 访问 Google AI Studio 获取 Gemini API Key，并确保已启用 Gemini 2.0 Flash 模型的访问权限。

全局安装 (推荐):

npm install -g gemini-flash-mcp
gemini-flash-mcp-install

手动安装:

git clone https://github.com/jezweb/gemini-image-generation-mcp.git
cd gemini-image-generation-mcp
npm install
npm run build

服务器配置

对于 MCP 客户端，您需要配置 MCP 服务器的连接信息。以 JSON 格式配置 'gemini-flash-mcp' 服务器，示例如下：

{
  "gemini-flash-mcp": {
    "command": "node",
    "args": ["/path/to/gemini-flash-mcp/build/index.js"],
    // command: 启动服务器的命令，这里使用 node
    // args: 命令参数，指向服务器入口文件 build/index.js 的路径 (请替换为实际路径)
    "env": {
      "GEMINI_API_KEY": "your-google-ai-api-key"
      // env: 环境变量配置
      // GEMINI_API_KEY: 您的 Google AI API Key，**请替换为您的真实API Key**
    }
  }
}

注意:

'/path/to/gemini-flash-mcp/build/index.js' 需要替换为您实际 'gemini-image-generation-mcp' 仓库 build 目录下 'index.js' 文件的绝对路径。如果您是全局安装，则无需指定 args，'command' 可以直接是 'gemini-flash-mcp' (如果 package.json 中配置了 bin)。
'your-google-ai-api-key' 需要替换为您在 Google AI Studio 获取的真实 API Key。
请将以上配置添加到您的 MCP 客户端（如 Roo Code 或 Claude Desktop）的 MCP 服务器配置中。具体配置文件路径请参考仓库 README 或 MCP 客户端的文档。

基本使用方法

在配置完成后，您可以在 MCP 客户端中使用 'generate_image' 工具来生成图像。例如，在 Roo Code 中，您可以输入类似以下的指令：

请生成一张悉尼歌剧院的帆船图像

工具 'generate_image' 接受以下参数：

'prompt' (必填): 图像的文本描述。
'temperature': 控制随机性 (0.0 到 1.0, 默认 1.0)。
'topP': 控制 nucleus sampling 的多样性 (0.0 到 1.0, 默认 0.95)。
'topK': 控制 top-k sampling 的多样性 (默认 40)。
'maxOutputTokens': 最大生成 tokens 数量 (默认 8192)。

具体使用方式请参考您的 MCP 客户端的使用文档。

服务器信息

分类