使用说明
项目简介
本项目是一个实现了Model Context Protocol (MCP) 协议的服务器,旨在为支持MCP协议的LLM客户端(如Roo Code)提供图像生成功能。它利用Google Gemini 2.0 Flash模型,允许用户通过简单的文本描述生成图像。
主要功能点
- 文生图能力: 通过 'generate_image' 工具,根据文本prompt生成图像。
- 参数可控: 支持调整图像生成的温度、topP、topK和最大输出tokens等参数,以控制生成结果的随机性和多样性。
- 易于集成: 提供简单的安装和配置步骤,方便集成到Roo Code 和 Claude Desktop 等MCP客户端。
- Web界面: 内置简单的Web界面,用于测试图像生成功能。
安装步骤
- 安装Node.js: 确保已安装 Node.js 18 或更高版本。
- 获取API Key: 访问 Google AI Studio 获取 Gemini API Key,并确保已启用 Gemini 2.0 Flash 模型的访问权限。
- 全局安装 (推荐):
npm install -g gemini-flash-mcp gemini-flash-mcp-install - 手动安装:
git clone https://github.com/jezweb/gemini-image-generation-mcp.git cd gemini-image-generation-mcp npm install npm run build
服务器配置
对于 MCP 客户端,您需要配置 MCP 服务器的连接信息。以 JSON 格式配置 'gemini-flash-mcp' 服务器,示例如下:
{ "gemini-flash-mcp": { "command": "node", "args": ["/path/to/gemini-flash-mcp/build/index.js"], // command: 启动服务器的命令,这里使用 node // args: 命令参数,指向服务器入口文件 build/index.js 的路径 (请替换为实际路径) "env": { "GEMINI_API_KEY": "your-google-ai-api-key" // env: 环境变量配置 // GEMINI_API_KEY: 您的 Google AI API Key,**请替换为您的真实API Key** } } }
注意:
- '/path/to/gemini-flash-mcp/build/index.js' 需要替换为您实际 'gemini-image-generation-mcp' 仓库 build 目录下 'index.js' 文件的绝对路径。如果您是全局安装,则无需指定 args,'command' 可以直接是 'gemini-flash-mcp' (如果 package.json 中配置了 bin)。
- 'your-google-ai-api-key' 需要替换为您在 Google AI Studio 获取的真实 API Key。
- 请将以上配置添加到您的 MCP 客户端(如 Roo Code 或 Claude Desktop)的 MCP 服务器配置中。具体配置文件路径请参考仓库 README 或 MCP 客户端的文档。
基本使用方法
在配置完成后,您可以在 MCP 客户端中使用 'generate_image' 工具来生成图像。例如,在 Roo Code 中,您可以输入类似以下的指令:
请生成一张悉尼歌剧院的帆船图像
工具 'generate_image' 接受以下参数:
- 'prompt' (必填): 图像的文本描述。
- 'temperature': 控制随机性 (0.0 到 1.0, 默认 1.0)。
- 'topP': 控制 nucleus sampling 的多样性 (0.0 到 1.0, 默认 0.95)。
- 'topK': 控制 top-k sampling 的多样性 (默认 40)。
- 'maxOutputTokens': 最大生成 tokens 数量 (默认 8192)。
具体使用方式请参考您的 MCP 客户端的使用文档。
信息
分类
AI与计算