项目简介
Nano Banana 是一个强大的Gemini CLI扩展,它作为一个MCP服务器运行,利用Gemini 2.5 Flash图像模型提供丰富的图像处理能力。它通过标准化的Model Context Protocol (MCP) 与客户端(如Gemini CLI)通信,响应图像生成、编辑和修复等请求。
主要功能点
- 文本到图像生成: 根据文字描述创建高质量图像,支持多种艺术风格(如写实、水彩、动漫)、变体(如不同光照、角度)和批量生成。
- 图像编辑与修复: 上传现有图片,通过自然语言指令进行修改,例如添加物体、改变背景,或修复旧照片、增强图片质量。
- 专业图形生成: 专门用于生成应用程序图标、网站图标、用户界面元素、无缝纹理图案、视觉故事序列和技术图表(如流程图、架构图)。
- 智能文件管理: 自动根据提示生成用户友好的文件名,防止文件重复,并管理输入和输出图像文件的存储路径。
安装步骤
- 前提条件: 确保您的系统已安装并配置好以下环境:
- Gemini CLI: Google官方的Gemini命令行接口工具。
- Node.js 20+ 及 npm: JavaScript运行时和包管理器。
- API密钥设置: 您需要一个Gemini或Google Cloud的API密钥。请设置以下任一环境变量,推荐使用前两个:
- 'NANOBOBANANA_GEMINI_API_KEY'
- 'NANOBANANA_GOOGLE_API_KEY'
- 如果上述变量未设置,程序将依次尝试 'GEMINI_API_KEY' 或 'GOOGLE_API_KEY' 作为备用。
- 有关身份验证的详细信息,请参阅Gemini CLI官方文档。
- 安装扩展: 使用Gemini CLI的命令安装Nano Banana扩展:
gemini extensions install https://github.com/gemini-cli-extensions/nanobanana - 激活: 安装完成后,重启Gemini CLI。本服务提供的所有命令(如 '/generate', '/edit', '/nanobanana' 等)即可使用。
MCP服务器配置
本MCP服务器(Nano Banana)旨在作为Gemini CLI的扩展运行,Gemini CLI充当其客户端。当您通过 'gemini extensions install' 命令安装此扩展时,Gemini CLI会自动处理MCP服务器的启动和通信配置。因此,普通用户通常无需手动配置MCP客户端来连接此服务。
如果您需要为其他MCP客户端手动配置,以下是MCP客户端连接此服务器所需的核心信息:
- 服务器名称 (server name): 'nanobanana-server'
- 启动命令 (command): 'node'
- 参数 (args): '["./nanobanana-extension/mcp-server/dist/index.js"]'
- 参数注释: './nanobanana-extension/' 通常是Gemini CLI安装扩展后的默认路径,实际路径可能因您的系统或安装方式而异。'dist/index.js' 是本MCP服务器编译后的主入口文件。
- 传输协议 (transport): Stdio (标准输入/输出)
基本使用方法
安装并激活后,您可以直接在Gemini CLI中使用以下命令来利用Nano Banana服务:
- 生成图像:
# 生成一张雪林中狐狸的水彩画 /generate "a watercolor painting of a fox in a snowy forest" # 生成3个山景日落的变体,并自动预览 /generate "sunset over mountains" --count=3 --preview - 编辑图像:
# 编辑图片 my_photo.png,给人物添加墨镜 /edit my_photo.png "add sunglasses to the person" - 修复图像:
# 修复旧家庭照片 old_family_photo.jpg,移除划痕并提高清晰度 /restore old_family_photo.jpg "remove scratches and improve clarity" - 生成图标:
# 生成一个咖啡杯logo作为应用程序图标,包含64、128和256像素尺寸 /icon "coffee cup logo" --sizes="64,128,256" --type="app-icon" - 生成图案:
# 生成一个几何风格的无缝三角形图案,作为背景 /pattern "geometric triangles" --type="seamless" --style="geometric" - 生成故事序列:
# 生成一个描述种子长成树的4步视觉过程 /story "a seed growing into a tree" --steps=4 --type="process" - 生成图表:
# 生成一个专业风格的用户登录流程图 /diagram "user login process" --type="flowchart" --style="professional" - 自然语言命令 (灵活模式):
# 使用自然语言描述您的需求 /nanobanana create a logo for my tech startup /nanobanana fix the lighting in sunset.jpg and make it more vibrant
信息
分类
AI与计算