使用说明内容(Markdown格式)

Gemini MCP 服务器使用说明

项目简介

Gemini MCP 服务器是一个基于 MCP(Model Context Protocol)的后端实现,利用 Google Gemini 3 Pro Preview API 提供对话、图像与视频生成等功能的标准化访问接口。服务器暴露一组工具,供 MCP 客户端通过 JSON-RPC 发起请求,服务器负责会话管理、工具执行和系统指令构建。

主要功能点

  • gemini:启动一个新的 Gemini 对话,会返回一个会话ID用于后续继续对话
  • gemini-reply:基于现有对话ID继续多轮对话
  • gemini-image:使用 Gemini 生成图像,支持自动选择 Nano Banana Pro 模型(文本密集/高质量图像场景)
  • gemini-video-generate:启动视频生成,返回操作ID,异步完成后可通过 gemini-video-check 获取结果
  • gemini-video-check:查询视频生成状态或下载完成的视频
  • 会话管理:对话上下文(历史记录)保存在服务端,支持过期清理
  • 系统指令构建:可在 gemini 与 gemini-reply 场景中自定义工作目录、权限和开发者指令等
  • 传输层:基于 MCP 的标准 JSON-RPC 交互,当前实现通过标准输入输出(Stdio)传输,便于与本地/容器中的 MCP 客户端连接

安装步骤

  1. 安装依赖并构建
    • npm install
    • npm run build
  2. 配置环境变量(示例)
    • GEMINI_API_KEY 或 GOOGLE_API_KEY:Gemini API 密钥
    • GEMINI_MODEL(可选,默认 gemini-3-pro-preview)
  3. 启动服务器
    • npm start
    • 也可直接以开发模式运行:npm run dev
  4. 验证
    • 使用 MCP 客户端通过标准 JSON-RPC 调用工具清单及调用接口,确认 gemini、gemini-reply、gemini-image、gemini-video-generate、gemini-video-check 等工具可用

服务器配置

以下配置用于 MCP 客户端(如 Claude 等)在本地/服务器上连接并启动该 MCP 服务器。该配置描述服务器名称、启动命令与参数等信息,供 MCP 客户端读取并启动对接。请根据实际运行环境填写参数。

{ "serverName": "gemini-mcp", "command": "node", "args": ["dist/index.js"], "env": { "GEMINI_API_KEY": "your_api_key_here", "GEMINI_MODEL": "gemini-3-pro-preview" }, "description": "Gemini MCP 服务器(对接 Google Gemini API),通过标准 MCP JSON-RPC 接口提供对话、图像与视频生成等工具。" }

注释说明:

  • serverName:在 MCP 客户端配置中作为服务器标识名称,需与实际服务端一致
  • command:启动服务器所用的命令,当前实现为 Node.js 运行
  • args:启动参数,指向打包后的入口文件 dist/index.js
  • env:环境变量,用于提供 Gemini API 的认证信息和默认模型
  • description:简要描述该服务器的功能与用途

基本使用方法

  • 启动后,通过 MCP 客户端发送以下类型的请求来使用对应工具:
    • gemini:创建新会话,传入 prompt、可选 cwd、sandbox、base-instructions、developer-instructions、model
    • gemini-reply:传入 conversationId 与 prompt,继续现有会话
    • gemini-image:传入 prompt、numberOfImages、aspectRatio、usePro、outputPath
    • gemini-video-generate:传入 prompt、aspectRatio、resolution、firstFrameBase64
    • gemini-video-check:传入 operationId(若省略则使用最近一次生成的)
  • 服务器会返回结构化的 content(文本、图片等)以及 _meta 字段,方便客户端继续对话或跟踪任务状态
  • 如需要持久化图像/视频,请提供 outputPath,服务器会将生成结果保存到指定目录

关键词与注意事项:

  • 服务器基于 MCP 标准实现,提供多轮对话、资源(对话历史)、工具执行能力
  • 运行前请确保 Gemini API Key 可用且环境变量配置正确
  • 该实现当前通过 Stdio 传输,便于本地开发和容器化部署

信息

分类

AI与计算