项目简介
4o-image MCP 服务器是一个符合 Model Context Protocol (MCP) 标准的后端应用,它集成了 4o-image API,允许大型语言模型(LLM)客户端通过标准化的协议调用图像生成和编辑功能。它通过 MCP 协议向 LLM 暴露一个工具,使 LLM 能够发起图像生成和编辑请求。
主要功能点
- 文本生成图像: 根据文字描述创作全新的图像。
- 图像编辑: 基于现有图像(通过 Base64 编码传入)和文字提示进行修改或风格转换。
- 自动打开图片: 生成的图片链接会自动在用户的默认浏览器中打开。
- MCP 工具: 提供一个名为 'generateImage' 的工具供LLM调用,该工具接受 'prompt' (文本描述) 和可选的 'imageBase64' (Base64 编码的图像) 作为输入。
安装步骤
- 确保您的系统中安装了 Node.js (版本 18 或更高)。
- 无需额外安装,后续使用时通过 'npx' 命令直接运行该包。
- 获取 API Key:前往 4o-image.app/dashboard 注册并获取您的 API Key。
服务器配置
MCP 客户端(例如支持 MCP 的 LLM 应用,如 Claude Desktop)需要配置如何启动此 MCP 服务器并与其通信。以下是常见的配置信息(请将 'YOUR_API_KEY_HERE' 替换为您的实际 API Key):
- 服务器名称 (server name): 例如 '4o-image' (这是您在客户端中为此 MCP 服务器实例设置的别名)
- 启动命令 (command): 'npx' (用于执行 Node.js 包的命令)
- 命令参数 (args): '-y', '4oimage-mcp' (指示 npx 临时下载并在当前目录下运行 '4oimage-mcp' 包)
- 环境变量 (env): 设置一个名为 'API_KEY' 的环境变量,值为您的 4o-image API Key,例如 '{ "API_KEY": "YOUR_API_KEY_HERE" }'。MCP 服务器启动时会读取此环境变量以进行 API 调用认证。
基本使用方法
- 在您的 MCP 客户端中,参照上一步说明配置并启用 "4o-image" MCP 服务器。
- 确保您的 4o-image API Key 已正确配置为环境变量。
- 在连接到此服务器的 MCP 客户端中与 LLM 进行交互时,如果 LLM 判断需要生成或编辑图像,它将自动调用服务器提供的 'generateImage' 工具,并根据您的对话内容构建工具参数(如 'prompt' 和 'imageBase64')。
- MCP 服务器将处理工具调用请求,通过 4o-image API 进行实际的图像操作。
- 操作完成后,生成的图片链接通常会自动在您的浏览器中打开,同时结果也会通过 MCP 响应返回给 LLM 客户端,客户端界面可能会显示图片链接或其他相关信息。例如,您可以直接向 LLM 提出诸如“生成一张狗在沙滩上追逐飞盘的图片”或“编辑这张图片,把天空变成绚丽的晚霞”之类的请求。
信息
分类
AI与计算