使用说明
项目简介
dalle-image-server 是一个基于 Model Context Protocol (MCP) 的服务器,它利用 OpenAI 的 DALL·E 2 模型,根据用户提供的文本描述生成图像。该服务器作为一个工具集成到支持 MCP 协议的 LLM 客户端(如 Claude)中,扩展了 LLM 的能力,使其能够调用外部工具生成图像。
主要功能点
- 图像生成工具: 提供 'generate_image' 工具,LLM 客户端可以通过调用此工具,并提供文本描述 (prompt),即可获得由 DALL·E 2 生成的图像 URL。
- 可配置图像尺寸: 'generate_image' 工具支持可选的 'size' 参数,允许用户指定生成的图像尺寸,包括 256x256, 512x512, 和 1024x1024。
- MCP 标准协议: 遵循 MCP 协议标准,易于集成到任何支持 MCP 协议的 LLM 客户端。
- 使用 Stdio 通信: 通过标准输入输出 (stdio) 与 MCP 客户端进行通信。
安装步骤
- 克隆仓库:
git clone https://github.com/angheljf/dalle-image-server.git cd dalle-image-server - 安装依赖:
确保已安装 Node.js 和 npm,然后运行以下命令安装项目依赖:
npm install - 构建项目:
运行以下命令构建 TypeScript 代码:
npm run build
服务器配置
要将此 MCP 服务器添加到 MCP 客户端(例如 Claude),您需要配置客户端的 MCP 服务器设置。以下是一个示例 'claude_desktop_config.json' 文件的配置,你需要根据你的实际情况进行修改:
{ "mcpServers": { "dalle-image-server": { // 服务器名称,客户端内唯一标识符 "command": "node", // 启动服务器的命令,这里使用 node 运行 JavaScript 文件 "args": ["/path/to/your/dalle-image-server/build/index.js"], // 启动命令的参数,指向构建后的 index.js 文件路径,请替换为实际路径 "env": { "OPENAI_API_KEY": "your_api_key_here" // 环境变量,用于配置 OpenAI API 密钥,请替换为你的实际 API 密钥 } } } }
注意:
- 请将 '/path/to/your/dalle-image-server/build/index.js' 替换为 'dalle-image-server' 项目构建后 'index.js' 文件的实际路径。
- 请将 'your_api_key_here' 替换为你自己的 OpenAI API 密钥。
- MCP 客户端会读取此配置,并在需要时启动和连接到 'dalle-image-server'。
基本使用方法
- 启动 MCP 服务器: 当 MCP 客户端(如 Claude)启动并需要使用 'dalle-image-server' 提供的功能时,客户端会根据配置自动启动服务器。
- LLM 客户端调用工具: 在 LLM 客户端中,当需要生成图像时,客户端会通过 MCP 协议调用 'generate_image' 工具。你需要提供文本描述 (prompt) 作为工具的参数。
- 获取图像 URL: 'dalle-image-server' 接收到工具调用请求后,会调用 DALL·E 2 API 生成图像,并将包含图像 URL 的文本内容返回给 LLM 客户端。客户端可以解析返回的内容,并向用户展示图像链接或直接加载图像。
例如,在 Claude 中,你可以这样指示 Claude 生成图像:
"请使用 dalle-image-server 的 generate_image 工具,帮我生成一张猫咪在花园里玩耍的图片。"
LLM 客户端 (Claude) 会解析你的指令,识别出需要调用 'generate_image' 工具,并将 "猫咪在花园里玩耍" 作为 'prompt' 参数发送给 'dalle-image-server'。服务器生成图像后,会将图像链接返回给 Claude,Claude 再将结果呈现给你。
信息
分类
AI与计算