使用说明

项目简介

dalle-image-server 是一个基于 Model Context Protocol (MCP) 的服务器,它利用 OpenAI 的 DALL·E 2 模型,根据用户提供的文本描述生成图像。该服务器作为一个工具集成到支持 MCP 协议的 LLM 客户端(如 Claude)中,扩展了 LLM 的能力,使其能够调用外部工具生成图像。

主要功能点

  • 图像生成工具: 提供 'generate_image' 工具,LLM 客户端可以通过调用此工具,并提供文本描述 (prompt),即可获得由 DALL·E 2 生成的图像 URL。
  • 可配置图像尺寸: 'generate_image' 工具支持可选的 'size' 参数,允许用户指定生成的图像尺寸,包括 256x256, 512x512, 和 1024x1024。
  • MCP 标准协议: 遵循 MCP 协议标准,易于集成到任何支持 MCP 协议的 LLM 客户端。
  • 使用 Stdio 通信: 通过标准输入输出 (stdio) 与 MCP 客户端进行通信。

安装步骤

  1. 克隆仓库:
    git clone https://github.com/angheljf/dalle-image-server.git
    cd dalle-image-server
  2. 安装依赖: 确保已安装 Node.js 和 npm,然后运行以下命令安装项目依赖:
    npm install
  3. 构建项目: 运行以下命令构建 TypeScript 代码:
    npm run build

服务器配置

要将此 MCP 服务器添加到 MCP 客户端(例如 Claude),您需要配置客户端的 MCP 服务器设置。以下是一个示例 'claude_desktop_config.json' 文件的配置,你需要根据你的实际情况进行修改:

{
  "mcpServers": {
    "dalle-image-server": {  // 服务器名称,客户端内唯一标识符
      "command": "node",  // 启动服务器的命令,这里使用 node 运行 JavaScript 文件
      "args": ["/path/to/your/dalle-image-server/build/index.js"], // 启动命令的参数,指向构建后的 index.js 文件路径,请替换为实际路径
      "env": {
        "OPENAI_API_KEY": "your_api_key_here" // 环境变量,用于配置 OpenAI API 密钥,请替换为你的实际 API 密钥
      }
    }
  }
}

注意:

  • 请将 '/path/to/your/dalle-image-server/build/index.js' 替换为 'dalle-image-server' 项目构建后 'index.js' 文件的实际路径。
  • 请将 'your_api_key_here' 替换为你自己的 OpenAI API 密钥。
  • MCP 客户端会读取此配置,并在需要时启动和连接到 'dalle-image-server'。

基本使用方法

  1. 启动 MCP 服务器: 当 MCP 客户端(如 Claude)启动并需要使用 'dalle-image-server' 提供的功能时,客户端会根据配置自动启动服务器。
  2. LLM 客户端调用工具: 在 LLM 客户端中,当需要生成图像时,客户端会通过 MCP 协议调用 'generate_image' 工具。你需要提供文本描述 (prompt) 作为工具的参数。
  3. 获取图像 URL: 'dalle-image-server' 接收到工具调用请求后,会调用 DALL·E 2 API 生成图像,并将包含图像 URL 的文本内容返回给 LLM 客户端。客户端可以解析返回的内容,并向用户展示图像链接或直接加载图像。

例如,在 Claude 中,你可以这样指示 Claude 生成图像:

"请使用 dalle-image-server 的 generate_image 工具,帮我生成一张猫咪在花园里玩耍的图片。"

LLM 客户端 (Claude) 会解析你的指令,识别出需要调用 'generate_image' 工具,并将 "猫咪在花园里玩耍" 作为 'prompt' 参数发送给 'dalle-image-server'。服务器生成图像后,会将图像链接返回给 Claude,Claude 再将结果呈现给你。

信息

分类

AI与计算