项目简介

FAL FLUX.1 Kontext [Max] 智能图像服务是一个基于Model Context Protocol (MCP) 构建的服务器,它将FAL AI平台上的FLUX.1 Kontext [Max]模型能力暴露给支持MCP协议的LLM客户端。通过此服务器,您可以利用FLUX.1 Kontext [Max]模型进行高质量的图像生成和高级图像编辑,尤其擅长处理带有复杂文本渲染需求的提示词。服务器还具备将生成的图片自动下载并保存到本地的功能。

主要功能点

  • 前沿图像生成 (Text-to-Image):根据文本描述创建高质量图像,擅长复杂提示词和文本渲染。
  • 高级图像编辑 (Image-to-Image):上传现有图片,通过文本提示对其进行修改、添加元素或改变风格。
  • 上下文理解与高级文本渲染:模型能更好地理解复杂提示中的语境,并在图像中清晰、准确地渲染文本。
  • 多宽高比支持:支持21:9、16:9、4:3、3:2、1:1等多种图像宽高比。
  • 批量生成与编辑:每次可生成或编辑最多4张图片。
  • 结果可复现:通过可选的随机种子参数,确保相同输入能得到一致的输出。
  • 实时与异步处理:提供实时('_generate', '_edit')和异步队列('_generate_async', '_edit_async')两种模式,以适应不同复杂度的请求。
  • 自动本地图片下载:生成的图像会自动下载并保存到本地的'images'目录下,同时返回本地路径和原始URL。
  • 灵活输出格式:支持JPEG和PNG两种图片输出格式。
  • 安全控制与引导强度调节:可配置安全审查等级(1-6)和模型引导强度(1.0-20.0),以精细控制生成结果。

安装步骤

  1. 获取FAL AI API Key

    • 访问 FAL AI 官网 并注册账户。
    • 登录后,进入仪表盘生成您的API密钥。
  2. 准备运行环境

    • 确保您的系统已安装 Node.js 18 或更高版本。您可以通过运行 'node --version' 来检查。
  3. 配置MCP客户端

    • 此MCP服务器提供预构建的可执行文件,通常无需本地安装和编译。我们强烈推荐使用'npx'方式进行配置,以实现最佳的通用性和便捷性。请参考下面的“服务器配置”部分。
    • 如果您需要修改服务器代码,可先克隆仓库,然后运行 'npm install' 和 'npm run build' 进行编译。

服务器配置

MCP客户端(如Claude Desktop或Kilo Code)需要一个JSON格式的配置来启动和连接此服务器。以下是推荐的'npx'配置示例,请将其添加到您的MCP客户端配置文件中:

{
  "mcpServers": {
    "fal-flux-kontext-max": {
      "command": "npx",
      "args": [
        "-y",
        "https://github.com/PierrunoYT/fal-flux-kontext-max-mcp-server.git"
      ],
      "env": {
        "FAL_KEY": "YOUR_FAL_API_KEY_HERE"
      }
    }
  }
}

配置说明:

  • 'fal-flux-kontext-max':这是您在MCP客户端中为此服务器指定的唯一名称。
  • 'command': 启动服务器的命令。这里使用 'npx',它会自动从GitHub仓库下载并运行服务器,无需您手动安装。
  • 'args': 传递给 'npx' 命令的参数:
    • '-y':自动确认 'npx' 的安装提示。
    • 'https://github.com/PierrunoYT/fal-flux-kontext-max-mcp-server.git':指定服务器代码所在的GitHub仓库URL。'npx' 会始终拉取最新版本。
  • 'env':环境变量配置。
    • 'FAL_KEY': 这是关键,请将 'YOUR_FAL_API_KEY_HERE' 替换为您从FAL AI获得的API密钥。服务器将使用此密钥与FAL AI平台进行通信。

配置完成后,请务必重新启动您的MCP客户端,以加载新的服务器配置。

基本使用方法

配置成功后,您的MCP客户端(如Claude Desktop或Kilo Code)将能够发现并调用此服务器提供的工具。您可以通过自然语言与LLM交互,让LLM调用相应的工具来完成图像任务。

1. 基本图像生成:

请生成一张图像:一只金毛犬在向日葵田里玩耍,画面中要有“HAPPY DOG”的粗体字样。

2. 指定参数生成图像:

生成两张16:9的图像,提示词是:“为一家科技初创公司设计的简约Logo,线条简洁,带有‘STARTUP’字样”。我希望引导强度为5.0,输出PNG格式。

3. 图像编辑:

请编辑这张图片,在天空中添加一道彩虹。图片URL是:https://example.com/landscape.jpg

(请将 'https://example.com/landscape.jpg' 替换为实际的图片URL或Base64数据URI)

4. 复杂图像编辑:

编辑这张厨房台面图片,在面粉旁边加一个甜甜圈。图片URL: https://v3.fal.media/files/rabbit/rmgBxhwGYb2d3pl3x9sKf_output.png,引导强度设为4.0,输出PNG格式。

5. 擅长文本渲染的提示(FLUX.1 Kontext [Max] 特色):

请创建一张复古书店的图像,多个书脊上清晰可见“代码艺术”、“数字梦想”和“未来故事”等书名。

当工具成功执行后,服务器会返回生成的图片信息,包括原始URL和下载到本地的路径。

信息

分类

AI与计算