使用说明
项目简介
MiniMax-MCP 是一个实现了 Model Context Protocol (MCP) 协议的服务器,旨在为大型语言模型(LLM)客户端提供多媒体处理能力。它集成了 MiniMax 强大的文本转语音、语音克隆、视频生成和图像生成 API,使开发者能够轻松地将这些高级功能集成到 LLM 应用中。通过 MCP 协议,MiniMax-MCP 服务器以标准化的方式与客户端通信,提供稳定、可扩展的上下文服务。
主要功能点
- 文本转语音 (Text to Speech): 将文本内容转换为自然流畅的语音,支持多种音色选择,让 LLM 应用具备语音播报能力。
- 视频生成 (Video Generation): 根据文本提示或结合首帧图像,生成创意视频内容,为 LLM 应用增加视频创作能力。
- 图像生成 (Image Generation): 根据文本描述生成高质量图像,扩展 LLM 应用的视觉内容生成能力。
- 语音克隆 (Voice Cloning): 通过上传音频文件快速克隆指定音色,定制独特的语音合成效果,但需注意首次使用后可能会产生费用。
- 音频播放 (Play Audio): 支持播放本地或在线音频文件,方便用户进行音频内容试听和管理。
安装步骤
-
克隆仓库
git clone https://github.com/mattheussnf/MiniMax-MCP.git cd MiniMax-MCP -
安装依赖
确保已安装 Python 3.x,然后运行:
pip install -r requirements.txt -
配置环境变量
- MINIMAX_API_KEY: 您的 MiniMax API 密钥,用于访问 MiniMax API 服务。这是必需配置的,请务必设置。
- MINIMAX_API_HOST: MiniMax API 主机地址,默认为 'https://api.minimax.chat'。通常无需修改。
- MINIMAX_MCP_BASE_PATH: 可选配置,用于设置输出文件(如音频、视频、图像)的基础保存路径。如果设置,非绝对路径的输出目录将基于此路径。
- MINIMAX_API_RESOURCE_MODE: 可选配置,资源模式。设置为 'url' 时,服务器返回资源的 URL;设置为 'local' 或不设置时,资源将保存到本地文件系统并返回文件路径。默认为 'url'。
您可以通过以下方式配置环境变量:
- 在 '.env' 文件中添加以上变量及其值(推荐)。
- 直接在命令行中设置,例如:'export MINIMAX_API_KEY=your_api_key' (Linux/macOS) 或 'set MINIMAX_API_KEY=your_api_key' (Windows)。
-
运行服务器
执行以下命令启动 MiniMax MCP 服务器:
python minimax_mcp/server.py服务器默认运行在本地,并等待 MCP 客户端连接。
服务器配置 (MCP 客户端配置)
以下 JSON 配置信息用于 MCP 客户端连接 MiniMax MCP 服务器。客户端需要配置 'command' 和 'args' 以启动服务器进程。
{ "servers": { "Minimax": { "name": "Minimax", // 服务器名称,客户端中用于标识和选择服务器 "command": "uvx", // 启动服务器的命令,这里使用 uvx (Universal Versatile Executor) 来运行 Python 模块 "args": [ "minimax-mcp" // uvx 的参数,指定要运行的 Python 模块为 "minimax-mcp" (__main__.py 所在模块名) ], "env": { // 环境变量配置,传递给服务器进程 // 客户端 **无需** 在此处配置 API 密钥和 API Host 等, // 这些应在服务器端配置(例如通过 .env 文件或系统环境变量)。 // 此处可以留空或根据需要添加其他客户端特定的环境变量。 } } } }
配置说明:
- 'command: "uvx"' 和 'args: ["minimax-mcp"]': 这表示使用 'uvx' 命令来执行 'minimax-mcp' Python 模块。 'uvx' 是一个通用的进程执行器,可以方便地运行各种类型的程序,包括 Python 模块。 确保您的 MCP 客户端环境已安装 'uvx' 或类似的命令执行工具,并能正确解析和执行 Python 模块。 如果您的客户端环境不支持 'uvx',您可能需要根据客户端的具体配置方式调整为直接运行 Python 脚本的命令,例如 '"command": "python"' 和 '"args": ["minimax_mcp/server.py"]'。
- 'name: "Minimax"': 这是在 MCP 客户端中显示和引用的服务器名称。您可以根据需要自定义,但请确保与客户端配置保持一致。
- 'env': 此部分用于设置传递给服务器进程的环境变量。重要提示: 通常情况下,客户端配置中无需包含 'MINIMAX_API_KEY' 和 'MINIMAX_API_HOST' 等敏感信息。 这些 API 密钥和主机地址应该在 服务器端 安全地配置和管理,例如通过服务器部署环境的环境变量或配置文件进行设置,以避免泄露风险。 'env' 部分可以用于传递其他客户端可能需要的、非敏感的环境变量。
请根据您的 MCP 客户端的具体配置要求,调整上述 JSON 配置信息。 重点是确保客户端能够通过 'command' 和 'args' 正确启动 MiniMax MCP 服务器进程。
基本使用方法
MiniMax MCP 服务器启动后,将通过 MCP 协议与客户端进行通信。客户端可以使用预定义的工具来调用 MiniMax API 的各项功能。
常用工具示例 (客户端调用方式):
-
文本转语音 (text_to_audio)
客户端可以调用 'text_to_audio' 工具,并传入以下参数:
- 'text': 要转换成语音的文本内容。
- 'voice_id': (可选) 音色 ID,指定使用的音色。
- 其他可选参数,如 'model', 'speed', 'vol', 'pitch', 'emotion' 等,用于更精细地控制语音合成效果。
服务器将返回包含音频文件路径或 URL 的文本内容。
-
视频生成 (generate_video)
客户端可以调用 'generate_video' 工具,并传入以下参数:
- 'prompt': 生成视频的文本提示。
- 'model': (可选) 使用的视频生成模型。
- 'first_frame_image': (可选) 首帧图像,用于图像到视频的生成模式。
服务器将返回包含视频文件路径或 URL 的文本内容。
-
图像生成 (text_to_image)
客户端可以调用 'text_to_image' 工具,并传入以下参数:
- 'prompt': 生成图像的文本提示。
- 'aspect_ratio': (可选) 图像的宽高比。
- 'n': (可选) 生成图像的数量。
服务器将返回包含图像文件路径或 URL 的文本内容。
-
语音克隆 (voice_clone)
客户端可以调用 'voice_clone' 工具,并传入以下参数:
- 'voice_id': 要克隆的目标音色 ID。
- 'file': 用于克隆的音频文件路径或 URL。
- 'text': (可选) 用于生成演示音频的文本。
服务器将返回包含克隆音色 ID 和演示音频文件路径/URL 的文本内容。
-
播放音频 (play_audio)
客户端可以调用 'play_audio' 工具,并传入以下参数:
- 'input_file_path': 要播放的音频文件路径或 URL。
服务器将尝试播放指定的音频文件。
请参考 MCP 客户端的文档,了解如何配置和使用 MCP 服务器,以及如何调用上述工具。 MiniMax MCP 服务器旨在提供便捷的多媒体 API 接入能力,让您的 LLM 应用更加强大。
信息
分类
AI与计算