项目简介

Mobvoi TTS MCP 是一个基于 Model Context Protocol (MCP) 实现的服务器，旨在以标准化的方式向 LLM 客户端（如 Cursor, Claude Desktop, Cline 等）提供与 Mobvoi 语音技术相关的能力。通过 JSON-RPC 协议，该服务器允许 LLM 客户端调用外部功能，如语音合成和语音克隆。

主要功能点

语音合成 (Speech Synthesis): 将文本内容转换为自然语音，支持指定发音人、语速和音量等属性。
语音克隆 (Voice Clone): 根据您提供的音频文件（本地或远程链接），克隆出特定的发音人 ID，用于后续的语音合成。
语音播放 (Voice broadcasting): 支持直接播放指定的音频文件。

这些功能以 MCP 的 工具 (Tools) 形式提供给 LLM 客户端。

安装步骤

要安装和运行 Mobvoi TTS MCP 服务器，您需要：

确保您的系统安装了 Python 3.10+。
从 Mobvoi Sequence Monkey 开放平台获取您的 'APP_KEY' 和 'APP_SECRET'。
安装 Python 包管理器 'uv'。如果未安装，请通过 pip 安装：'pip install uv' (或其他 uv 官方文档推荐的方式)。
安装 mobvoi-tts-mcp 包。最简单的方式是使用 'uvx' 命令运行它，这将自动安装并执行：'uvx mobvoi-tts-mcp'。

服务器配置 (供 MCP 客户端使用)

MCP 服务器通常由客户端启动和管理。LLM 客户端（如 Cursor, Claude Desktop, Cline 等）需要配置 MCP 服务器的启动命令和参数才能与之通信。以下是典型的客户端配置示例，您需要根据您的具体客户端修改其配置文件，并将您的 'APP_KEY' 和 'APP_SECRET' 填入相应的环境变量位置：

"MobvoiTTS": {
    "command": "uvx", // 用于启动服务器的命令，uvx会自动查找并运行安装好的包
    "args": [
      "mobvoi-tts-mcp" // 传递给服务器命令的参数，这里是包名
    ],
    "env": {
      "APP_KEY": "<insert-your-APP_KEY-here>", // 您的 Mobvoi APP_KEY
      "APP_SECRET": "<insert-your-APP_SECRET-here>" // 您的 Mobvoi APP_SECRET
    },
    // "transportType": "stdio" // 对于 Cline 等客户端，可能需要显式指定传输协议
  },

请将上述配置片段添加到您 MCP 客户端的配置文件中（例如 Cursor 的 'mcp.json'，Claude Desktop 的 'claude_desktop_config.json'，Cline 的 'cline_mcp_settings.json' 等）。具体位置和格式请参考您使用的 MCP 客户端文档。

基本使用方法

配置完成后，您可以在支持 MCP 的 LLM 客户端中通过自然语言或特定的命令来调用 Mobvoi TTS MCP 服务器提供的功能。

例如，在客户端的 Agent 或聊天模式中，您可以尝试以下方式：

语音克隆: 提供一个音频链接或本地文件路径，并请求克隆语音，服务器将返回一个 speaker ID。
- 例如：'https://example.com/your_audio.wav, clone this voice'
语音合成: 使用之前获取的 speaker ID 生成语音并播放。
- 例如：'Use the sound cloned just now to broadcast: 'Hello, this is a test message.''
- 您还可以通过Prompt引导 LLM 客户端调整语速、音量等参数，具体取决于客户端对工具调用的支持能力。

关键词

项目简介

主要功能点

安装步骤

服务器配置 (供 MCP 客户端使用)

基本使用方法

信息