项目简介

Mobvoi TTS MCP 是一个基于 Model Context Protocol (MCP) 实现的服务器,旨在以标准化的方式向 LLM 客户端(如 Cursor, Claude Desktop, Cline 等)提供与 Mobvoi 语音技术相关的能力。通过 JSON-RPC 协议,该服务器允许 LLM 客户端调用外部功能,如语音合成和语音克隆。

主要功能点

  • 语音合成 (Speech Synthesis): 将文本内容转换为自然语音,支持指定发音人、语速和音量等属性。
  • 语音克隆 (Voice Clone): 根据您提供的音频文件(本地或远程链接),克隆出特定的发音人 ID,用于后续的语音合成。
  • 语音播放 (Voice broadcasting): 支持直接播放指定的音频文件。

这些功能以 MCP 的 工具 (Tools) 形式提供给 LLM 客户端。

安装步骤

要安装和运行 Mobvoi TTS MCP 服务器,您需要:

  1. 确保您的系统安装了 Python 3.10+
  2. Mobvoi Sequence Monkey 开放平台 获取您的 'APP_KEY' 和 'APP_SECRET'。
  3. 安装 Python 包管理器 'uv'。如果未安装,请通过 pip 安装:'pip install uv' (或其他 uv 官方文档推荐的方式)。
  4. 安装 mobvoi-tts-mcp 包。最简单的方式是使用 'uvx' 命令运行它,这将自动安装并执行:'uvx mobvoi-tts-mcp'。

服务器配置 (供 MCP 客户端使用)

MCP 服务器通常由客户端启动和管理。LLM 客户端(如 Cursor, Claude Desktop, Cline 等)需要配置 MCP 服务器的启动命令和参数才能与之通信。以下是典型的客户端配置示例,您需要根据您的具体客户端修改其配置文件,并将您的 'APP_KEY' 和 'APP_SECRET' 填入相应的环境变量位置:

"MobvoiTTS": {
    "command": "uvx", // 用于启动服务器的命令,uvx会自动查找并运行安装好的包
    "args": [
      "mobvoi-tts-mcp" // 传递给服务器命令的参数,这里是包名
    ],
    "env": {
      "APP_KEY": "<insert-your-APP_KEY-here>", // 您的 Mobvoi APP_KEY
      "APP_SECRET": "<insert-your-APP_SECRET-here>" // 您的 Mobvoi APP_SECRET
    },
    // "transportType": "stdio" // 对于 Cline 等客户端,可能需要显式指定传输协议
  },

请将上述配置片段添加到您 MCP 客户端的配置文件中(例如 Cursor 的 'mcp.json',Claude Desktop 的 'claude_desktop_config.json',Cline 的 'cline_mcp_settings.json' 等)。具体位置和格式请参考您使用的 MCP 客户端文档。

基本使用方法

配置完成后,您可以在支持 MCP 的 LLM 客户端中通过自然语言或特定的命令来调用 Mobvoi TTS MCP 服务器提供的功能。

例如,在客户端的 Agent 或聊天模式中,您可以尝试以下方式:

  1. 语音克隆: 提供一个音频链接或本地文件路径,并请求克隆语音,服务器将返回一个 speaker ID。
  2. 语音合成: 使用之前获取的 speaker ID 生成语音并播放。
    • 例如:'Use the sound cloned just now to broadcast: 'Hello, this is a test message.''
    • 您还可以通过Prompt引导 LLM 客户端调整语速、音量等参数,具体取决于客户端对工具调用的支持能力。

信息

分类

AI与计算