ElevenLabs MCP Server 使用说明

项目简介

ElevenLabs MCP Server 是一个基于 Model Context Protocol (MCP) 构建的后端服务,它集成了 ElevenLabs 的文本到语音 (TTS) API,旨在为大型语言模型 (LLM) 客户端提供标准化的语音合成服务。通过 MCP 协议,客户端可以方便地调用服务器提供的工具和访问托管的资源,实现文本到语音的转换及相关管理功能。

主要功能点

  • 文本转语音: 使用 ElevenLabs API 将文本内容合成为高质量的音频。
  • 多语音支持: 支持 ElevenLabs API 提供的多种声音,允许用户选择不同的声音进行语音合成。
  • 脚本化语音合成: 支持结构化脚本输入,可以为不同的文本段落指定不同的声音,实现更丰富的语音效果。
  • 历史记录管理: 内置 SQLite 数据库,用于持久化存储语音生成任务的历史记录,方便用户追溯和管理。
  • 资源访问: 通过 MCP 协议提供资源访问能力,客户端可以获取声音列表和语音生成历史记录。
  • 工具调用: 提供一系列工具 (Tools),允许客户端通过 MCP 协议调用服务器的功能,例如生成音频、删除任务、获取音频文件等。
  • 示例客户端: 附带一个基于 SvelteKit 的 Web UI 示例客户端,方便用户体验和测试 MCP 服务器的功能。

安装步骤

1. 使用 uvx (推荐,无需安装):

如果您使用 'uvx' (uv 的可执行程序启动器),则无需进行额外的安装步骤。只需配置 MCP 客户端,指定 'uvx' 命令和相应的参数即可。

2. 开发安装 (手动安装):

如果您需要本地开发或自定义服务器,请按照以下步骤进行安装:

  • 克隆仓库: 使用 Git 克隆 GitHub 仓库到本地:
    git clone https://github.com/MCP-Mirror/mamertofabian_elevenlabs-mcp-server.git
    cd mamertofabian_elevenlabs-mcp-server
  • 安装依赖: 使用 uv 创建虚拟环境并安装项目依赖:
    uv venv
  • 配置环境变量: 复制 '.env.example' 文件并重命名为 '.env',然后根据您的 ElevenLabs API 密钥信息进行配置。您需要至少配置 'ELEVENLABS_API_KEY'。

服务器配置 (MCP 客户端)

要将 ElevenLabs MCP Server 集成到 MCP 客户端(例如 Claude Desktop),您需要在客户端的 MCP 服务器配置文件中添加以下 JSON 配置。配置文件通常命名为 'cline_mcp_settings.json' 或类似名称。

{
  "mcpServers": {
    "elevenlabs": {
      "command": "uvx",  // 或 "uv" (如果您使用开发安装)
      "args": ["elevenlabs-mcp-server"], // 启动服务器的参数,使用 uvx 时只需服务器名称
      "env": {
        "ELEVENLABS_API_KEY": "your-api-key", // **[必填]** 替换为您的 ElevenLabs API 密钥
        "ELEVENLABS_VOICE_ID": "your-voice-id", // **[可选]** 替换为您默认的声音 ID,不填则使用服务器默认值
        "ELEVENLABS_MODEL_ID": "eleven_flash_v2", // **[可选]** 指定使用的 ElevenLabs 模型 ID,不填则使用服务器默认值
        "ELEVENLABS_STABILITY": "0.5", // **[可选]** 声音稳定性参数,范围 0.0-1.0,不填则使用服务器默认值
        "ELEVENLABS_SIMILARITY_BOOST": "0.75", // **[可选]** 声音相似度提升参数,范围 0.0-1.0,不填则使用服务器默认值
        "ELEVENLABS_STYLE": "0.1", // **[可选]** 声音风格参数,范围 0.0-1.0,部分模型支持,不填则使用服务器默认值
        "ELEVENLABS_OUTPUT_DIR": "output" // **[可选]** 音频文件输出目录,不填则使用服务器默认值
      }
    }
  }
}

基本使用方法

配置完成后,MCP 客户端将能够与 ElevenLabs MCP Server 建立连接。您可以通过客户端的功能面板或命令来访问服务器提供的资源 (Resources) 和工具 (Tools)。

可用的资源 (Resources):

  • 'voiceover://history': 获取语音生成任务的历史记录列表。
  • 'voiceover://history/{job_id}': 获取特定 'job_id' 的语音生成任务的详细信息。
  • 'voiceover://voices': 获取 ElevenLabs API 提供的可用声音列表。

可用的工具 (Tools):

  • 'generate_audio_simple': 根据提供的文本生成音频,使用默认的声音设置。
  • 'generate_audio_script': 根据提供的结构化脚本生成音频,支持为不同部分指定不同的声音。
  • 'delete_job': 删除指定 'job_id' 的语音生成任务及其相关的音频文件。
  • 'get_audio_file': 获取指定 'job_id' 的语音生成任务生成的音频文件。
  • 'list_voices': 列出所有可用的 ElevenLabs 声音。
  • 'get_voiceover_history': 获取语音生成任务的历史记录。可以可选地指定 'job_id' 来获取特定任务的详情。

具体工具和资源的使用方法,请参考您的 MCP 客户端的文档或操作界面。

信息

分类

AI与计算