ElevenLabs MCP Server 使用说明

项目简介

ElevenLabs MCP Server 是一个基于 Model Context Protocol (MCP) 构建的后端服务，它集成了 ElevenLabs 的文本到语音 (TTS) API，旨在为大型语言模型 (LLM) 客户端提供标准化的语音合成服务。通过 MCP 协议，客户端可以方便地调用服务器提供的工具和访问托管的资源，实现文本到语音的转换及相关管理功能。

主要功能点

文本转语音: 使用 ElevenLabs API 将文本内容合成为高质量的音频。
多语音支持: 支持 ElevenLabs API 提供的多种声音，允许用户选择不同的声音进行语音合成。
脚本化语音合成: 支持结构化脚本输入，可以为不同的文本段落指定不同的声音，实现更丰富的语音效果。
历史记录管理: 内置 SQLite 数据库，用于持久化存储语音生成任务的历史记录，方便用户追溯和管理。
资源访问: 通过 MCP 协议提供资源访问能力，客户端可以获取声音列表和语音生成历史记录。
工具调用: 提供一系列工具 (Tools)，允许客户端通过 MCP 协议调用服务器的功能，例如生成音频、删除任务、获取音频文件等。
示例客户端: 附带一个基于 SvelteKit 的 Web UI 示例客户端，方便用户体验和测试 MCP 服务器的功能。

安装步骤

1. 使用 uvx (推荐，无需安装):

如果您使用 'uvx' (uv 的可执行程序启动器)，则无需进行额外的安装步骤。只需配置 MCP 客户端，指定 'uvx' 命令和相应的参数即可。

2. 开发安装 (手动安装):

如果您需要本地开发或自定义服务器，请按照以下步骤进行安装：

克隆仓库: 使用 Git 克隆 GitHub 仓库到本地：

git clone https://github.com/MCP-Mirror/mamertofabian_elevenlabs-mcp-server.git
cd mamertofabian_elevenlabs-mcp-server

安装依赖: 使用 uv 创建虚拟环境并安装项目依赖：
```
uv venv
```
配置环境变量: 复制 '.env.example' 文件并重命名为 '.env'，然后根据您的 ElevenLabs API 密钥信息进行配置。您需要至少配置 'ELEVENLABS_API_KEY'。

服务器配置 (MCP 客户端)

要将 ElevenLabs MCP Server 集成到 MCP 客户端（例如 Claude Desktop），您需要在客户端的 MCP 服务器配置文件中添加以下 JSON 配置。配置文件通常命名为 'cline_mcp_settings.json' 或类似名称。

{
  "mcpServers": {
    "elevenlabs": {
      "command": "uvx",  // 或 "uv" (如果您使用开发安装)
      "args": ["elevenlabs-mcp-server"], // 启动服务器的参数，使用 uvx 时只需服务器名称
      "env": {
        "ELEVENLABS_API_KEY": "your-api-key", // **[必填]** 替换为您的 ElevenLabs API 密钥
        "ELEVENLABS_VOICE_ID": "your-voice-id", // **[可选]** 替换为您默认的声音 ID，不填则使用服务器默认值
        "ELEVENLABS_MODEL_ID": "eleven_flash_v2", // **[可选]** 指定使用的 ElevenLabs 模型 ID，不填则使用服务器默认值
        "ELEVENLABS_STABILITY": "0.5", // **[可选]** 声音稳定性参数，范围 0.0-1.0，不填则使用服务器默认值
        "ELEVENLABS_SIMILARITY_BOOST": "0.75", // **[可选]** 声音相似度提升参数，范围 0.0-1.0，不填则使用服务器默认值
        "ELEVENLABS_STYLE": "0.1", // **[可选]** 声音风格参数，范围 0.0-1.0，部分模型支持，不填则使用服务器默认值
        "ELEVENLABS_OUTPUT_DIR": "output" // **[可选]** 音频文件输出目录，不填则使用服务器默认值
      }
    }
  }
}

基本使用方法

配置完成后，MCP 客户端将能够与 ElevenLabs MCP Server 建立连接。您可以通过客户端的功能面板或命令来访问服务器提供的资源 (Resources) 和工具 (Tools)。

可用的资源 (Resources):

'voiceover://history': 获取语音生成任务的历史记录列表。
'voiceover://history/{job_id}': 获取特定 'job_id' 的语音生成任务的详细信息。
'voiceover://voices': 获取 ElevenLabs API 提供的可用声音列表。

可用的工具 (Tools):

'generate_audio_simple': 根据提供的文本生成音频，使用默认的声音设置。
'generate_audio_script': 根据提供的结构化脚本生成音频，支持为不同部分指定不同的声音。
'delete_job': 删除指定 'job_id' 的语音生成任务及其相关的音频文件。
'get_audio_file': 获取指定 'job_id' 的语音生成任务生成的音频文件。
'list_voices': 列出所有可用的 ElevenLabs 声音。
'get_voiceover_history': 获取语音生成任务的历史记录。可以可选地指定 'job_id' 来获取特定任务的详情。

具体工具和资源的使用方法，请参考您的 MCP 客户端的文档或操作界面。

关键词

ElevenLabs MCP Server 使用说明

信息