ElevenLabs MCP服务器使用说明
项目简介
ElevenLabs MCP服务器是ElevenLabs官方提供的Model Context Protocol (MCP) 服务器实现,它允许LLM客户端(如Claude Desktop, Cursor, Windsurf, OpenAI Agents等)通过MCP协议调用ElevenLabs的语音API,实现文本到语音合成、语音克隆、音频转录、音效生成等功能。
主要功能点
- 文本到语音 (Text to Speech, TTS): 将文本转换为自然流畅的语音,支持多种声音、语速、音调等参数调节,可用于生成各种风格的语音内容。
- 语音到文本 (Speech to Text, STT): 将音频文件中的语音转录为文本,支持多种语言和speaker diarization(区分说话人),方便LLM理解音频内容。
- 语音克隆 (Voice Cloning): 通过上传用户自己的录音样本,克隆出与样本声音相似的定制化语音,扩展语音合成的可能性。
- 音效生成 (Text to Sound Effects): 根据文本描述生成各种音效,例如雷声、动物叫声等,为LLM应用增加声音维度。
- 语音转换 (Speech to Speech, STS): 将一种声音的音频文件转换为另一种指定声音的音频文件,实现声音风格的迁移。
- 语音设计 (Text to Voice): 根据文本描述生成新的声音预览,允许用户根据描述创造独特的AI声音。
- 会话 агенти (Conversational Agents): 创建和管理基于ElevenLabs语音能力的会话 агенти,可以进行语音对话和交互。
- 知识库集成 (Knowledge Base Integration): 允许 агенти 访问和利用外部知识库(如文档、网页等),提升 агенти 的知识水平和回答能力。
- 电话呼叫 (Phone Calls): 通过Twilio集成,实现通过 агенти 进行电话呼叫的功能。
- 语音库搜索 (Voice Library Search): 搜索和浏览ElevenLabs庞大的共享语音库,发现和使用各种风格的语音。
- 音频处理工具 (Audio Processing Tools): 提供音频隔离等工具,对音频文件进行处理。
- 订阅状态查询 (Subscription Status): 查询ElevenLabs API的订阅和使用情况。
安装步骤
- 安装 'elevenlabs-mcp' Python包:
打开终端或命令提示符,运行以下命令安装:
pip install elevenlabs-mcp
服务器配置
对于 Claude Desktop 客户端:
-
获取ElevenLabs API Key: 访问 ElevenLabs官网 获取API Key。
-
编辑 Claude Desktop 配置文件 'claude_desktop_config.json':
- 打开 Claude Desktop,进入 "Settings" -> "Developer" -> "Edit Config" -> "claude_desktop_config.json"。
- 在 'claude_desktop_config.json' 文件中,找到 '"mcpServers"' 部分(如果没有则创建),添加以下JSON配置:
{ "mcpServers": { "ElevenLabs": { "command": "uvx", "args": ["elevenlabs-mcp"], "env": { "ELEVENLABS_API_KEY": "<请替换为你的API Key>" // 替换为你在ElevenLabs官网获取的API Key } } } }注意:
- '<请替换为你的API Key>' 需要替换成你实际的ElevenLabs API Key。
- 如果你的 Claude Desktop 在 Windows 系统上运行,可能需要启用 "Developer Mode" (在Claude Desktop菜单 "Help" -> "Enable Developer Mode")。
对于其他 MCP 客户端 (如 Cursor, Windsurf, OpenAI Agents):
-
生成 MCP 服务器配置信息: 在终端或命令提示符中运行以下命令,将 '<请替换为你的API Key>' 替换为你的实际API Key:
python -m elevenlabs_mcp --api-key=<请替换为你的API Key> --print该命令会输出 JSON 格式的 MCP 服务器配置信息。
-
将配置信息粘贴到 MCP 客户端的配置文件中: 根据你使用的 MCP 客户端的文档,找到指定的配置文件目录,并将上一步生成的 JSON 配置信息粘贴到相应的配置文件中。
基本使用方法
配置完成后,在支持 MCP 的 LLM 客户端中(例如 Claude Desktop),你可以通过自然语言指令来调用 ElevenLabs MCP 服务器提供的工具。
例如,在 Claude 中你可以尝试提问:
- "Create an AI agent that speaks like a film noir detective and can answer questions about classic movies" (创建一个听起来像黑色电影侦探的AI агенти,可以回答关于经典电影的问题)
- "Generate three voice variations for a wise, ancient dragon character, then I will choose my favorite voice to add to my voice library" (为一个睿智的古代龙角色生成三种声音变体,然后我将选择我最喜欢的声音添加到我的声音库)
- "Convert this recording of my voice to sound like a medieval knight" (将我的声音录音转换成听起来像中世纪骑士的声音)
- "Create a soundscape of a thunderstorm in a dense jungle with animals reacting to the weather" (创建一个茂密丛林中雷暴的声音景观,其中动物对天气做出反应)
- "Turn this speech into text, identify different speakers, then convert it back using unique voices for each person" (将这段语音转换成文本,识别不同的说话人,然后使用每个人独特的语音转换回去)
注意: 使用带有 "⚠️ COST WARNING" 标记的工具会消耗 ElevenLabs API 的额度,请谨慎使用。
信息
分类
AI与计算