ElevenLabs MCP服务器使用说明

项目简介

ElevenLabs MCP服务器是ElevenLabs官方提供的Model Context Protocol (MCP) 服务器实现,它允许LLM客户端(如Claude Desktop, Cursor, Windsurf, OpenAI Agents等)通过MCP协议调用ElevenLabs的语音API,实现文本到语音合成、语音克隆、音频转录、音效生成等功能。

主要功能点

  • 文本到语音 (Text to Speech, TTS): 将文本转换为自然流畅的语音,支持多种声音、语速、音调等参数调节,可用于生成各种风格的语音内容。
  • 语音到文本 (Speech to Text, STT): 将音频文件中的语音转录为文本,支持多种语言和speaker diarization(区分说话人),方便LLM理解音频内容。
  • 语音克隆 (Voice Cloning): 通过上传用户自己的录音样本,克隆出与样本声音相似的定制化语音,扩展语音合成的可能性。
  • 音效生成 (Text to Sound Effects): 根据文本描述生成各种音效,例如雷声、动物叫声等,为LLM应用增加声音维度。
  • 语音转换 (Speech to Speech, STS): 将一种声音的音频文件转换为另一种指定声音的音频文件,实现声音风格的迁移。
  • 语音设计 (Text to Voice): 根据文本描述生成新的声音预览,允许用户根据描述创造独特的AI声音。
  • 会话 агенти (Conversational Agents): 创建和管理基于ElevenLabs语音能力的会话 агенти,可以进行语音对话和交互。
  • 知识库集成 (Knowledge Base Integration): 允许 агенти 访问和利用外部知识库(如文档、网页等),提升 агенти 的知识水平和回答能力。
  • 电话呼叫 (Phone Calls): 通过Twilio集成,实现通过 агенти 进行电话呼叫的功能。
  • 语音库搜索 (Voice Library Search): 搜索和浏览ElevenLabs庞大的共享语音库,发现和使用各种风格的语音。
  • 音频处理工具 (Audio Processing Tools): 提供音频隔离等工具,对音频文件进行处理。
  • 订阅状态查询 (Subscription Status): 查询ElevenLabs API的订阅和使用情况。

安装步骤

  1. 安装 'elevenlabs-mcp' Python包: 打开终端或命令提示符,运行以下命令安装:
    pip install elevenlabs-mcp

服务器配置

对于 Claude Desktop 客户端:

  1. 获取ElevenLabs API Key: 访问 ElevenLabs官网 获取API Key。

  2. 编辑 Claude Desktop 配置文件 'claude_desktop_config.json':

    • 打开 Claude Desktop,进入 "Settings" -> "Developer" -> "Edit Config" -> "claude_desktop_config.json"。
    • 在 'claude_desktop_config.json' 文件中,找到 '"mcpServers"' 部分(如果没有则创建),添加以下JSON配置:
    {
      "mcpServers": {
        "ElevenLabs": {
          "command": "uvx",
          "args": ["elevenlabs-mcp"],
          "env": {
            "ELEVENLABS_API_KEY": "<请替换为你的API Key>"  // 替换为你在ElevenLabs官网获取的API Key
          }
        }
      }
    }

    注意:

    • '<请替换为你的API Key>' 需要替换成你实际的ElevenLabs API Key。
    • 如果你的 Claude Desktop 在 Windows 系统上运行,可能需要启用 "Developer Mode" (在Claude Desktop菜单 "Help" -> "Enable Developer Mode")。

对于其他 MCP 客户端 (如 Cursor, Windsurf, OpenAI Agents):

  1. 生成 MCP 服务器配置信息: 在终端或命令提示符中运行以下命令,将 '<请替换为你的API Key>' 替换为你的实际API Key:

    python -m elevenlabs_mcp --api-key=<请替换为你的API Key> --print

    该命令会输出 JSON 格式的 MCP 服务器配置信息。

  2. 将配置信息粘贴到 MCP 客户端的配置文件中: 根据你使用的 MCP 客户端的文档,找到指定的配置文件目录,并将上一步生成的 JSON 配置信息粘贴到相应的配置文件中。

基本使用方法

配置完成后,在支持 MCP 的 LLM 客户端中(例如 Claude Desktop),你可以通过自然语言指令来调用 ElevenLabs MCP 服务器提供的工具。

例如,在 Claude 中你可以尝试提问:

  • "Create an AI agent that speaks like a film noir detective and can answer questions about classic movies" (创建一个听起来像黑色电影侦探的AI агенти,可以回答关于经典电影的问题)
  • "Generate three voice variations for a wise, ancient dragon character, then I will choose my favorite voice to add to my voice library" (为一个睿智的古代龙角色生成三种声音变体,然后我将选择我最喜欢的声音添加到我的声音库)
  • "Convert this recording of my voice to sound like a medieval knight" (将我的声音录音转换成听起来像中世纪骑士的声音)
  • "Create a soundscape of a thunderstorm in a dense jungle with animals reacting to the weather" (创建一个茂密丛林中雷暴的声音景观,其中动物对天气做出反应)
  • "Turn this speech into text, identify different speakers, then convert it back using unique voices for each person" (将这段语音转换成文本,识别不同的说话人,然后使用每个人独特的语音转换回去)

注意: 使用带有 "⚠️ COST WARNING" 标记的工具会消耗 ElevenLabs API 的额度,请谨慎使用。

信息

分类

AI与计算