ListenHub MCP Server

项目简介

ListenHub MCP Server 是 ListenHub 官方提供的 Model Context Protocol (MCP) 服务器。它允许大语言模型(如 Claude)直接调用 ListenHub 的 AI 音频生成能力,包括制作多角色对话播客、将文本转换为自然的语音流(FlowSpeech),以及查询可用的声音模型和用户订阅状态。

主要功能

  1. AI 播客生成 (Podcast Generation)
    • 支持单人独白或双人对话形式。
    • 提供三种生成模式:快速模式(3-5分钟)、深度模式(8-15分钟)和辩论模式(5-10分钟)。
    • 支持全流程生成(文本+音频)或仅生成文本脚本。
    • 支持从文本内容或 URL 链接生成播客。
  2. FlowSpeech 语音合成
    • 将文章或网页内容转换为流畅的单人语音。
    • 支持智能模式(AI 优化语法)和直接模式(逐字朗读)。
  3. 声音模型管理
    • 查询可用的发音人列表(支持中文和英文)。
    • 获取发音人的详细信息(性别、语言、试听链接)。
  4. 账户管理
    • 查询当前用户的订阅状态、剩余点数和会员有效期。

安装步骤

  1. 环境准备:确保您的系统已安装 Node.js (v18 或更高版本)。
  2. 获取 API Key

服务器配置

请在您的 MCP 客户端(如 Claude Desktop, Cursor 等)中添加以下配置。

配置信息 (JSON):

{
  "mcpServers": {
    "listenhub": {
      "command": "npx",
      "args": [
        "-y",
        "@marswave/listenhub-mcp-server@latest"
      ],
      "env": {
        "LISTENHUB_API_KEY": "您的_LISTENHUB_API_KEY"
      }
    }
  }
}

注意:请将 '您的_LISTENHUB_API_KEY' 替换为您实际获取的 API 密钥。

基本使用方法

配置完成后,您可以直接在对话中要求 AI 执行相关任务:

  1. 查询可用声音

    • 输入:“列出所有可用的中文发音人”或“帮我找一个适合讲故事的英语男声”。
    • AI 会调用 'get_speakers' 工具并展示发音人列表。
  2. 生成播客

    • 输入:“使用 David 和 Lily 的声音,根据这个主题生成一个关于人工智能未来的辩论播客:[粘贴内容或链接]”。
    • AI 会调用 'create_podcast' 工具,并在生成完成后返回音频链接和脚本大纲。
  3. 生成语音朗读 (FlowSpeech)

    • 输入:“把这篇文章转换成语音,使用智能模式:[文章链接]”。
    • AI 会调用 'create_flowspeech' 工具。
  4. 查询状态

    • 如果生成过程较长,可以询问:“查询刚才那个播客生成的进度怎么样了?”
    • AI 会使用 'get_podcast_status' 获取最新状态。

服务器信息