MCP 音频接口服务器使用说明

项目简介

这是一个基于 Model Context Protocol (MCP) 实现的服务器,旨在为支持 MCP 的大型语言模型 (LLM) 客户端(如 Claude Desktop)提供访问本地计算机音频设备(麦克风和扬声器)的能力。它将音频输入输出功能封装为 LLM 可以调用的工具。

主要功能点

  • 列出可用音频设备: 显示系统上所有可用的麦克风和扬声器列表。
  • 录制音频: 通过麦克风录制指定时长和参数的音频。
  • 播放最近录音: 播放最近一次录制的声音。
  • 播放音频文件: 通过扬声器播放计算机上的指定音频文件。
  • 文本转语音: (此功能在核心服务器中为待实现状态,实验版本可能包含实现)

安装步骤

  1. 获取项目代码: 从 GitHub 克隆仓库或下载项目文件:
    git clone https://github.com/GongRzhe/Audio-MCP-Server.git
    cd Audio-MCP-Server
  2. 使用安装脚本 (推荐): 运行包含的设置脚本会自动创建 Python 虚拟环境并安装所需依赖:
    python setup_mcp.py
    或者,手动安装: a. 创建并激活 Python 虚拟环境 (需要 Python 3.8 或更高版本):
    # Windows
    python -m venv .venv
    .venv\Scripts\activate
    
    # macOS/Linux
    python -m venv .venv
    source .venv/bin/activate
    b. 安装依赖:
    pip install -r requirements.txt

安装完成后,'setup_mcp.py' 脚本会提示 MCP 服务器的配置信息和保存位置。

服务器配置

MCP 服务器需要由 MCP 客户端启动和管理。您的 LLM 客户端(如 Claude Desktop)需要在其配置文件中添加对此音频 MCP 服务器的引用。

通常,这涉及指定以下关键信息:

  • 一个唯一的服务器名称(例如,'audio-interface')。
  • 启动服务器进程的命令 ('command'),这通常是您虚拟环境中的 Python 解释器路径。
  • 传递给命令的参数 ('args'),这通常是服务器主脚本的路径(例如,'audio_server.py')。
  • 可选的环境变量 ('env'),例如设置 'PYTHONPATH' 指向项目目录。

'setup_mcp.py' 脚本会自动生成一个示例配置,并打印出适用于不同客户端(如 Claude Desktop)的配置信息,您可以参考这些信息手动编辑您的客户端配置文件。请确保将命令和脚本路径替换为您系统上的实际路径。

基本使用方法

配置完成后,重新启动支持 MCP 的 LLM 客户端。如果配置正确,客户端应该能识别到该服务器提供的工具。

您可以通过向 LLM 客户端发出自然语言指令来使用音频功能,例如:

  • 询问:“我的系统上有哪些麦克风和扬声器?” (对应 'list_audio_devices' 工具)
  • 请求:“录制 10 秒的音频。” (对应 'record_audio' 工具,带参数 duration=10)
  • 请求:“播放刚才录制的音频。” (对应 'play_latest_recording' 工具)
  • 请求:“播放路径为 /path/to/your/audio.mp3 的音频文件。” (对应 'play_audio_file' 工具,带参数 file_path=/path/to/your/audio.mp3)

LLM 客户端会根据您的指令判断需要调用哪个工具,并通过 MCP 协议将请求发送给音频 MCP 服务器执行。

信息

分类

AI与计算