MCP 音频接口服务器使用说明

项目简介

这是一个基于 Model Context Protocol (MCP) 实现的服务器，旨在为支持 MCP 的大型语言模型 (LLM) 客户端（如 Claude Desktop）提供访问本地计算机音频设备（麦克风和扬声器）的能力。它将音频输入输出功能封装为 LLM 可以调用的工具。

获取项目代码: 从 GitHub 克隆仓库或下载项目文件：

git clone https://github.com/GongRzhe/Audio-MCP-Server.git
cd Audio-MCP-Server

使用安装脚本 (推荐): 运行包含的设置脚本会自动创建 Python 虚拟环境并安装所需依赖：

python setup_mcp.py

或者，手动安装: a. 创建并激活 Python 虚拟环境 (需要 Python 3.8 或更高版本):

# Windows
python -m venv .venv
.venv\Scripts\activate

# macOS/Linux
python -m venv .venv
source .venv/bin/activate

b. 安装依赖：

pip install -r requirements.txt

安装完成后，'setup_mcp.py' 脚本会提示 MCP 服务器的配置信息和保存位置。

MCP 服务器需要由 MCP 客户端启动和管理。您的 LLM 客户端（如 Claude Desktop）需要在其配置文件中添加对此音频 MCP 服务器的引用。

通常，这涉及指定以下关键信息：

'setup_mcp.py' 脚本会自动生成一个示例配置，并打印出适用于不同客户端（如 Claude Desktop）的配置信息，您可以参考这些信息手动编辑您的客户端配置文件。请确保将命令和脚本路径替换为您系统上的实际路径。

配置完成后，重新启动支持 MCP 的 LLM 客户端。如果配置正确，客户端应该能识别到该服务器提供的工具。

您可以通过向 LLM 客户端发出自然语言指令来使用音频功能，例如：

询问：“我的系统上有哪些麦克风和扬声器？” (对应 'list_audio_devices' 工具)
请求：“录制 10 秒的音频。” (对应 'record_audio' 工具，带参数 duration=10)
请求：“播放刚才录制的音频。” (对应 'play_latest_recording' 工具)
请求：“播放路径为 /path/to/your/audio.mp3 的音频文件。” (对应 'play_audio_file' 工具，带参数 file_path=/path/to/your/audio.mp3)

LLM 客户端会根据您的指令判断需要调用哪个工具，并通过 MCP 协议将请求发送给音频 MCP 服务器执行。