MCP 音频接口服务器使用说明
项目简介
这是一个基于 Model Context Protocol (MCP) 实现的服务器,旨在为支持 MCP 的大型语言模型 (LLM) 客户端(如 Claude Desktop)提供访问本地计算机音频设备(麦克风和扬声器)的能力。它将音频输入输出功能封装为 LLM 可以调用的工具。
主要功能点
- 列出可用音频设备: 显示系统上所有可用的麦克风和扬声器列表。
- 录制音频: 通过麦克风录制指定时长和参数的音频。
- 播放最近录音: 播放最近一次录制的声音。
- 播放音频文件: 通过扬声器播放计算机上的指定音频文件。
- 文本转语音: (此功能在核心服务器中为待实现状态,实验版本可能包含实现)
安装步骤
- 获取项目代码:
从 GitHub 克隆仓库或下载项目文件:
git clone https://github.com/GongRzhe/Audio-MCP-Server.git cd Audio-MCP-Server - 使用安装脚本 (推荐):
运行包含的设置脚本会自动创建 Python 虚拟环境并安装所需依赖:
或者,手动安装: a. 创建并激活 Python 虚拟环境 (需要 Python 3.8 或更高版本):python setup_mcp.py
b. 安装依赖:# Windows python -m venv .venv .venv\Scripts\activate # macOS/Linux python -m venv .venv source .venv/bin/activatepip install -r requirements.txt
安装完成后,'setup_mcp.py' 脚本会提示 MCP 服务器的配置信息和保存位置。
服务器配置
MCP 服务器需要由 MCP 客户端启动和管理。您的 LLM 客户端(如 Claude Desktop)需要在其配置文件中添加对此音频 MCP 服务器的引用。
通常,这涉及指定以下关键信息:
- 一个唯一的服务器名称(例如,'audio-interface')。
- 启动服务器进程的命令 ('command'),这通常是您虚拟环境中的 Python 解释器路径。
- 传递给命令的参数 ('args'),这通常是服务器主脚本的路径(例如,'audio_server.py')。
- 可选的环境变量 ('env'),例如设置 'PYTHONPATH' 指向项目目录。
'setup_mcp.py' 脚本会自动生成一个示例配置,并打印出适用于不同客户端(如 Claude Desktop)的配置信息,您可以参考这些信息手动编辑您的客户端配置文件。请确保将命令和脚本路径替换为您系统上的实际路径。
基本使用方法
配置完成后,重新启动支持 MCP 的 LLM 客户端。如果配置正确,客户端应该能识别到该服务器提供的工具。
您可以通过向 LLM 客户端发出自然语言指令来使用音频功能,例如:
- 询问:“我的系统上有哪些麦克风和扬声器?” (对应 'list_audio_devices' 工具)
- 请求:“录制 10 秒的音频。” (对应 'record_audio' 工具,带参数 duration=10)
- 请求:“播放刚才录制的音频。” (对应 'play_latest_recording' 工具)
- 请求:“播放路径为 /path/to/your/audio.mp3 的音频文件。” (对应 'play_audio_file' 工具,带参数 file_path=/path/to/your/audio.mp3)
LLM 客户端会根据您的指令判断需要调用哪个工具,并通过 MCP 协议将请求发送给音频 MCP 服务器执行。
信息
分类
AI与计算