使用说明
项目简介
Voice Recorder MCP Server 是一个实现了 Model Context Protocol (MCP) 的服务器,专注于提供语音录制和转录功能。它使用 OpenAI 的 Whisper 模型将用户的语音转换为文本,并通过 MCP 协议将转录结果提供给 LLM 客户端,例如 Goose AI Agent。
主要功能点
- 录音功能: 支持从默认麦克风录制音频。
- 语音转文本: 使用 OpenAI Whisper 模型将录音转录为文本。
- 多种 Whisper 模型: 支持多种大小的 Whisper 模型,用户可以根据需求选择速度、准确度和资源消耗不同的模型。
- 工具集成: 提供 'start_recording', 'stop_and_transcribe', 'record_and_transcribe' 等工具,方便 LLM 客户端调用。
- 灵活配置: 允许通过命令行参数或环境变量配置 Whisper 模型和音频采样率。
- 兼容 MCP Inspector: 方便开发者使用 MCP Inspector 测试和调试服务器。
- Goose AI Agent 集成: 可以作为 Goose AI Agent 的自定义扩展,无缝集成到 Goose AI 工作流中。
安装步骤
- 克隆仓库:
git clone https://github.com/DefiBax/mcp_servers.git cd mcp_servers/voice-recorder-mcp - 安装 Python 包:
确保您的 Python 版本为 3.12 或更高。然后使用 pip 安装项目依赖:
pip install -e .
服务器配置
MCP 服务器需要配置启动命令和参数才能被 MCP 客户端(如 Goose AI Agent)调用。以下是 Voice Recorder MCP Server 的配置信息,您需要将其配置到您的 MCP 客户端中。
Goose AI Agent 配置示例 (JSON 格式):
在 Goose AI Agent 中添加 Command Line Extension 时,您需要填写以下配置信息。
{ "server name": "voice-recorder", "command": "/path/to/voice-recorder-mcp", "args": [] }
配置参数说明:
-
'"server name"': 服务器名称,例如 '"voice-recorder"',这将在 Goose AI Agent 中用于标识该扩展。
-
'"command"': Voice Recorder MCP Server 的启动命令。您需要将 '/path/to/voice-recorder-mcp' 替换为 'voice-recorder-mcp' 可执行文件的实际完整路径。 您可以使用 'which voice-recorder-mcp' 命令在终端中查找完整路径,并将其复制到 '"command"' 字段中。
-
'"args"': 启动参数 (可选)。 您可以根据需要添加启动参数来配置服务器,例如指定 Whisper 模型。
- 指定 Whisper 模型示例: 如果您想使用 'medium.en' 模型,可以将 '"args"' 配置为 '["--model", "medium.en"]'。
{ "server name": "voice-recorder", "command": "/path/to/voice-recorder-mcp", "args": ["--model", "medium.en"] } - 调整音频采样率示例: 如果您需要调整采样率,例如设置为 44100,可以将 '"args"' 配置为 '["--sample-rate", "44100"]'。
{ "server name": "voice-recorder", "command": "/path/to/voice-recorder-mcp", "args": ["--sample-rate", "44100"] } - 同时指定模型和采样率示例:
{ "server name": "voice-recorder", "command": "/path/to/voice-recorder-mcp", "args": ["--model", "medium.en", "--sample-rate", "44100"] } - 不使用参数: 如果您使用默认配置 (base.en 模型和 16000 采样率),可以将 '"args"' 留空 '[]'。
- 指定 Whisper 模型示例: 如果您想使用 'medium.en' 模型,可以将 '"args"' 配置为 '["--model", "medium.en"]'。
请务必将 '/path/to/voice-recorder-mcp' 替换为实际路径!
基本使用方法
-
启动服务器 (Standalone 模式): 在终端中运行 'voice-recorder-mcp' 命令即可启动服务器。您可以根据需要添加参数,例如 'voice-recorder-mcp --model medium.en'。
-
使用 MCP Inspector 测试: 按照 README 中的说明安装并运行 MCP Inspector,连接到 'voice-recorder-mcp' 服务器,即可通过图形界面测试服务器的功能。
-
集成到 Goose AI Agent: 在 Goose AI Agent 中配置好 Command Line Extension 后,您可以在与 Goose AI Agent 的对话中使用 'voice-recorder' 扩展提供的工具,例如指示 Goose AI Agent 调用 'voice-recorder' 的 'record_and_transcribe' 工具进行录音和转录。
例如,您可以对 Goose AI Agent 说: "请使用 voice-recorder 录制并转录我说的话"。 Goose AI Agent 将会调用 Voice Recorder MCP Server 提供的工具来完成录音和转录,并将结果返回给您。
信息
分类
AI与计算