项目简介
rime-mcp 是一个实现了 Model Context Protocol (MCP) 的后端服务。它连接到 Rime 的高质量文本转语音(TTS)API,将文字转换为音频,并在运行服务器的系统本地播放。这个服务器将TTS功能封装成一个MCP工具,供兼容MCP的AI客户端调用。
主要功能点
- 通过标准的MCP协议提供文本转语音服务。
- 集成 Rime API,支持多种语音选择和配置。
- 在服务器所在的系统直接播放生成的语音。
- 支持通过环境变量自定义工具描述和行为(例如:说话对象、说话时机、默认音色)。
安装步骤
- 确保您已安装 Node.js 16.x 或更高版本。
- 从 GitHub 克隆此仓库或下载代码。
- 进入项目目录。
- 运行 'npm install' 安装依赖。
- 运行 'npm run build' 构建项目。
服务器配置
MCP客户端需要以下配置来连接并启动 rime-mcp 服务器。这些配置通常在客户端的设置文件中完成,无需手动执行这里的命令:
- 启动命令 ('command'): 'npx'
- 命令参数 ('args'): '["rime-mcp"]'
- 环境变量 ('env'):
- 'RIME_API_KEY': 必需,您的 Rime API Key。
- 'RIME_GUIDANCE': 可选,关于何时以及如何使用说话工具的详细说明,会显示给AI。
- 'RIME_WHO_TO_ADDRESS': 可选,指定说话对象,默认"user"。
- 'RIME_WHEN_TO_SPEAK': 可选,指定 AI 何时应调用此工具说话,默认"when asked to speak"。
- 'RIME_VOICE': 可选,指定默认音色,默认"cove"。
请将您的 Rime API Key 配置到 'RIME_API_KEY' 环境变量中。其他可选环境变量可以根据需要配置,以更好地引导AI客户端使用此语音工具。
基本使用方法
安装并配置完成后,启动支持MCP的AI客户端。客户端会自动发现并连接到配置的 rime-mcp 服务器。根据服务器提供的工具描述(特别是受环境变量影响的 'speak' 工具描述),AI模型将知道何时以及如何调用 'speak' 工具,将生成的文本发送给服务器,服务器处理后将语音播放出来。用户可以通过与AI客户端交互,触发AI使用此语音功能。
信息
分类
AI与计算