Deep Transcribe MCP服务器使用说明
项目简介
Deep Transcribe 是一个可以将音视频URL(如YouTube)进行“深度转录”的工具,包括完整转录、说话人识别、添加章节、时间戳和注释,并插入帧捕获。它基于 kash 及其 kash-media 工具包构建。作为 MCP 服务器运行时,它可以作为 LLM 客户端的后端,提供音视频转录能力。
主要功能点
- 音视频转录: 支持多种音视频源URL,例如 YouTube。
- 深度转录: 提供包括完整转录、说话人识别、章节、时间戳和注释等详细信息。
- 多种转录模式: 支持基础转录、格式化转录和带注释的转录。
- MCP 服务器: 可以通过标准的 Model Context Protocol 协议与 LLM 客户端通信,提供转录工具服务。
- 多种传输协议: 支持 Stdio 和 SSE 传输协议。
安装步骤
-
安装 'deep_transcribe' 工具: 打开终端并执行以下命令安装 'deep_transcribe' 工具。
uv tool install --upgrade deep_transcribe注意: 安装前请确保已安装 'uv' 和 Python 环境,具体安装方法请参考仓库中的 installation.md 文件。
-
配置 API 密钥: Deep Transcribe 默认需要 Deepgram 和 Anthropic (Claude) 的 API 密钥。复制仓库中的 'env.template' 文件内容,根据提示设置 'DEEPGRAM_API_KEY' 和 'ANTHROPIC_API_KEY' 环境变量。
服务器配置
要将 Deep Transcribe 配置为 MCP 服务器供 MCP 客户端使用,您需要为客户端提供服务器的启动配置。以下是基于仓库信息生成的 JSON 格式配置,适用于如 Claude Desktop 等 MCP 客户端:
{ "mcpServers": { "deep_transcribe_server": { // 服务器名称,客户端用于标识和调用 "command": "/Users/your_username/.local/bin/deep_transcribe", // Deep Transcribe 的可执行文件路径,请替换为您的实际路径 "args": ["mcp"] // 启动 MCP 服务器的参数,这里表示以 stdio 模式运行 MCP 服务器 // 如果需要以 SSE 模式运行,可以将 "args" 修改为 ["mcp", "--sse"] } } }
配置参数说明:
- '"deep_transcribe_server"': 服务器名称,可以自定义,用于在 MCP 客户端中引用。
- '"command"': 'deep_transcribe' 可执行文件的完整路径。您需要将其替换为您实际安装 'deep_transcribe' 后可执行文件的路径。通常,使用 'uv tool install' 安装的工具的可执行文件位于 '~/.local/bin/' 目录下。您可以使用 'which deep_transcribe' 命令查找实际路径。
- '"args"': 启动服务器的命令行参数。
- '["mcp"]': 以 stdio 模式启动 MCP 服务器。
- '["mcp", "--sse"]': 以 SSE 模式启动 MCP 服务器,服务器地址为 'http://127.0.0.1:4440'。
请注意: MCP 客户端需要根据自身配置文件的格式来填写以上 JSON 配置信息。例如,Claude Desktop 的配置文件通常是 '~/.claude/settings.json'。
基本使用方法
-
启动 MCP 服务器: 打开终端,根据您选择的传输协议执行以下命令启动 Deep Transcribe MCP 服务器:
-
Stdio 模式:
deep_transcribe mcp -
SSE 模式:
deep_transcribe mcp --sse
启动后,服务器将在后台运行并等待 MCP 客户端的连接和请求。
-
-
配置 MCP 客户端: 在您的 MCP 客户端(例如 Claude Desktop)中,根据客户端的要求配置 MCP 服务器连接信息。您需要填入上面 服务器配置 部分生成的 JSON 配置。确保客户端能够正确连接到 Deep Transcribe MCP 服务器。
-
使用 LLM 客户端调用转录工具: 连接成功后,您可以在 LLM 客户端中,通过 MCP 协议调用 Deep Transcribe 服务器提供的转录工具,例如 'transcribe', 'transcribe_format', 'transcribe_annotate' 等。 具体的调用方式取决于您的 MCP 客户端和 Deep Transcribe 服务器支持的工具和参数。
例如,在支持工具调用的 LLM 应用中,您可以指示 LLM 调用 'deep_transcribe_server' 服务器的 'transcribe_annotate' 工具来转录指定的 YouTube 视频 URL。
查看 MCP 服务器日志 (调试)
如果您需要调试 MCP 服务器,可以使用以下命令查看服务器日志:
deep_transcribe mcp --logs
这将实时显示 MCP 服务器的日志输出。
信息
分类
AI与计算