使用说明

项目简介

本项目是一个基于 Model Context Protocol (MCP) 构建的服务器,旨在为LLM应用提供便捷的YouTube视频转录文本获取服务。通过简单的API调用,即可提取指定YouTube视频的字幕,并支持多种语言和文本格式设置,方便LLM进行视频内容分析、摘要和理解等任务。

主要功能点

  • 提取YouTube视频的转录文本:支持从YouTube视频中抓取字幕信息。
  • 支持多种语言:支持包括英语、中文、日语、俄语等多种语言的字幕提取。
  • 文本格式化选项:提供纯文本和段落模式两种文本格式输出,满足不同LLM应用的需求。
  • 返回视频元数据:除了转录文本,还提供视频标题、语言、处理时间、字符数等详细元数据。
  • 灵活的输入方式:支持通过YouTube视频URL或Video ID获取转录文本。

安装步骤

  1. 环境准备:确保您的机器上已安装 Node.js 18 或更高版本。
  2. 全局安装:通过 npm 包管理器全局安装该 MCP 服务器:
    npm install -g @sinco-lab/mcp-youtube-transcript

服务器配置

要将此 MCP 服务器配置到 MCP 客户端(如 Claude Desktop, Cursor, cline 等),您需要在客户端的 MCP 服务器配置中添加以下 JSON 配置信息。这允许客户端知道如何启动和连接到 'mcp-youtube-transcript' 服务器。

{
  "mcpServers": {
    "youtube-transcript": {
      "command": "npx",
      "args": ["@sinco-lab/mcp-youtube-transcript"]
    }
  }
}
  • 配置参数说明
    • 'server name':'youtube-transcript' - 为该服务器设置一个名称,在客户端中用于唯一标识和调用。
    • 'command':'npx' - 指定用于启动服务器的命令,这里使用 'npx' 来运行 npm 包。
    • 'args':'["@sinco-lab/mcp-youtube-transcript"]' - 命令的参数,指定要通过 'npx' 运行的 npm 包名称,即 '@sinco-lab/mcp-youtube-transcript'。

基本使用方法

配置完成后,在您的 MCP 客户端中,您可以使用 'get_transcripts' 工具来请求 YouTube 视频的转录文本。

调用 'get_transcripts' 工具时,您需要提供以下参数

  • 'url' (必填):YouTube 视频的 URL 或 Video ID。
  • 'lang' (可选):转录文本的语言代码,默认为 '"en"'。例如,中文为 '"zh"',日文为 '"ja"' 等。
  • 'enableParagraphs' (可选):布尔值,是否启用段落模式。默认为 'false',即输出连续的文本;设置为 'true' 则会尝试将文本按段落分割。

工具调用示例 (在 MCP Inspector 或类似的 MCP 客户端中)

Tool: get_transcripts
url: "https://www.youtube.com/watch?v=your_video_id"
lang: "zh"
enableParagraphs: true

将 'your_video_id' 替换为您想要获取转录文本的 YouTube 视频 ID 或 URL,并根据需要设置语言和段落模式参数。服务器将返回包含转录文本和相关元数据的 JSON 响应。

信息

分类

网页与API