项目简介

AI-Media-Indexer是一个基于Model Context Protocol (MCP)构建的媒体内容管理系统,能够对大型媒体库进行智能索引和语义搜索。

主要功能

  • 多模态媒体扫描:自动发现视频、音频和图像文件
  • 智能内容分析:自动提取元数据、生成文字转录、分析视觉内容
  • 人脸检测与识别:使用dlib和MediaPipe进行人脸检测,并通过DBSCAN聚类识别身份
  • 语义搜索能力
    • 视觉搜索:通过自然语言描述查找场景(如"红色汽车在桥上")
  • 对话搜索:在口语对话中搜索特定内容
  • 向量数据库支持:使用Qdrant进行高效的相似性搜索
  • 代理工作流支持:通过MCP服务器-客户端架构实现自主工具调用

安装步骤

  1. 克隆仓库:'git clone https://github.com/gnanaprakash2918/AI-Media-Indexer.git'
  2. 进入目录:'cd AI-Media-Indexer'
  3. 安装依赖:'uv sync'
  4. 确保已安装Python 3.12+和uv包管理器

服务器配置

MCP服务器通过stdio传输协议运行,启动命令为:

command: "uv"
args: ["run", "python", "-m", "core.agent.server'

## 基本使用方法
1. 启动MCP服务器:'uv run python -m core.agent.server'
2. 客户端可通过MCP协议调用以下工具:
   - 'search_media':基于自然语言查询搜索媒体内容
   - 'ingest_media':将新的媒体文件添加到索引系统中
3. 客户端可以通过agent_cli.py进行交互式查询

该服务器为MCP客户端提供了完整的媒体管理和搜索能力,客户端只需通过标准MCP协议与服务器通信即可使用所有功能。

信息

分类

AI与计算