项目简介
AI-Media-Indexer是一个基于Model Context Protocol (MCP)构建的媒体内容管理系统,能够对大型媒体库进行智能索引和语义搜索。
主要功能
- 多模态媒体扫描:自动发现视频、音频和图像文件
- 智能内容分析:自动提取元数据、生成文字转录、分析视觉内容
- 人脸检测与识别:使用dlib和MediaPipe进行人脸检测,并通过DBSCAN聚类识别身份
- 语义搜索能力:
- 视觉搜索:通过自然语言描述查找场景(如"红色汽车在桥上")
- 对话搜索:在口语对话中搜索特定内容
- 向量数据库支持:使用Qdrant进行高效的相似性搜索
- 代理工作流支持:通过MCP服务器-客户端架构实现自主工具调用
安装步骤
- 克隆仓库:'git clone https://github.com/gnanaprakash2918/AI-Media-Indexer.git'
- 进入目录:'cd AI-Media-Indexer'
- 安装依赖:'uv sync'
- 确保已安装Python 3.12+和uv包管理器
服务器配置
MCP服务器通过stdio传输协议运行,启动命令为:
command: "uv" args: ["run", "python", "-m", "core.agent.server' ## 基本使用方法 1. 启动MCP服务器:'uv run python -m core.agent.server' 2. 客户端可通过MCP协议调用以下工具: - 'search_media':基于自然语言查询搜索媒体内容 - 'ingest_media':将新的媒体文件添加到索引系统中 3. 客户端可以通过agent_cli.py进行交互式查询 该服务器为MCP客户端提供了完整的媒体管理和搜索能力,客户端只需通过标准MCP协议与服务器通信即可使用所有功能。
信息
分类
AI与计算