AI媒体索引器MCP服务器

关键词

媒体索引多模态搜索人脸识别语音转录向量数据库

项目简介

AI-Media-Indexer是一个基于Model Context Protocol (MCP)构建的媒体内容管理系统，能够对大型媒体库进行智能索引和语义搜索。

主要功能

多模态媒体扫描：自动发现视频、音频和图像文件
智能内容分析：自动提取元数据、生成文字转录、分析视觉内容
人脸检测与识别：使用dlib和MediaPipe进行人脸检测，并通过DBSCAN聚类识别身份
语义搜索能力：
- 视觉搜索：通过自然语言描述查找场景（如"红色汽车在桥上"）
对话搜索：在口语对话中搜索特定内容
向量数据库支持：使用Qdrant进行高效的相似性搜索
代理工作流支持：通过MCP服务器-客户端架构实现自主工具调用

安装步骤

克隆仓库：'git clone https://github.com/gnanaprakash2918/AI-Media-Indexer.git'
进入目录：'cd AI-Media-Indexer'
安装依赖：'uv sync'
确保已安装Python 3.12+和uv包管理器

服务器配置

MCP服务器通过stdio传输协议运行，启动命令为：

command: "uv"
args: ["run", "python", "-m", "core.agent.server'

## 基本使用方法
1. 启动MCP服务器：'uv run python -m core.agent.server'
2. 客户端可通过MCP协议调用以下工具：
   - 'search_media'：基于自然语言查询搜索媒体内容
   - 'ingest_media'：将新的媒体文件添加到索引系统中
3. 客户端可以通过agent_cli.py进行交互式查询

该服务器为MCP客户端提供了完整的媒体管理和搜索能力，客户端只需通过标准MCP协议与服务器通信即可使用所有功能。

服务器信息

分类