项目简介
Scouter是一个基于知识图谱的文档检索系统,专门为大型语言模型提供上下文信息。它能够将PDF和文本文档转化为知识图谱,并通过MCP协议向LLM客户端提供语义搜索能力。
主要功能
- 文档智能摄取:自动处理PDF和文本文件,构建知识图谱
- 语义搜索:通过向量检索找到与查询最相关的文档内容
- 多格式支持:支持PDF文档和纯文本内容的摄取和处理
- MCP集成:作为标准的MCP服务器,为Claude Desktop等MCP客户端提供检索服务
- 异步处理:使用Celery和Redis实现高效的异步文档处理
- 评估框架:内置检索质量评估系统
安装步骤
- 环境准备:确保安装Docker和Docker Compose
- 快速启动:
# 启动Neo4j数据库 make neo4j-up # 启动所有服务 docker-compose up -d
2. **本地开发**: ```bash # 创建虚拟环境 uv venv source .venv/bin/activate uv pip install -e . # 分别启动各个服务 redis-server uvicorn app_main:app --reload celery -A src.scouter_app.ingestion.tasks worker --loglevel=info make neo4j-up
服务器配置
MCP客户端需要配置以下信息来连接Scouter服务器:
{ "command": "python", "args": ["-m", "src.scouter_app.agent.mcp' **参数说明:** - 'command': 使用Python解释器 - 'args': 启动MCP服务器模块 ## 基本使用方法 1. 启动MCP服务器后,MCP客户端可以通过Stdio协议连接 2. 客户端可以调用'semantic_search'工具进行知识图谱检索 3. 支持查询语义搜索,返回相关文档片段和相似度评分
信息
分类
数据库与文件