Scouter知识图谱检索系统

关键词

知识图谱文档检索语义搜索 RAG系统 Neo4j

项目简介

Scouter是一个基于知识图谱的文档检索系统，专门为大型语言模型提供上下文信息。它能够将PDF和文本文档转化为知识图谱，并通过MCP协议向LLM客户端提供语义搜索能力。

主要功能

文档智能摄取：自动处理PDF和文本文件，构建知识图谱
语义搜索：通过向量检索找到与查询最相关的文档内容
多格式支持：支持PDF文档和纯文本内容的摄取和处理
MCP集成：作为标准的MCP服务器，为Claude Desktop等MCP客户端提供检索服务
异步处理：使用Celery和Redis实现高效的异步文档处理
评估框架：内置检索质量评估系统

安装步骤

环境准备：确保安装Docker和Docker Compose

快速启动：

# 启动Neo4j数据库
make neo4j-up

# 启动所有服务
docker-compose up -d


2. **本地开发**：
   ```bash
   # 创建虚拟环境
   uv venv
   source .venv/bin/activate
   uv pip install -e .
   
   # 分别启动各个服务
   redis-server
   uvicorn app_main:app --reload
   celery -A src.scouter_app.ingestion.tasks worker --loglevel=info
   make neo4j-up

服务器配置

MCP客户端需要配置以下信息来连接Scouter服务器：

{
  "command": "python",
  "args": ["-m", "src.scouter_app.agent.mcp'

**参数说明：**
- 'command': 使用Python解释器
- 'args': 启动MCP服务器模块

## 基本使用方法
1. 启动MCP服务器后，MCP客户端可以通过Stdio协议连接
2. 客户端可以调用'semantic_search'工具进行知识图谱检索
3. 支持查询语义搜索，返回相关文档片段和相似度评分

服务器信息

分类

数据库与文件