项目简介

Scouter是一个基于知识图谱的文档检索系统,专门为大型语言模型提供上下文信息。它能够将PDF和文本文档转化为知识图谱,并通过MCP协议向LLM客户端提供语义搜索能力。

主要功能

  • 文档智能摄取:自动处理PDF和文本文件,构建知识图谱
  • 语义搜索:通过向量检索找到与查询最相关的文档内容
  • 多格式支持:支持PDF文档和纯文本内容的摄取和处理
  • MCP集成:作为标准的MCP服务器,为Claude Desktop等MCP客户端提供检索服务
  • 异步处理:使用Celery和Redis实现高效的异步文档处理
  • 评估框架:内置检索质量评估系统

安装步骤

  1. 环境准备:确保安装Docker和Docker Compose
  2. 快速启动
    # 启动Neo4j数据库
    make neo4j-up
    
    # 启动所有服务
    docker-compose up -d

2. **本地开发**:
   ```bash
   # 创建虚拟环境
   uv venv
   source .venv/bin/activate
   uv pip install -e .
   
   # 分别启动各个服务
   redis-server
   uvicorn app_main:app --reload
   celery -A src.scouter_app.ingestion.tasks worker --loglevel=info
   make neo4j-up

服务器配置

MCP客户端需要配置以下信息来连接Scouter服务器:

{
  "command": "python",
  "args": ["-m", "src.scouter_app.agent.mcp'

**参数说明:**
- 'command': 使用Python解释器
- 'args': 启动MCP服务器模块

## 基本使用方法
1. 启动MCP服务器后,MCP客户端可以通过Stdio协议连接
2. 客户端可以调用'semantic_search'工具进行知识图谱检索
3. 支持查询语义搜索,返回相关文档片段和相似度评分

信息

分类

数据库与文件