项目简介
CRISP-T (Sense-making from Text and Numbers!) 是一个定性研究方法和工具集,旨在整合文本数据(如文档列表)和数字数据(如Pandas DataFrame)进行分析。它通过结构化类保留了从主题建模、决策树等分析过程中产生的元数据。研究人员可以利用大型语言模型辅助进行计算性三角验证和意义建构。其核心亮点是提供了MCP服务器实现,使得CRISP-T的功能可以被Claude Desktop、VSCode等AI代理和MCP兼容客户端调用,提供上下文信息、执行分析工具和提供Prompt模板。
主要功能点
- 语料库管理: 加载、保存、添加、移除文档,以及管理文档间的关系。
- 文本分析 (NLP): 支持主题建模、情感分析、生成摘要、提取类别以及生成定性编码字典。
- 语义搜索: 利用ChromaDB进行文档和文档片段的语义搜索,帮助用户发现相关内容。
- 数据框操作: 提供获取数据框列名、行数、行数据,以及对数据进行分箱、独热编码、过采样、过滤等操作。
- 机器学习 (ML): 提供K-Means聚类、决策树分类、SVM分类、神经网络分类、回归分析(线性/逻辑)、PCA降维和关联规则等多种机器学习算法。
- Prompt模板: 提供预设的分析工作流指南和三角验证指南Prompt,帮助用户更好地利用工具。
- AI集成: 作为MCP服务器,可与支持MCP协议的AI代理和客户端无缝集成,将上述功能暴露为可调用的工具、可访问的资源和可使用的Prompt模板。
安装步骤
- Python环境准备: 确保您已安装Python (推荐 3.8+)。
- 基础安装: 打开终端或命令行,运行以下命令安装CRISP-T及其基础功能:
pip install crisp-t - 机器学习功能(推荐): 如果您需要使用K-Means、决策树、回归等机器学习功能,请安装额外的依赖:
pip install crisp-t[ml] - XGBoost功能(可选): 如果需要使用梯度提升树(XGBoost),请安装:
pip install crisp-t[xg]- Mac用户如果遇到XGBoost问题,可能需要安装'libomp':'brew install libomp'。
- 语义搜索功能(可选): 如果需要使用语义搜索功能,请安装'chromadb':
pip install chromadb
服务器配置
CRISP-T MCP服务器通过'crisp-mcp'命令启动,并通过Stdio协议与MCP客户端通信。以下是为不同MCP客户端配置MCP服务器的示例(请根据您的实际环境进行调整)。
-
Claude Desktop (MacOS): 编辑位于 '~/Library/Application Support/Claude/claude_desktop_config.json' 的配置文件,在 'mcpServers' 部分添加以下内容:
{ "mcpServers": { "crisp-t": { "command": "<python-path>crisp-mcp" } } }请将 '<python-path>' 替换为您的Python解释器路径(例如 '/usr/local/bin/python' 或 Anaconda 环境的Python路径)。
-
Claude Desktop (Windows): 编辑位于 '%APPDATA%\Claude\claude_desktop_config.json' 的配置文件,在 'mcpServers' 部分添加以下内容:
{ "mcpServers": { "crisp-t": { "command": "<python-path>crisp-mcp.exe" } } }请将 '<python-path>' 替换为您的Python解释器路径(例如 'C:\Python39\Scripts')。
-
其他MCP兼容客户端: 配置您的客户端通过标准输入/输出 (stdio) 运行 'crisp-mcp' 命令。通常,您需要提供一个JSON配置,指明服务器名称和启动命令。
基本使用方法
配置完成后,MCP客户端将能够发现并调用CRISP-T MCP服务器提供的工具、访问资源和使用Prompt模板。
- 启动服务器: 通常无需手动启动,MCP客户端会在需要时自动调用 'crisp-mcp' 命令来启动服务器。
- 加载数据: 在MCP客户端中,调用 'load_corpus' 工具来加载您的数据。
- 例如,加载一个现有语料库文件夹:调用 'load_corpus',参数 '{ "inp": "/path/to/your/corpus_folder" }'。
- 例如,从源目录读取数据:调用 'load_corpus',参数 '{ "source": "/path/to/your/data_directory" }'。
- 执行分析: 根据您的需求,调用相应的工具。
- 例如,进行情感分析:调用 'sentiment_analysis',参数 '{ "documents": true, "verbose": true }'。
- 例如,执行K-Means聚类:调用 'kmeans_clustering',参数 '{ "num_clusters": 5, "include": "age,gender,income" }'。
- 访问资源: MCP客户端可以请求访问语料库中的文档资源,例如 'corpus://document/doc1'。
- 使用Prompt: 调用 'analysis_workflow' 或 'triangulation_guide' Prompt模板,以获取分析指导或三角验证策略。
- 保存结果: 完成分析后,调用 'save_corpus' 工具保存当前语料库的状态(包含所有元数据和修改)。
信息
分类
AI与计算