项目简介
Houtini-Lite 是一个轻量级的MCP(Model Context Protocol)服务器,专为LM Studio设计,旨在优化本地大语言模型(LLM)的提示词交互。它通过智能动态令牌分配机制,自动根据模型上下文窗口和输入大小最大化输出令牌,同时提供灵活的提示词管理和执行能力。
主要功能点
- 🚀 智能动态令牌分配:根据您加载的LLM模型上下文窗口,自动调整输出令牌数量,防止溢出并最大化输出长度。
- 💡 智能上下文管理:利用模型上下文窗口的80%作为安全边际,确保处理大型输入时的稳定性。
- 🎯 自定义提示词执行:直接向本地LLM发送自定义提示词,支持附加上下文、调整生成温度等。
- 📊 文件化提示词:支持从文件加载提示词,并进行变量替换,方便管理和复用复杂的提示模板。
- 🔄 批量提示词处理:高效执行多个提示词请求,并可选择合并结果,提升工作效率。
- 💖 健康检查:验证与LM Studio的连接状态,显示已加载模型及其上下文能力,便于诊断。
安装步骤
-
准备环境:
- LM Studio (v0.3.0或更高版本):从 lmstudio.ai 下载。确保LM Studio已启动,本地服务器运行在默认端口1234,并已加载一个大语言模型(例如Qwen3 30B, LLaMA, DeepSeek等)。
- Node.js (v18或更高版本):从 nodejs.org 下载并安装。
- Claude Desktop (Anthropic官方客户端):从 claude.ai/download 下载并安装。Claude Desktop将作为您的MCP客户端。
-
安装Houtini-Lite:
- 打开命令行工具(如Terminal或CMD),执行以下命令进行全局安装:
npm install -g houtini-lite
- 打开命令行工具(如Terminal或CMD),执行以下命令进行全局安装:
-
配置Claude Desktop:
- 找到您的Claude Desktop配置文件 'claude_desktop_config.json'。
- Windows系统路径:%APPDATA%\Claude\claude_desktop_config.json
- macOS系统路径:~/Library/Application Support/Claude/Claude_desktop_config.json
- 编辑该文件,您需要在 'mcpServers' 键下添加一个名为 'houtini-lite' 的配置对象。该配置对象中需要包含 'command'、'args' 和 'env' 字段。
- 'command' (启动命令):指定为 'npx'。
- 'args' (命令参数):指定为 '["houtini-lite"]'。
- 'env' (环境变量):在此处设置 'LM_STUDIO_URL' 变量,指向您的LM Studio服务器WebSocket地址,例如 'ws://localhost:1234'。
- (请注意:此处仅为描述配置所需信息,具体的JSON格式请参照Claude Desktop客户端的官方文档或已有MCP服务器配置示例进行操作。)
- 找到您的Claude Desktop配置文件 'claude_desktop_config.json'。
-
重启Claude Desktop:完成配置后,请完全关闭并重新启动Claude Desktop,以便加载新的MCP服务器配置。
服务器配置(MCP客户端配置描述)
当您在MCP客户端(如Claude Desktop)中配置Houtini-Lite服务器时,您需要指定以下关键信息,以便客户端能够正确地启动和连接到Houtini-Lite:
- 服务器名称 ('server name'): 您可以为您的Houtini-Lite服务器指定一个名称,例如 'houtini-lite'。这是客户端用来引用此服务器的标识符。
- 启动命令 ('command'): 这是客户端将执行以启动Houtini-Lite服务器的命令。如果您通过 'npm install -g' 安装,此命令通常是 'npx'。
- 命令参数 ('args'): 这些是传递给启动命令的参数。对于全局安装的Houtini-Lite,这些参数通常是 '["houtini-lite"]'。
- 环境变量 ('env'): 您可以在此处设置服务器运行所需的环境变量。其中最重要的变量是 'LM_STUDIO_URL',用于告知Houtini-Lite您的LM Studio服务器运行在哪个地址,默认值为 'ws://localhost:1234'。
基本使用方法
在Claude Desktop等MCP客户端中,您可以通过以下方式调用Houtini-Lite提供的功能:
-
健康检查:
Use houtini-lite:health_check此命令用于检查Houtini-Lite与LM Studio的连接状态以及当前加载模型的能力信息。
-
简单提示词:
Use houtini-lite:custom_prompt with prompt: "解释量子计算的原理"Houtini-Lite将自动为您的提示词分配最大化的输出令牌。
-
带上下文的提示词:
Use houtini-lite:custom_prompt with: - prompt: "分析这段代码是否存在安全漏洞" - context: "[在此粘贴您的代码]"提供额外上下文信息以获得更精准的响应。
-
手动控制输出令牌:
Use houtini-lite:custom_prompt with: - prompt: "请给出一个简短的总结" - maxTokens: 200在需要特定输出长度时,您可以覆盖自动分配,手动设置最大输出令牌数。
-
批量处理提示词:
Use houtini-lite:batch_prompts with: - prompts: [ {"prompt": "第一个问题"}, {"prompt": "第二个问题", "maxTokens": 500} ] - combineResults: true高效地同时处理多个提示词请求,并选择将结果合并。
信息
分类
AI与计算