项目简介

Houtini-Lite 是一个轻量级的MCP(Model Context Protocol)服务器,专为LM Studio设计,旨在优化本地大语言模型(LLM)的提示词交互。它通过智能动态令牌分配机制,自动根据模型上下文窗口和输入大小最大化输出令牌,同时提供灵活的提示词管理和执行能力。

主要功能点

  • 🚀 智能动态令牌分配:根据您加载的LLM模型上下文窗口,自动调整输出令牌数量,防止溢出并最大化输出长度。
  • 💡 智能上下文管理:利用模型上下文窗口的80%作为安全边际,确保处理大型输入时的稳定性。
  • 🎯 自定义提示词执行:直接向本地LLM发送自定义提示词,支持附加上下文、调整生成温度等。
  • 📊 文件化提示词:支持从文件加载提示词,并进行变量替换,方便管理和复用复杂的提示模板。
  • 🔄 批量提示词处理:高效执行多个提示词请求,并可选择合并结果,提升工作效率。
  • 💖 健康检查:验证与LM Studio的连接状态,显示已加载模型及其上下文能力,便于诊断。

安装步骤

  1. 准备环境

    • LM Studio (v0.3.0或更高版本):从 lmstudio.ai 下载。确保LM Studio已启动,本地服务器运行在默认端口1234,并已加载一个大语言模型(例如Qwen3 30B, LLaMA, DeepSeek等)。
    • Node.js (v18或更高版本):从 nodejs.org 下载并安装。
    • Claude Desktop (Anthropic官方客户端):从 claude.ai/download 下载并安装。Claude Desktop将作为您的MCP客户端。
  2. 安装Houtini-Lite

    • 打开命令行工具(如Terminal或CMD),执行以下命令进行全局安装:
      npm install -g houtini-lite
  3. 配置Claude Desktop

    • 找到您的Claude Desktop配置文件 'claude_desktop_config.json'。
      • Windows系统路径:%APPDATA%\Claude\claude_desktop_config.json
      • macOS系统路径:~/Library/Application Support/Claude/Claude_desktop_config.json
    • 编辑该文件,您需要在 'mcpServers' 键下添加一个名为 'houtini-lite' 的配置对象。该配置对象中需要包含 'command'、'args' 和 'env' 字段。
      • 'command' (启动命令):指定为 'npx'。
      • 'args' (命令参数):指定为 '["houtini-lite"]'。
      • 'env' (环境变量):在此处设置 'LM_STUDIO_URL' 变量,指向您的LM Studio服务器WebSocket地址,例如 'ws://localhost:1234'。
      • (请注意:此处仅为描述配置所需信息,具体的JSON格式请参照Claude Desktop客户端的官方文档或已有MCP服务器配置示例进行操作。)
  4. 重启Claude Desktop:完成配置后,请完全关闭并重新启动Claude Desktop,以便加载新的MCP服务器配置。

服务器配置(MCP客户端配置描述)

当您在MCP客户端(如Claude Desktop)中配置Houtini-Lite服务器时,您需要指定以下关键信息,以便客户端能够正确地启动和连接到Houtini-Lite:

  • 服务器名称 ('server name'): 您可以为您的Houtini-Lite服务器指定一个名称,例如 'houtini-lite'。这是客户端用来引用此服务器的标识符。
  • 启动命令 ('command'): 这是客户端将执行以启动Houtini-Lite服务器的命令。如果您通过 'npm install -g' 安装,此命令通常是 'npx'。
  • 命令参数 ('args'): 这些是传递给启动命令的参数。对于全局安装的Houtini-Lite,这些参数通常是 '["houtini-lite"]'。
  • 环境变量 ('env'): 您可以在此处设置服务器运行所需的环境变量。其中最重要的变量是 'LM_STUDIO_URL',用于告知Houtini-Lite您的LM Studio服务器运行在哪个地址,默认值为 'ws://localhost:1234'。

基本使用方法

在Claude Desktop等MCP客户端中,您可以通过以下方式调用Houtini-Lite提供的功能:

  • 健康检查

    Use houtini-lite:health_check

    此命令用于检查Houtini-Lite与LM Studio的连接状态以及当前加载模型的能力信息。

  • 简单提示词

    Use houtini-lite:custom_prompt with prompt: "解释量子计算的原理"

    Houtini-Lite将自动为您的提示词分配最大化的输出令牌。

  • 带上下文的提示词

    Use houtini-lite:custom_prompt with:
    - prompt: "分析这段代码是否存在安全漏洞"
    - context: "[在此粘贴您的代码]"

    提供额外上下文信息以获得更精准的响应。

  • 手动控制输出令牌

    Use houtini-lite:custom_prompt with:
    - prompt: "请给出一个简短的总结"
    - maxTokens: 200

    在需要特定输出长度时,您可以覆盖自动分配,手动设置最大输出令牌数。

  • 批量处理提示词

    Use houtini-lite:batch_prompts with:
    - prompts: [
        {"prompt": "第一个问题"},
        {"prompt": "第二个问题", "maxTokens": 500}
      ]
    - combineResults: true

    高效地同时处理多个提示词请求,并选择将结果合并。

信息

分类

AI与计算