项目简介

OpenRouter 多模态 MCP 服务器是一个基于 Model Context Protocol (MCP) 构建的应用后端,旨在桥接 MCP 客户端(如 Claude Desktop 和 Cursor IDE)与 OpenRouter.ai 的多模态能力。它允许这些客户端利用 OpenRouter 访问支持文本和图像输入的强大 AI 模型,从而实现更丰富的交互体验,例如图像分析、多模态对话等。

主要功能点

  • 多模态支持: 支持处理文本和图像输入,充分利用兼容模型的多模态能力。
  • 模型发现: 可以搜索和筛选 OpenRouter.ai 上可用的模型,方便用户选择合适的模型。
  • 温度控制: 允许用户调整生成文本的随机性,以控制输出风格。
  • 便捷集成: 可以与任何 MCP 客户端轻松集成,例如 Claude Desktop, Cursor IDE 等。
  • 上下文管理: 自动处理过长的对话历史,确保符合模型的上下文窗口限制。
  • 多图分析: 支持一次性分析多张图片,并以 Markdown 格式返回结构化的分析结果。

安装步骤

本 MCP 服务器提供了多种安装方式,您可以根据自己的需求选择:

1. NPM 全局安装 (推荐开发者使用)

确保您已安装 Node.js 和 npm。

npm install -g @stabgan/openrouterai-multimodal

2. Docker 安装 (推荐生产环境和简化部署)

确保您已安装 Docker。

docker pull stabgandocker/openrouterai-multimodal

3. UV 安装 (新兴的包管理器)

如果您使用 uv 包管理器:

uvx @stabgan/openrouterai-multimodal

4. Smithery 安装 (面向 Smithery 平台用户)

如果您使用 Smithery 平台,可以直接在 Smithery.ai 上搜索 "OpenRouter Multimodal" 并安装。

服务器配置

MCP 客户端需要配置才能连接到本 MCP 服务器。以下是针对不同 MCP 客户端的配置示例,您需要根据您的安装方式选择相应的命令。

重要提示: 您需要拥有 OpenRouter.ai 的 API 密钥,并将其配置到 MCP 服务器的环境变量中。

针对 Cursor IDE 的 MCP 服务器配置 (JSON 格式):

{
  "servers": [
    {
      "name": "OpenRouter Multimodal",  // MCP 服务器名称,自定义
      "command": "npx",               // 启动命令,根据安装方式选择
      "args": [                        // 命令参数,根据安装方式和需求调整
        "@stabgan/openrouterai-multimodal" //  对于 NPM 安装,直接指定包名
      ],
      "env": {                         // 环境变量配置
        "OPENROUTER_API_KEY": "your_api_key", // 您的 OpenRouter API 密钥,必填
        "OPENROUTER_DEFAULT_MODEL": "google/gemini-2.5-pro-exp-03-25:free" // 可选,默认使用的模型
      }
    }
  ]
}

注意:

  • 'command' 和 'args': 请根据您的实际安装方式进行调整。

    • NPM 安装: 'command' 为 'npx','args' 为 '["@stabgan/openrouterai-multimodal"]'
    • Docker 安装: 'command' 为 'docker','args' 较为复杂,请参考 README 文档或使用 'docker run -i --rm stabgandocker/openrouterai-multimodal' 并复制其启动命令。
    • UV 安装: 'command' 为 'uvx','args' 为 '["@stabgan/openrouterai-multimodal"]'
  • 'OPENROUTER_API_KEY': 务必替换 '"your_api_key"' 为您真实的 OpenRouter API 密钥。 这是服务器连接 OpenRouter.ai 的凭证。

  • 'OPENROUTER_DEFAULT_MODEL': 可选配置,如果您希望为会话设置默认使用的模型,可以在这里指定。

针对 Claude Desktop 的 MCP 服务器配置 (JSON 格式,添加到 Claude Desktop 的配置文件中):

{
  "mcpServers": {
    "OpenRouter Multimodal": {      // MCP 服务器名称,自定义
      "command": "npx",           // 启动命令,根据安装方式选择
      "args": ["-y", "@stabgan/openrouterai-multimodal"], // 命令参数,同 Cursor IDE
      "env": {                     // 环境变量配置,同 Cursor IDE
        "OPENROUTER_API_KEY": "your_api_key",
        "OPENROUTER_DEFAULT_MODEL": "google/gemini-2.5-pro-exp-03-25:free"
      }
    }
  }
}

同样注意: 'command', 'args', 'OPENROUTER_API_KEY' 和 'OPENROUTER_DEFAULT_MODEL' 的配置,请参考 Cursor IDE 的说明进行调整。

基本使用方法

配置完成后,在 MCP 客户端中选择 "OpenRouter Multimodal" 服务器,即可开始使用。

您可以使用以下示例进行基本操作:

  • 文本生成: 直接输入文本提示,例如 "写一首关于夏天的诗歌"。
  • 图像分析: 在提示中附加图片 URL 或本地图片(部分客户端支持),例如 "这张图片里有什么?[图片URL]"。
  • 多图分析: 使用 'multi_image_analysis' 工具,并提供多张图片 URL 和分析提示。 例如,在 Claude 中可以使用 '工具: multi_image_analysis' 并在后续对话中提供工具所需的参数。

具体工具的使用方法和参数,请参考仓库 README 文档中 "Available Tools" 章节的详细说明。

信息

分类

AI与计算