项目简介
OpenRouter 多模态 MCP 服务器是一个基于 Model Context Protocol (MCP) 构建的应用后端,旨在桥接 MCP 客户端(如 Claude Desktop 和 Cursor IDE)与 OpenRouter.ai 的多模态能力。它允许这些客户端利用 OpenRouter 访问支持文本和图像输入的强大 AI 模型,从而实现更丰富的交互体验,例如图像分析、多模态对话等。
主要功能点
- 多模态支持: 支持处理文本和图像输入,充分利用兼容模型的多模态能力。
- 模型发现: 可以搜索和筛选 OpenRouter.ai 上可用的模型,方便用户选择合适的模型。
- 温度控制: 允许用户调整生成文本的随机性,以控制输出风格。
- 便捷集成: 可以与任何 MCP 客户端轻松集成,例如 Claude Desktop, Cursor IDE 等。
- 上下文管理: 自动处理过长的对话历史,确保符合模型的上下文窗口限制。
- 多图分析: 支持一次性分析多张图片,并以 Markdown 格式返回结构化的分析结果。
安装步骤
本 MCP 服务器提供了多种安装方式,您可以根据自己的需求选择:
1. NPM 全局安装 (推荐开发者使用)
确保您已安装 Node.js 和 npm。
npm install -g @stabgan/openrouterai-multimodal
2. Docker 安装 (推荐生产环境和简化部署)
确保您已安装 Docker。
docker pull stabgandocker/openrouterai-multimodal
3. UV 安装 (新兴的包管理器)
如果您使用 uv 包管理器:
uvx @stabgan/openrouterai-multimodal
4. Smithery 安装 (面向 Smithery 平台用户)
如果您使用 Smithery 平台,可以直接在 Smithery.ai 上搜索 "OpenRouter Multimodal" 并安装。
服务器配置
MCP 客户端需要配置才能连接到本 MCP 服务器。以下是针对不同 MCP 客户端的配置示例,您需要根据您的安装方式选择相应的命令。
重要提示: 您需要拥有 OpenRouter.ai 的 API 密钥,并将其配置到 MCP 服务器的环境变量中。
针对 Cursor IDE 的 MCP 服务器配置 (JSON 格式):
{ "servers": [ { "name": "OpenRouter Multimodal", // MCP 服务器名称,自定义 "command": "npx", // 启动命令,根据安装方式选择 "args": [ // 命令参数,根据安装方式和需求调整 "@stabgan/openrouterai-multimodal" // 对于 NPM 安装,直接指定包名 ], "env": { // 环境变量配置 "OPENROUTER_API_KEY": "your_api_key", // 您的 OpenRouter API 密钥,必填 "OPENROUTER_DEFAULT_MODEL": "google/gemini-2.5-pro-exp-03-25:free" // 可选,默认使用的模型 } } ] }
注意:
-
'command' 和 'args': 请根据您的实际安装方式进行调整。
- NPM 安装: 'command' 为 'npx','args' 为 '["@stabgan/openrouterai-multimodal"]'
- Docker 安装: 'command' 为 'docker','args' 较为复杂,请参考 README 文档或使用 'docker run -i --rm stabgandocker/openrouterai-multimodal' 并复制其启动命令。
- UV 安装: 'command' 为 'uvx','args' 为 '["@stabgan/openrouterai-multimodal"]'
-
'OPENROUTER_API_KEY': 务必替换 '"your_api_key"' 为您真实的 OpenRouter API 密钥。 这是服务器连接 OpenRouter.ai 的凭证。
-
'OPENROUTER_DEFAULT_MODEL': 可选配置,如果您希望为会话设置默认使用的模型,可以在这里指定。
针对 Claude Desktop 的 MCP 服务器配置 (JSON 格式,添加到 Claude Desktop 的配置文件中):
{ "mcpServers": { "OpenRouter Multimodal": { // MCP 服务器名称,自定义 "command": "npx", // 启动命令,根据安装方式选择 "args": ["-y", "@stabgan/openrouterai-multimodal"], // 命令参数,同 Cursor IDE "env": { // 环境变量配置,同 Cursor IDE "OPENROUTER_API_KEY": "your_api_key", "OPENROUTER_DEFAULT_MODEL": "google/gemini-2.5-pro-exp-03-25:free" } } } }
同样注意: 'command', 'args', 'OPENROUTER_API_KEY' 和 'OPENROUTER_DEFAULT_MODEL' 的配置,请参考 Cursor IDE 的说明进行调整。
基本使用方法
配置完成后,在 MCP 客户端中选择 "OpenRouter Multimodal" 服务器,即可开始使用。
您可以使用以下示例进行基本操作:
- 文本生成: 直接输入文本提示,例如 "写一首关于夏天的诗歌"。
- 图像分析: 在提示中附加图片 URL 或本地图片(部分客户端支持),例如 "这张图片里有什么?[图片URL]"。
- 多图分析: 使用 'multi_image_analysis' 工具,并提供多张图片 URL 和分析提示。 例如,在 Claude 中可以使用 '工具: multi_image_analysis' 并在后续对话中提供工具所需的参数。
具体工具的使用方法和参数,请参考仓库 README 文档中 "Available Tools" 章节的详细说明。
信息
分类
AI与计算