使用说明
项目简介
image-mcp-server 是一个基于 Model Context Protocol (MCP) 构建的服务器,旨在为大型语言模型 (LLM) 应用提供图像分析功能。该服务器接收图像 URL 作为输入,使用 OpenAI 的 GPT-4-turbo 模型分析图像内容,并将分析结果以文本形式返回给 MCP 客户端。通过此服务器,LLM 应用可以轻松地扩展其视觉理解能力,实现更丰富的多模态交互。
主要功能点
- 图像URL分析: 接受图像的网络URL作为输入,支持对互联网上的图片进行内容分析。
- GPT-4-turbo驱动: 采用先进的 GPT-4-turbo 模型进行图像内容理解,保证分析的准确性和深度。
- 内容描述: 返回对图像内容的详细文本描述,帮助 LLM 理解图像场景和元素。
- URL有效性检查: 在分析前验证图像URL的有效性,确保URL可访问且指向有效的图像资源。
- 易于集成: 遵循 MCP 协议标准,可以方便地集成到任何支持 MCP 协议的 LLM 客户端,如 Cline, Claude Desktop App 等。
安装步骤
-
克隆仓库
git clone https://github.com/champierre/image-mcp-server.git cd image-mcp-server -
安装依赖
确保已安装 Node.js 和 npm,然后运行:
npm install -
编译 TypeScript
npm run build
服务器配置
要将 image-mcp-server 配置为 MCP 服务器供客户端使用,您需要在 MCP 客户端的配置文件中添加服务器信息。以下分别以 VSCode Claude 扩展和 Claude Desktop App 为例,展示如何配置。
注意:以下配置中的 '/path/to/image-mcp-server/dist/index.js' 需要替换为 'image-mcp-server' 仓库 'dist/index.js' 文件的实际绝对路径。'your_openai_api_key' 需要替换为您自己的 OpenAI API 密钥。
VSCode Claude 扩展配置 (cline_mcp_settings.json)
在 Cline 扩展的配置文件 'cline_mcp_settings.json' 中,添加以下 'mcpServers' 配置:
{ "mcpServers": { "image-analysis": { // 服务器名称,客户端用此名称引用 "command": "node", // 启动服务器的命令,这里使用 node.js 运行时 "args": ["/path/to/image-mcp-server/dist/index.js"], // 启动命令的参数,指向服务器入口文件 "env": { // 环境变量 "OPENAI_API_KEY": "your_openai_api_key" // OpenAI API 密钥 }, "disabled": false, // 是否禁用此服务器,false 表示启用 "autoApprove": [] // 自动批准的工具列表,这里为空表示不自动批准任何工具 } } }
Claude Desktop App 配置 (claude_desktop_config.json)
在 Claude Desktop App 的配置文件 'claude_desktop_config.json' 中,添加相同的 'mcpServers' 配置:
{ "mcpServers": { "image-analysis": { "command": "node", "args": ["/path/to/image-mcp-server/dist/index.js"], "env": { "OPENAI_API_KEY": "your_openai_api_key" }, "disabled": false, "autoApprove": [] } } }
基本使用方法
完成 MCP 服务器配置后,在支持 MCP 协议的 LLM 客户端中,您可以使用 'analyze_image' 工具来分析图像。例如,在 Claude 客户端中,您可以输入类似以下的指令:
analyze_image 工具,请分析以下图片URL: https://example.com/image.jpg
或者更自然的语言指令:
分析一下这个图片链接的内容:https://example.com/image.jpg
客户端会将指令发送到 image-mcp-server,服务器会调用 GPT-4-turbo 分析图片内容,并将分析结果返回给客户端。
注意: 请确保您已经设置了正确的 'OPENAI_API_KEY' 环境变量,并且网络连接正常,以便服务器可以访问 OpenAI API 和目标图像 URL。
信息
分类
AI与计算