使用说明

项目简介

image-mcp-server 是一个基于 Model Context Protocol (MCP) 构建的服务器,旨在为大型语言模型 (LLM) 应用提供图像分析功能。该服务器接收图像 URL 作为输入,使用 OpenAI 的 GPT-4-turbo 模型分析图像内容,并将分析结果以文本形式返回给 MCP 客户端。通过此服务器,LLM 应用可以轻松地扩展其视觉理解能力,实现更丰富的多模态交互。

主要功能点

  • 图像URL分析: 接受图像的网络URL作为输入,支持对互联网上的图片进行内容分析。
  • GPT-4-turbo驱动: 采用先进的 GPT-4-turbo 模型进行图像内容理解,保证分析的准确性和深度。
  • 内容描述: 返回对图像内容的详细文本描述,帮助 LLM 理解图像场景和元素。
  • URL有效性检查: 在分析前验证图像URL的有效性,确保URL可访问且指向有效的图像资源。
  • 易于集成: 遵循 MCP 协议标准,可以方便地集成到任何支持 MCP 协议的 LLM 客户端,如 Cline, Claude Desktop App 等。

安装步骤

  1. 克隆仓库

    git clone https://github.com/champierre/image-mcp-server.git
    cd image-mcp-server
  2. 安装依赖

    确保已安装 Node.js 和 npm,然后运行:

    npm install
  3. 编译 TypeScript

    npm run build

服务器配置

要将 image-mcp-server 配置为 MCP 服务器供客户端使用,您需要在 MCP 客户端的配置文件中添加服务器信息。以下分别以 VSCode Claude 扩展和 Claude Desktop App 为例,展示如何配置。

注意:以下配置中的 '/path/to/image-mcp-server/dist/index.js' 需要替换为 'image-mcp-server' 仓库 'dist/index.js' 文件的实际绝对路径。'your_openai_api_key' 需要替换为您自己的 OpenAI API 密钥。

VSCode Claude 扩展配置 (cline_mcp_settings.json)

在 Cline 扩展的配置文件 'cline_mcp_settings.json' 中,添加以下 'mcpServers' 配置:

{
  "mcpServers": {
    "image-analysis": {  // 服务器名称,客户端用此名称引用
      "command": "node", // 启动服务器的命令,这里使用 node.js 运行时
      "args": ["/path/to/image-mcp-server/dist/index.js"], // 启动命令的参数,指向服务器入口文件
      "env": { // 环境变量
        "OPENAI_API_KEY": "your_openai_api_key" // OpenAI API 密钥
      },
      "disabled": false, // 是否禁用此服务器,false 表示启用
      "autoApprove": [] // 自动批准的工具列表,这里为空表示不自动批准任何工具
    }
  }
}

Claude Desktop App 配置 (claude_desktop_config.json)

在 Claude Desktop App 的配置文件 'claude_desktop_config.json' 中,添加相同的 'mcpServers' 配置:

{
  "mcpServers": {
    "image-analysis": {
      "command": "node",
      "args": ["/path/to/image-mcp-server/dist/index.js"],
      "env": {
        "OPENAI_API_KEY": "your_openai_api_key"
      },
      "disabled": false,
      "autoApprove": []
    }
  }
}

基本使用方法

完成 MCP 服务器配置后,在支持 MCP 协议的 LLM 客户端中,您可以使用 'analyze_image' 工具来分析图像。例如,在 Claude 客户端中,您可以输入类似以下的指令:

analyze_image 工具,请分析以下图片URL: https://example.com/image.jpg

或者更自然的语言指令:

分析一下这个图片链接的内容:https://example.com/image.jpg

客户端会将指令发送到 image-mcp-server,服务器会调用 GPT-4-turbo 分析图片内容,并将分析结果返回给客户端。

注意: 请确保您已经设置了正确的 'OPENAI_API_KEY' 环境变量,并且网络连接正常,以便服务器可以访问 OpenAI API 和目标图像 URL。

信息

分类

AI与计算