"视觉理解" 标签

3 个结果

标签搜索结果

AI与计算

Luma 多模型视觉理解服务器

为不支持图片理解的AI助手提供视觉分析能力的MCP服务器，支持智谱、硅基流动、阿里云和火山方舟等多个视觉模型

图像分析 OCR识别视觉理解代码截图

AI与计算

Florence 2

Florence-2 MCP服务器是一个应用后端，它利用Florence-2模型为LLM客户端提供图像处理能力，包括光学字符识别（OCR）和图像描述生成，支持本地和远程图片及PDF文件。

图像处理光学字符识别图像描述 Florence-2

AI与计算

Moondream

Moondream MCP Server是一个基于Model Context Protocol的应用后端，利用Moondream视觉模型为LLM客户端提供图像分析能力，包括图像描述、物体检测和视觉问答等功能。

图像分析视觉理解图像描述物体检测