← 返回首页

"视觉理解"标签的搜索结果

找到 3 个结果

Luma 多模型视觉理解服务器

为不支持图片理解的AI助手提供视觉分析能力的MCP服务器,支持智谱、硅基流动、阿里云和火山方舟等多个视觉模型

Florence 2

Florence-2 MCP服务器是一个应用后端,它利用Florence-2模型为LLM客户端提供图像处理能力,包括光学字符识别(OCR)和图像描述生成,支持本地和远程图片及PDF文件。

Moondream

Moondream MCP Server是一个基于Model Context Protocol的应用后端,利用Moondream视觉模型为LLM客户端提供图像分析能力,包括图像描述、物体检测和视觉问答等功能。