← 返回首页

"OCR"标签的搜索结果

找到 14 个结果

MCP桌面录屏分析器

为MCP客户端提供macOS桌面录屏及分析能力,赋能大模型理解桌面活动。

Archive Agent

开源的语义文件追踪器,集成了OCR和AI搜索,通过MCP协议提供上下文和功能给LLM客户端。

RAG-MCP:RAG增强型PDF语义搜索服务器

RAG-MCP服务器是一个基于MCP协议实现的后端,专注于提供PDF文档的语义搜索和问答能力,支持OCR,可与任何MCP客户端集成,实现智能文档检索。

Google OCR MCP 服务器

一个基于 MCP 协议的服务器,提供 OCR 图像识别和简单的笔记管理功能,使用 Google Cloud Vision API 实现 OCR。

Mistral OCR MCP服务器

一个基于MCP协议的服务器,利用Mistral AI的OCR API提供本地文件和URL的文件OCR识别服务。

RapidOCR MCP 服务器

RapidOCR MCP 服务器是一个基于 Model Context Protocol 的应用后端,专注于提供图像 OCR (光学字符识别) 服务,支持通过内容或路径进行OCR识别。

MCP文档处理服务器

一个基于MCP协议实现的文档处理服务器,提供文档转换、表格提取、问答生成等工具,支持LLM应用进行文档理解和分析。

网页内容抓取

提供网页内容抓取功能的MCP服务器,支持浏览器自动化、OCR和多种内容提取方法。

MCP研究助手服务器

提供ArXiv论文搜索和文档内容提取MCP服务器,构建AI研究助手应用后端。

handwriting ocr mcp server

将Handwriting OCR API服务封装为MCP服务器,为LLM应用提供手写文字识别能力,支持文档上传、状态查询和结果获取。

PDF Extraction

该项目是一个MCP服务器,用于从本地PDF文件中提取内容,支持普通PDF和扫描件,提供PDF文本内容提取工具。

Image Recognition

该仓库实现了一个基于MCP协议的图像识别服务器,支持使用Anthropic Claude Vision和OpenAI GPT-4 Vision API来描述图像内容,并可选支持Tesseract OCR进行文本提取。

Screenshot

一个MCP服务器,提供屏幕截图和OCR文本识别工具,支持多种截图区域和输出格式,方便LLM应用获取屏幕内容。

JigsawStack Web Scrape

JigsawStack MCP服务器集成了OCR、翻译、图像生成、网页抓取和网络搜索等多种AI工具,通过标准MCP协议向客户端提供便捷的AI能力。