"OCR" 标签

19 个结果

标签搜索结果

AI与计算

NanoPDF MCP Server

基于 Model Context Protocol (MCP) 的本地化服务器实现，提供对 PDF 的隐私友好(ai驱动)编辑、预览与版本管理，并通过 Gemini Pro 模型进行页面内容生成与修改，支持 Claude Desktop 等 MCP 客户端的上下文服务与工具调用。

本地AI PDF编辑 OCR 版本控制

AI与计算

mcp-local-rag

本地 MCP 服务器实现，用于面向大语言模型的RAG场景，提供文档资源管理、外部工具执行与基于向量检索的上下文服务，并可通过 OCR 将 PDFs 转换为可检索的文本内容。

向量检索文档索引 OCR 向量数据库

AI与计算

Readur MCP 服务器

基于 Model Context Protocol (MCP) 的后端服务，将 Readur 的文档管理与 OCR API 以工具形式暴露给 AI 助手，通过 JSON-RPC 提供资源读取、工具调用和提示渲染等 MCP 功能。

文档管理 OCR 全文检索标签管理

桌面与硬件

ScreenshotMCP

ScreenshotMCP是一个智能截图管理工具，它通过本地MCP服务器将您的截图转换为可搜索、可分类的知识库，并允许AI工具通过工具调用进行交互。

截图管理智能搜索 OCR LLM应用

AI与计算

Docling

Docling是一个功能强大的文档处理库，能解析、理解多种文档格式，并通过MCP服务器提供上下文信息和AI工具服务。

文档处理文档智能 OCR ASR

桌面与硬件

MCP桌面录屏分析器

为MCP客户端提供macOS桌面录屏及分析能力，赋能大模型理解桌面活动。

桌面录屏屏幕分析 OCR 大模型辅助

数据库与文件

Archive Agent

开源的语义文件追踪器，集成了OCR和AI搜索，通过MCP协议提供上下文和功能给LLM客户端。

语义搜索 RAG 文件索引 OCR

AI与计算

RAG-MCP：RAG增强型PDF语义搜索服务器

RAG-MCP服务器是一个基于MCP协议实现的后端，专注于提供PDF文档的语义搜索和问答能力，支持OCR，可与任何MCP客户端集成，实现智能文档检索。

PDF语义搜索 RAG 文档问答知识库

AI与计算

Google OCR MCP 服务器

一个基于 MCP 协议的服务器，提供 OCR 图像识别和简单的笔记管理功能，使用 Google Cloud Vision API 实现 OCR。

OCR 图像识别 Google Clo…笔记管理

AI与计算

Mistral OCR MCP服务器

一个基于MCP协议的服务器，利用Mistral AI的OCR API提供本地文件和URL的文件OCR识别服务。

OCR 光学字符识别 Mistral AI 文件处理

AI与计算

RapidOCR MCP 服务器

RapidOCR MCP 服务器是一个基于 Model Context Protocol 的应用后端，专注于提供图像 OCR (光学字符识别) 服务，支持通过内容或路径进行OCR识别。

OCR 图像识别文字提取 RapidOCR

AI与计算

MCP文档处理服务器

一个基于MCP协议实现的文档处理服务器，提供文档转换、表格提取、问答生成等工具，支持LLM应用进行文档理解和分析。

文档处理文档转换表格提取问答生成

网页与API

网页内容抓取

提供网页内容抓取功能的MCP服务器，支持浏览器自动化、OCR和多种内容提取方法。

网页抓取浏览器自动化 OCR 内容提取

网页与API

MCP研究助手服务器

提供ArXiv论文搜索和文档内容提取MCP服务器，构建AI研究助手应用后端。

科学论文搜索文档内容提取研究助手 arXiv

AI与计算

handwriting ocr mcp server

将Handwriting OCR API服务封装为MCP服务器，为LLM应用提供手写文字识别能力，支持文档上传、状态查询和结果获取。

手写文字识别 OCR 文档处理 API

生产力应用

PDF Extraction

该项目是一个MCP服务器，用于从本地PDF文件中提取内容，支持普通PDF和扫描件，提供PDF文本内容提取工具。

PDF内容提取 OCR 文档处理文本提取

AI与计算

Image Recognition

该仓库实现了一个基于MCP协议的图像识别服务器，支持使用Anthropic Claude Vision和OpenAI GPT-4 Vision API来描述图像内容，并可选支持Tesseract OCR进行文本提取。

图像识别视觉API 图像描述 OCR

桌面与硬件

Screenshot

一个MCP服务器，提供屏幕截图和OCR文本识别工具，支持多种截图区域和输出格式，方便LLM应用获取屏幕内容。

屏幕截图 OCR 文本识别自动化

AI与计算

JigsawStack Web Scrape

JigsawStack MCP服务器集成了OCR、翻译、图像生成、网页抓取和网络搜索等多种AI工具，通过标准MCP协议向客户端提供便捷的AI能力。

AI工具 OCR 文本翻译图像生成