OCR 模型

共 2 篇网址

排序

发布更新浏览点赞

GLM-OCR

GLM-OCR 是智谱 AI（Zhipu AI）发布的开源轻量级多模态 OCR 模型，参数约 0.9B，基于 GLM-V 架构及 CogViT 视觉编码器，优化复杂文档解析、表格识别、公式识别与结构化输出。支持多种推理引擎部署与结构化结果输出。

01750

大模型开源工具与社区 # OCR 模型 # 多模态 OCR # 结构化输出

DeepSeek-OCR 2

DeepSeek-OCR 2 是 DeepSeek AI 发布的端到端 OCR（光学字符识别）视觉语言模型，基于 Visual Causal Flow 机制处理图像与文档输入，生成结构化文本输出（如 Markdown/JSON），用于复杂文档的逻辑顺序转录与布局感知识别。

01440

大模型最近收录AI # Markdown 输出 # OCR 模型 # 复杂布局识别

AI大学堂