FireRed-OCR
T-03框架 长尾 OPEN-SOURCE

FireRed-OCR

小红书开源的结构化文档 OCR 模型。

01

FireRed-OCR 是什么

FireRed-OCR小红书 FireRedTeam 推出的结构化 OCR 模型框架,主要面向复杂文档解析与结构化识别场景。官方资料显示,该模型基于 Qwen3-VL 架构训练,可处理表格、公式、阅读顺序与复杂排版文档,并针对传统 VLM 在 OCR 中容易出现的“结构幻觉”问题进行了优化。FireRed-OCR 采用多阶段训练与强化学习策略,在 OmniDocBench v1.5 等 benchmark 上取得较高成绩。项目已通过 GitHub、ModelScope 与 Hugging Face 开源。

核心功能

  • 支持结构化文档 OCR
  • 支持表格与公式识别
  • 支持 Markdown 输出
  • 支持复杂版面解析
  • 已开源

使用场景

  • PDF 解析
  • 文档数字化
  • 表格识别
  • 知识库构建
  • OCR 系统开发

适合谁用

适合 OCR 开发者与文档 AI 团队

常见问题

**Q: FireRed-OCR 是什么?**

FireRed-OCR 是小红书推出的结构化文档 OCR 模型。

**Q: FireRed-OCR 怎么用?**

开发者可通过 GitHub、ModelScope 与 Hugging Face 部署模型。

**Q: FireRed-OCR 收费吗?**

模型与代码已开源,可免费用于研究与开发。

资料来源

  • https://github.com/FireRedTeam/FireRed-OCR
  • https://www.modelscope.cn/models/FireRedTeam/FireRed-OCR
  • https://arxiv.org/abs/2603.01840
AI大学堂