- STARS⭐ 278
- FORKS12
- LICENSEApache-2.0
- BYFireRedTeam
- LANGPython
- PRICINGUNKNOWN
FireRed-OCR 是什么
FireRed-OCR 是小红书 FireRedTeam 推出的结构化 OCR 模型框架,主要面向复杂文档解析与结构化识别场景。官方资料显示,该模型基于 Qwen3-VL 架构训练,可处理表格、公式、阅读顺序与复杂排版文档,并针对传统 VLM 在 OCR 中容易出现的“结构幻觉”问题进行了优化。FireRed-OCR 采用多阶段训练与强化学习策略,在 OmniDocBench v1.5 等 benchmark 上取得较高成绩。项目已通过 GitHub、ModelScope 与 Hugging Face 开源。
核心功能
- 支持结构化文档 OCR
- 支持表格与公式识别
- 支持 Markdown 输出
- 支持复杂版面解析
- 已开源
使用场景
- PDF 解析
- 文档数字化
- 表格识别
- 知识库构建
- OCR 系统开发
适合谁用
适合 OCR 开发者与文档 AI 团队
常见问题
**Q: FireRed-OCR 是什么?**
FireRed-OCR 是小红书推出的结构化文档 OCR 模型。
**Q: FireRed-OCR 怎么用?**
开发者可通过 GitHub、ModelScope 与 Hugging Face 部署模型。
**Q: FireRed-OCR 收费吗?**
模型与代码已开源,可免费用于研究与开发。
资料来源
- https://github.com/FireRedTeam/FireRed-OCR
- https://www.modelscope.cn/models/FireRedTeam/FireRed-OCR
- https://arxiv.org/abs/2603.01840
