// 01 FireRed-OCR 是什么
FireRed-OCR 是小红书 FireRedTeam 推出的结构化 OCR 模型框架,主要面向复杂文档解析与结构化识别场景。官方资料显示,该模型基于 Qwen3-VL 架构训练,可处理表格、公式、阅读顺序与复杂排版文档,并针对传统 VLM 在 OCR 中容易出现的“结构幻觉”问题进行了优化。FireRed-OCR 采用多阶段训练与强化学习策略,在 OmniDocBench v1.5 等 benchmark 上取得较高成绩。项目已通过 GitHub、ModelScope 与 Hugging Face 开源。
核心功能
- 支持结构化文档 OCR
- 支持表格与公式识别
- 支持 Markdown 输出
- 支持复杂版面解析
- 已开源
使用场景
- PDF 解析
- 文档数字化
- 表格识别
- 知识库构建
- OCR 系统开发
适合谁用
适合 OCR 开发者与文档 AI 团队
常见问题
**Q: FireRed-OCR 是什么?**
FireRed-OCR 是小红书推出的结构化文档 OCR 模型。
**Q: FireRed-OCR 怎么用?**
开发者可通过 GitHub、ModelScope 与 Hugging Face 部署模型。
**Q: FireRed-OCR 收费吗?**
模型与代码已开源,可免费用于研究与开发。
资料来源
- https://github.com/FireRedTeam/FireRed-OCR
- https://www.modelscope.cn/models/FireRedTeam/FireRed-OCR
- https://arxiv.org/abs/2603.01840
// 02 核心 功能
- 核心定位小红书开源的结构化文档 OCR 模型。
- 分类索引当前归档在 最近收录AI,方便和同频工具横向比较。
- 能力标签关联标签包括 type:model、多模态、小红书、OCR、开源模型、文档解析。
- 使用入口已记录可访问入口,可通过本页主按钮跳转。
// 03 使用 场景
- 快速判断是否适合当前任务结合 最近收录AI 定位和 type:model、多模态、小红书 标签,先判断它是否匹配你的工作流。
- 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
- 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。
// 04 常见 问题
FireRed-OCR 是什么?
小红书开源的结构化文档 OCR 模型。
FireRed-OCR 适合哪些场景?
可优先参考它所属的 最近收录AI 分类,以及 type:model、多模态、小红书、OCR、开源模型 等标签。
FireRed-OCR 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
FireRed-OCR 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。
