当前浏览中

频道AI 办公

浏览量25

▸ AI 办公 · 框架 / 工具链

FireRed-OCR 框架 / 工具链

小红书开源的结构化文档 OCR 模型。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · 中文/多语言

GitHub收藏 0

收录 2026年5月20日更新 2026年5月20日浏览 25

// 01 FireRed-OCR 是什么

FireRed-OCR 是小红书 FireRedTeam 推出的结构化 OCR 模型框架，主要面向复杂文档解析与结构化识别场景。官方资料显示，该模型基于 Qwen3-VL 架构训练，可处理表格、公式、阅读顺序与复杂排版文档，并针对传统 VLM 在 OCR 中容易出现的“结构幻觉”问题进行了优化。FireRed-OCR 采用多阶段训练与强化学习策略，在 OmniDocBench v1.5 等 benchmark 上取得较高成绩。项目已通过 GitHub、ModelScope 与 Hugging Face 开源。

核心功能

支持结构化文档 OCR
支持表格与公式识别
支持 Markdown 输出
支持复杂版面解析
已开源

使用场景

PDF 解析
文档数字化
表格识别
知识库构建
OCR 系统开发

适合谁用

适合 OCR 开发者与文档 AI 团队

// 02 核心功能

核心定位小红书开源的结构化文档 OCR 模型。
分类索引当前归档在最近收录AI，方便和同频工具横向比较。
能力标签关联标签包括 type:model、多模态、开源模型、OCR、小红书、文档解析。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合最近收录AI 定位和 type:model、多模态、开源模型标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

FireRed-OCR 是什么？

小红书开源的结构化文档 OCR 模型。

FireRed-OCR 适合哪些场景？

可优先参考它所属的最近收录AI 分类，以及 type:model、多模态、开源模型、OCR、小红书等标签。

FireRed-OCR 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

FireRed-OCR 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/6808.html 官网或下载入口https://github.com/FireRedTeam/FireRed-OCR 分类与标签体系最近收录AI、type:model、多模态、开源模型、OCR

Seedream 5.0 Pro

字节 Seed 的多模态图像生成模型：高密度信息呈现 + 空间标记/线稿交互精准编辑 + 图层拆分，十余种语言，国内可用。

AI 图像AI 工具

Hy3

腾讯混元开源 295B/21B MoE 大模型：同尺寸领先的推理+Agent 能力、高性价比，支持 vLLM/SGLang。

AI 大模型 / 对话AI 工具

Leanstral 1.5

Mistral 开源：Lean 4 形式化定理证明 + 代码验证模型，119B/6B MoE，Apache-2.0，miniF2F 满分。

AI 编程AI 工具

Nemotron-Labs-TwoTower

NVIDIA 开源大模型系列，探索"预训练自回归 + 扩散语言建模"，代表模型 30B-A3B（MoE）。

AI 大模型 / 对话AI 工具

FireRed-OCR 框架 / 工具链

// 01 FireRed-OCR 是什么

核心功能

使用场景

适合谁用

// 02 核心 功能

// 03 使用 场景

// 04 常见 问题

// 05 资料 来源

// 02 核心功能

// 03 使用场景

// 04 常见问题

// 05 资料来源