AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI 图像

VIEWS352

▸ AI 图像 · SITES

LinGen SITES

LinGen 是一款创新的线性复杂度文本生成视频框架，利用 MATE 模块实现高分辨率分钟级视频生成，显著降低算力需求，适合 AI 工具使用者在单 GPU 上探索长视频创作。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年6月21日更新 2025年6月21日浏览 352

// 01 LinGen 是什么

LinGen 是最新一代文本到视频生成模型框架，以“MATE 模块”（包含 MA-branch 和 TE‑branch）替换传统的自注意力机制，实现生成高质量、1 分钟以上高分辨率视频，同时将计算复杂度从平方级下降到线性级。这一突破适合 AI 工具使用者与内容创作者关注与尝试。

LinGen 的背景与创新

现代文本生成视频依赖于复杂的 Diffusion Transformers（DiT），但其计算量随着像素数量平方增长，生成高分辨率与长视频成本昂贵，通常仅能处理 10–20 秒视频。LinGen 全新设计，将自注意力替换为线性复杂度的 MATE 模块，首次实现单 GPU 上生成高分辨率、分钟级（如 68 秒）视频而不牺牲画质。

MATE 模块详解

MA-branch（Mamba + Rotary + Review Token）

MA‑branch 包含 bidirectional Mamba2、Rotary Major Scan（RMS）与 Review tokens 等机制：

Mamba2 处理短到长距离关联；
RMS 将 3D 视频 tokens 以不同扫描方式转换为序列，解决相邻丢失问题；
Review tokens 提供长距离上下文校准。

TE-branch（Temporal Swin Attention）

TE‑branch 聚焦时空邻接关系，使用 Swin Attention 风格，补充 MA‑branch 对中程时间关系的处理，提升视频连贯性。

效率与效果表现

LinGen 在 512p 分辨率下生成分钟级视频时，相比 DiT 提供高达 15× FLOPs 和 11.5× 延迟减少，同时在人类评估中保持或超越现有顶尖模型（如 Gen‑3、LumaLabs、Kling）。

使用场景与价值

长视频生成：如教程、广告或短片预览，生成时间扩展到 1 分钟，获得高质量内容。
实时交互视频：潜力应用于游戏场景、AR/VR 和互动影视内容制作。
单 GPU 项目落地：无需集群，也能执行高阶视频生成项目。

如何使用 LinGen

1.浏览 CVPR 世上官方网站或 GitHub 仓库获取示例与 Demo。

2.配置 PyTorch（≥1.13+cu11.7）与依赖，并替换 PixArt 模型中的自注意力为 MATE 模块。

3.使用文本提示生成视频，设置时长、分辨率与内容类型。

4.实验效果并对比传统 DiT 生成耗时与画质。

// 04 常见问题

LinGen 是什么？

LinGen 是一款创新的线性复杂度文本生成视频框架，利用 MATE 模块实现高分辨率分钟级视频生成，显著降低算力需求，适合 AI 工具使用者在单 GPU 上探索长视频创作。

LinGen 适合哪些场景？

可优先参考它所属的 AI 图像分类，以及 tech-cv、AI长视频生成等标签。

LinGen 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

LinGen 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5703.html 官网或下载入口https://lineargen.github.io/分类与标签体系AI 图像、tech-cv、AI长视频生成

LongCat-Video-Avatar

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

LinGen 工具资料卡

NavXD2025年6月21日

Seedream 5.0 是字节跳动推出的下一代 AI 图像生成与编辑模型，具备深层语义理解、原生 4K 输出、高精度文本渲染、参考图像融合与智能逻辑推理能力，支持复杂场...

AI 大模型 / 对话AI 工具

Seedance 2.0 是基于先进 AI 视频生成模型的工具，支持从文本或静态图像生成多镜头叙事视频。该工具可自动维护视觉一致性、理解复杂场景并输出高质量 1080p...

AI 大模型 / 对话AI 工具

Grok Imagine 1.0

Grok Imagine 1.0 是 xAI（由 Elon Musk 支持的人工智能公司）推出的多模态生成系统，可基于自然语言提示生成图像或短视频，支持图像编辑、文本渲染...

AI 图像AI 工具

Vidu Q3 是由生数科技（Shengshu Technology）推出的新一代 AI 视频生成模型，可直接生成最高 16 秒、1080p 分辨率、音视频同步的视觉内容...

AI 大模型 / 对话AI 工具

AI大学堂

我的收藏夹 →