当前浏览中
频道AI 视频
浏览量17
▸ AI 视频 · 应用工具

LiveWorld 应用工具

高校联合团队开源的视频世界模型框架,解决"视野外动态",让视频世界持续演进。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · 中文/多语言
收录 2026年7月2日更新 2026年7月2日浏览 17

// 01 LiveWorld 是什么

LiveWorld 界面截图
LiveWorld · 界面预览

快速结论

LiveWorld 是由阿德莱德大学、澳大利亚国立大学、蒙纳士大学、浙江大学与奥克兰大学联合研究团队推出的开源视频世界模型(Video World Model)框架,主打让生成的视频世界"持续演进"而非静止。它专门解决当前视频世界模型的"视野外动态(out-of-view dynamics)"难题——镜头看不到的物体状态被冻结的问题。截至 2026-03,论文已在 arXiv 公开、代码在 GitHub 开源,并配套评测基准 LiveBench;国内可正常访问 GitHub(clone 偶尔需加速)。

适合谁优先使用

  • 做视频生成 / 世界模型 / 具身智能研究的科研人员与研究生
  • 需要长时序、状态一致场景模拟的机器人、自动驾驶仿真团队
  • 关注可交互世界模型(world model)前沿的算法工程师
  • 想复现"视野外动态"实验的开源贡献者

核心能力拆解

静态积累(Static Accumulation)

通过 SLAM 把不变的背景融合为 3D 点云,作为世界的"记忆底座",保证镜头移开再移回时背景一致。

动态演进(Dynamic Evolution)

用独立的"监视器(monitor)"模块,对离开视野的实体继续按时间推进状态,而不是冻结,从而实现连续演进的世界。

状态感知渲染(State-aware Rendering)

把静态与动态两类表征投影回画面,指导一致性合成,让重新进入视野的物体状态合理衔接。

配套基准 LiveBench

团队同时给出 LiveBench 评测集,衡量视频世界模型在长时序、视野外一致性上的表现。

和同类工具怎么选

需求优先考虑判断标准
研究长时序世界一致性LiveWorld专门建模视野外动态,开源可复现
要成品级视频生成Sora / 可灵 / 即梦LiveWorld 是研究框架,非消费级出片工具
要可玩的交互世界Genie 类世界模型侧重可玩性而非物理一致性

国内平替:该研究方向暂无直接对标的国内开源框架;视频生成成品可用即梦、可灵。

限制与避坑

  • 是研究框架,不是开箱即用的出片产品,需要工程与算力基础。
  • 依赖 SLAM 与点云,对输入视频质量、相机运动有要求。
  • 论文与权重走国外站点,国内拉取偶尔偏慢。

NavXD 使用建议

如果你在做"可持续演进的世界模拟"——机器人仿真、自动驾驶长序列、可交互世界模型——LiveWorld 值得作为解决视野外一致性问题的参考实现;纯做短视频内容生产则用即梦 / 可灵更直接。

赞助广告

// 02 核心 功能

  • 核心定位高校联合团队开源的视频世界模型框架,解决"视野外动态",让视频世界持续演进。
  • 分类索引当前归档在 AI 视频,方便和同频工具横向比较。
  • 能力标签关联标签包括 开源、视频生成、世界模型、视频生成模型、3D重建。
  • 使用入口已记录可访问入口,可通过本页主按钮跳转。

// 03 使用 场景

  • 快速判断是否适合当前任务结合 AI 视频 定位和 开源、视频生成、世界模型 标签,先判断它是否匹配你的工作流。
  • 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
  • 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。

// 04 常见 问题

LiveWorld 是什么?
高校联合团队开源的视频世界模型框架,解决"视野外动态",让视频世界持续演进。
LiveWorld 适合哪些场景?
可优先参考它所属的 AI 视频 分类,以及 开源、视频生成、世界模型、视频生成模型、3D重建 等标签。
LiveWorld 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
LiveWorld 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

同频段 更多信号

查看 AI 视频 全部