当前浏览中
频道AI 图像
浏览量199
▸ AI 图像 · 应用工具

EmbodiedGen 应用工具

EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具,支持多模态资产(图像、文本、布局)生成具实体感的 3D 交互环境,适合机器人训练、仿真与生成式 AI 研究者使用。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2025年6月20日更新 2025年6月20日浏览 199

// 01 EmbodiedGen 是什么

EmbodiedGen 界面截图
EmbodiedGen · 界面预览

在机器人研究与 Embodied Intelligence(具身智能)快速发展的当下,高质量、多样化的仿真环境成为关键资源。EmbodiedGen正是为此而生——它基于生成式 AI 构建完整、多模态的 3D 世界,并主动为机器人训练任务提供支持。本文将从核心机制、模块特点、应用价值、使用指南与常见问题入手,全面解读 EmbodiedGen,助力 AI 工具使用者掌握这一前沿技术。


什么是 EmbodiedGen?

EmbodiedGen 是由 Horizon Robotics 牵头开发、开源于 GitHub 的生成式 3D 世界构建框架。其目标是降低传统 3D 资产制作门槛,通过多阶段生成管线输出满足物理属性、真实尺度、可交互的 3D 场景与对象,最终兼容机器人仿真引擎(如 MuJoCo、Isaac Lab、OpenAI Gym 等)。

核心组件包括:

  • 图像生成 3D(Image-to-3D)

  • 文本生成 3D(Text-to-3D)

  • 纹理生成(Texture Generation)

  • 可动对象(Articulated Object Generation)

  • 场景生成(Scene Generation)

  • 布局生成(Layout Generation)


核心模块一览

Image‑to‑3D:单图到可交互网格

从一幅图片输入,系统生成网格(mesh)、语义纹理、物理属性,同时自动检测质量缺陷并修复,输出 URDF 格式,用于仿真任务

Text‑to‑3D:从文本构建虚拟资产

基于两阶段设计(Text ➝ Image ➝ 3D),先生成高质量中间图,再转化为可模拟对象。采用 Kolors 等 Text-to-Image 模型设计,支持中英文提示,自动过滤不合格生成的资产

纹理与材质生成

自定义贴图模型与已有 Diffusion 模型结合,支持 2D→3D 纹理映射,赋予网格丰富风格与细节

可动对象构建

自动识别物体关节与拓扑结构,生成可挠动或带转动轴的对象,适用于机器人抓取、操作任务

场景与布局生成

物体之间的空间关系通过文本或任务描述自动布局,以语义与物理合理性构成交互式环境,例如厨房排列、桌面设置、导航场景等


技术优势与创新点

真实物理属性控制

自动估算真实比例、质量、摩擦属性,资产直接可用于仿真平台进行物理交互

高通用性与兼容性

统一输出 URDF 格式,兼容 OpenAI Gym、MuJoCo、Isaac Lab、RoboSplatter 等多平台支持

自动质检机制

搭建美观度、语义一致、几何完整等检查器;集成反馈—重试循环确保资产质量

多模态生成能力

支持结合图像、文本、布局指令,全流程可控生成多场景、多资产仿真环境


适用用户与典型场景

机器人研究与仿真训练

用于数据增强、零样本任务评估与多场景复杂训练,提升机器人在 navigation、manipulation 任务的性能

Embodied Intelligence 研发者

提供易建模、高交互环境,适合作为评估基础平台,扩展生成式模型能力。

生成式 AI 资产设计

可快速制作 3D 资产模板用于游戏、AR/VR 内容创作,降低手工建模成本。


如何快速上手?

环境配置

git clone https://github.com/HorizonRobotics/EmbodiedGen cd EmbodiedGen ./install.sh

安装依赖后以示例启动流程:

python apps/embodied_gen/run_pipeline.py \ --input_image examples/cup.jpg \ --output_dir assets/cup_3d

即可生成高质量 cup asset,并输出 URDF、纹理与质量报告。

生成示例

  • 图像输入示例:杯子、工具等

  • 文本输入示例:"A red screwdriver with metallic sheen"

生成后检查 .obj/.urdf 文件并导入 MuJoCo 渲染测试。


// 02 核心 功能

  • 核心定位EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具,支持多模态资产(图像、文本、布局)生成具实体感的 3D 交互环境,适合机器人训练、仿真与生成式 AI 研究者使用。
  • 分类索引当前归档在 AI 图像,方便和同频工具横向比较。
  • 能力标签关联标签包括 tech-cv、price-open-source。
  • 使用入口已记录可访问入口,可通过本页主按钮跳转。

// 03 使用 场景

  • 快速判断是否适合当前任务结合 AI 图像 定位和 tech-cv、price-open-source 标签,先判断它是否匹配你的工作流。
  • 横向比较同类工具从相同分类和标签继续探索替代工具,减少只看单个产品带来的选择偏差。
  • 沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页,适合做选型记录或团队分享。

// 04 常见 问题

EmbodiedGen 是什么?
EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具,支持多模态资产(图像、文本、布局)生成具实体感的 3D 交互环境,适合机器人训练、仿真与生成式 AI 研究者使用。
EmbodiedGen 适合哪些场景?
可优先参考它所属的 AI 图像 分类,以及 tech-cv、price-open-source 等标签。
EmbodiedGen 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
EmbodiedGen 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

同频段 更多信号

查看 AI 图像 全部