EmbodiedGen 由谁开发？

EmbodiedGen 由 HorizonRobotics 开发。

EmbodiedGen 如何收费？

EmbodiedGen 的定价模式为：unknown。

AI 工具雷达// NavXD.v4实时

当前浏览中

频道AI 图像

浏览量199

▸ AI 图像 · 应用工具

EmbodiedGen 应用工具

EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具，支持多模态资产（图像、文本、布局）生成具实体感的 3D 交互环境，适合机器人训练、仿真与生成式 AI 研究者使用。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网 GitHub收藏 0

收录 2025年6月20日更新 2025年6月20日浏览 199

// 01 EmbodiedGen 是什么

在机器人研究与 Embodied Intelligence（具身智能）快速发展的当下，高质量、多样化的仿真环境成为关键资源。EmbodiedGen正是为此而生——它基于生成式 AI 构建完整、多模态的 3D 世界，并主动为机器人训练任务提供支持。本文将从核心机制、模块特点、应用价值、使用指南与常见问题入手，全面解读 EmbodiedGen，助力 AI 工具使用者掌握这一前沿技术。

什么是 EmbodiedGen？

EmbodiedGen 是由 Horizon Robotics 牵头开发、开源于 GitHub 的生成式 3D 世界构建框架。其目标是降低传统 3D 资产制作门槛，通过多阶段生成管线输出满足物理属性、真实尺度、可交互的 3D 场景与对象，最终兼容机器人仿真引擎（如 MuJoCo、Isaac Lab、OpenAI Gym 等）。

核心组件包括：

图像生成 3D（Image-to-3D）
文本生成 3D（Text-to-3D）
纹理生成（Texture Generation）
可动对象（Articulated Object Generation）
场景生成（Scene Generation）
布局生成（Layout Generation）

核心模块一览

Image‑to‑3D：单图到可交互网格

从一幅图片输入，系统生成网格（mesh）、语义纹理、物理属性，同时自动检测质量缺陷并修复，输出 URDF 格式，用于仿真任务。

Text‑to‑3D：从文本构建虚拟资产

基于两阶段设计（Text ➝ Image ➝ 3D），先生成高质量中间图，再转化为可模拟对象。采用 Kolors 等 Text-to-Image 模型设计，支持中英文提示，自动过滤不合格生成的资产。

纹理与材质生成

自定义贴图模型与已有 Diffusion 模型结合，支持 2D→3D 纹理映射，赋予网格丰富风格与细节。

可动对象构建

自动识别物体关节与拓扑结构，生成可挠动或带转动轴的对象，适用于机器人抓取、操作任务。

场景与布局生成

物体之间的空间关系通过文本或任务描述自动布局，以语义与物理合理性构成交互式环境，例如厨房排列、桌面设置、导航场景等。

技术优势与创新点

真实物理属性控制

自动估算真实比例、质量、摩擦属性，资产直接可用于仿真平台进行物理交互。

高通用性与兼容性

统一输出 URDF 格式，兼容 OpenAI Gym、MuJoCo、Isaac Lab、RoboSplatter 等多平台支持。

自动质检机制

搭建美观度、语义一致、几何完整等检查器；集成反馈—重试循环确保资产质量。

多模态生成能力

支持结合图像、文本、布局指令，全流程可控生成多场景、多资产仿真环境。

适用用户与典型场景

机器人研究与仿真训练

用于数据增强、零样本任务评估与多场景复杂训练，提升机器人在 navigation、manipulation 任务的性能。

Embodied Intelligence 研发者

提供易建模、高交互环境，适合作为评估基础平台，扩展生成式模型能力。

生成式 AI 资产设计

可快速制作 3D 资产模板用于游戏、AR/VR 内容创作，降低手工建模成本。

如何快速上手？

环境配置

安装依赖后以示例启动流程：

即可生成高质量 cup asset，并输出 URDF、纹理与质量报告。

生成示例

图像输入示例：杯子、工具等
文本输入示例："A red screwdriver with metallic sheen"

生成后检查 .obj/.urdf 文件并导入 MuJoCo 渲染测试。

// 02 核心功能

核心定位EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具，支持多模态资产（图像、文本、布局）生成具实体感的 3D 交互环境，适合机器人训练、仿真与生成式 AI 研究者使用。
分类索引当前归档在 AI 图像，方便和同频工具横向比较。
能力标签关联标签包括 tech-cv、price-open-source。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合 AI 图像定位和 tech-cv、price-open-source 标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

EmbodiedGen 是什么？

EmbodiedGen 适合哪些场景？

可优先参考它所属的 AI 图像分类，以及 tech-cv、price-open-source 等标签。

EmbodiedGen 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

EmbodiedGen 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5697.html 官网或下载入口https://horizonrobotics.github.io/robot_lab/embodied_gen/index.html 分类与标签体系AI 图像、tech-cv、price-open-source

GLM-5

GLM-5 是 Zhipu AI（Z.ai）发布的第五代大型语言模型，采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制，支持高达 20...

AI 大模型 / 对话AI 工具

Seedream 5.0

Seedream 5.0 是字节跳动推出的下一代 AI 图像生成与编辑模型，具备深层语义理解、原生 4K 输出、高精度文本渲染、参考图像融合与智能逻辑推理能力，支持复杂场...

AI 大模型 / 对话AI 工具

Seedance 2.0

Seedance 2.0 是基于先进 AI 视频生成模型的工具，支持从文本或静态图像生成多镜头叙事视频。该工具可自动维护视觉一致性、理解复杂场景并输出高质量 1080p...

AI 大模型 / 对话AI 工具

LingBot-VA

LingBot-VA 是蚂蚁灵波科技（Robbyant / Ant Group）发布的开源具身世界模型。该模型首次提出自回归视频-动作世界建模方法，实现视频动态未来预测与...

AI 大模型 / 对话AI 工具

EmbodiedGen 应用工具

// 01 EmbodiedGen 是什么

什么是 EmbodiedGen？

核心模块一览

Image‑to‑3D：单图到可交互网格

Text‑to‑3D：从文本构建虚拟资产

纹理与材质生成

可动对象构建

场景与布局生成

技术优势与创新点

真实物理属性控制

高通用性与兼容性

自动质检机制

多模态生成能力

适用用户与典型场景

机器人研究与仿真训练

Embodied Intelligence 研发者

生成式 AI 资产设计

如何快速上手？

环境配置

生成示例

// 02 核心 功能

// 03 使用 场景

// 04 常见 问题

// 05 资料 来源

// 02 核心功能

// 03 使用场景

// 04 常见问题

// 05 资料来源