ERNIE-Image
T-03模型 长尾 OPEN-SOURCE

ERNIE-Image

百度推出的开源文生图模型。

01

ERNIE-Image 是什么

ERNIE-Image 是百度 ERNIE-Image 团队推出的开源文生图模型,采用基于单流 DiT 的潜在扩散架构,并配备 Prompt Enhancer 提示词增强模块。官方资料显示,模型重点强化复杂指令遵循、文字渲染与结构化图像生成能力,可在约 24G 显存的消费级硬件运行。ERNIE-Image 已在 GitHub 开源,并支持中英文文本渲染与多种视觉风格生成。

核心功能

  • 开源文生图模型
  • 支持复杂指令遵循
  • 强化文字渲染
  • 支持结构化图像生成
  • 支持消费级硬件部署

使用场景

  • AI 绘图
  • 海报设计
  • 动漫分镜
  • 视觉内容生成
  • 广告素材制作

适合谁用

适合 AI 图像开发者与视觉创作者

常见问题

**Q: ERNIE-Image 是什么?**

ERNIE-Image 是百度推出的开源文生图模型。

**Q: ERNIE-Image 怎么用?**

开发者可通过 GitHub 获取模型并在本地部署生成图像。

**Q: ERNIE-Image 收费吗?**

项目已开源,可免费使用。

资料来源

  • https://github.com/baidu/ERNIE-Image
  • https://ernie.baidu.com/blog/zh/posts/ernie-image/
AI大学堂