InternVL-U
T-03公司 长尾 OPEN-SOURCE

InternVL-U

上海 AI Lab 推出的统一多模态生成与理解模型。

01

InternVL-U 是什么

InternVL-U 是上海人工智能实验室 OpenGVLab 推出的统一多模态模型,支持视觉理解、推理、图像生成与图像编辑。官方资料显示,该模型采用 4B 参数统一架构,将多模态理解模型与 MMDiT 图像生成头结合,实现统一上下文建模。InternVL-U 支持图像编辑、复杂推理与高语义密度视觉生成,并在多项生成与理解 benchmark 中超过更大规模统一模型。模型已通过 GitHub、ModelScope 与 Hugging Face 开源。

核心功能

  • 统一多模态架构
  • 支持图像生成与编辑
  • 支持多模态推理
  • 4B 参数设计
  • 已开源

使用场景

  • AI 绘图
  • 图像编辑
  • 多模态问答
  • 视觉推理
  • 内容生成

适合谁用

适合多模态研究人员与 AI 开发者

常见问题

**Q: InternVL-U 是什么?**

InternVL-U 是上海 AI Lab 推出的统一多模态模型。

**Q: InternVL-U 怎么用?**

开发者可通过 GitHub、ModelScope 与 Hugging Face 使用模型。

**Q: InternVL-U 收费吗?**

模型已开源,可免费用于研究与开发。

资料来源

  • https://github.com/OpenGVLab/InternVL-U
  • https://arxiv.org/abs/2603.09877
  • https://www.modelscope.cn/models/OpenGVLab/InternVL-U
AI大学堂