- STARS⭐ 286
- FORKS15
- LICENSEMIT
- BYOpenGVLab
- LANGPython
- PRICINGUNKNOWN
InternVL-U 是什么
InternVL-U 是上海人工智能实验室 OpenGVLab 推出的统一多模态模型,支持视觉理解、推理、图像生成与图像编辑。官方资料显示,该模型采用 4B 参数统一架构,将多模态理解模型与 MMDiT 图像生成头结合,实现统一上下文建模。InternVL-U 支持图像编辑、复杂推理与高语义密度视觉生成,并在多项生成与理解 benchmark 中超过更大规模统一模型。模型已通过 GitHub、ModelScope 与 Hugging Face 开源。
核心功能
- 统一多模态架构
- 支持图像生成与编辑
- 支持多模态推理
- 4B 参数设计
- 已开源
使用场景
- AI 绘图
- 图像编辑
- 多模态问答
- 视觉推理
- 内容生成
适合谁用
适合多模态研究人员与 AI 开发者
常见问题
**Q: InternVL-U 是什么?**
InternVL-U 是上海 AI Lab 推出的统一多模态模型。
**Q: InternVL-U 怎么用?**
开发者可通过 GitHub、ModelScope 与 Hugging Face 使用模型。
**Q: InternVL-U 收费吗?**
模型已开源,可免费用于研究与开发。
资料来源
- https://github.com/OpenGVLab/InternVL-U
- https://arxiv.org/abs/2603.09877
- https://www.modelscope.cn/models/OpenGVLab/InternVL-U
