多模态编码器

共 1 篇网址

排序

发布更新浏览点赞

WorldVLA

WorldVLA 是阿里巴巴 DAMO Academy 推出的多模态机器人智能框架，结合视觉、语言与动作，支持输入图像+文本生成动作，同时预测动作后的未来图像状态，适合 AI 工具使用者进行机器人控制与仿真。

04570

大模型最近收录AI # 动作生成 # 多模态编码器 # 未来场景预测

AI大学堂