WorldVLAWorldVLA 是阿里巴巴 DAMO Academy 推出的多模态机器人智能框架,结合视觉、语言与动作,支持输入图像+文本生成动作,同时预测动作后的未来图像状态,适合 AI 工具使用者进行机器人控制与仿真。03360大模型最近收录AI# 动作生成# 多模态编码器# 未来场景预测