AI 工具雷达// NavXD.v2LIVE
TUNEDCH ??
RESULTS3
PAGE1 / 1
#001★ 235
UnifoLM-VLA-0 #001
UnifoLM-VLA-0 是宇树科技开源的视觉-语言-动作(VLA)通用机器人操作大模型,基于 Qwen2.5-VL-7B 架构并通过机器人操作数据持续预训练,实现文本指令与视觉信息融合用于空间理解与动作规划,可在仿...
#002★ 548
DeepEyes #002
DeepEyes是一款由小红书与西安交通大学联合研发的多模态视觉-语言模型,旨在实现“用图思考”的能力。该模型通过端到端的强化学习训练,使模型能够在推理过程中动态调用图像信息,增强对细节的感知与理解,从而提升多模态推理...
#003★ 541
Google Gemini Robotics #003
增强机器人与现实世界的互动能力
