UnifoLM-VLA-0UnifoLM-VLA-0 是宇树科技开源的视觉-语言-动作(VLA)通用机器人操作大模型,基于 Qwen2.5-VL-7B 架构并通过机器人操作数据持续预训练,实现文本指令与视觉信息融合用于空间理解与动作规划,可在仿真与真实机器人上完成多类复杂操作任务。
GPT Image 1.5OpenAI 发布的最新图像生成与编辑 AI 模型,作为 ChatGPT Images 的核心引擎,它以 最高达 4× 更快的生成速度、更强的指令执行力、精细细节保留与创意转换能力 为特性,支持创意图像生成、照片编辑与视觉工作流自动化。
FunctionGemmaFunctionGemma 是 Google 发布的轻量级 AI 模型,专为 函数调用(function calling)和工具执行任务 优化,可将自然语言指令精准转换为可执行 API 调用或本地操作,并在设备端高效运行。
Gemini 3Gemini 3 是由 Google DeepMind 推出的最新 AI 模型,融合强大推理、多模态理解与编码/工具调用能力,为开发者、创作者、学习者提供“学、构建、规划”一体的智能助手,适合从写作、规划、代码生成到跨媒体内容创作的一体化 AI 支持。