Kairos 3.0 #049
大晓机器人推出的 开源世界模型,专为具身智能、机器人环境理解与动态预测设计。
MegaLLM #050
一个通过 单一 API 访问 70+ 大语言模型(LLMs) 的通用 AI 平台。
GPT-5.2-Codex #051
OpenAI 发布的最新 代理编码与高级软件工程 AI 模型。
TRELLIS.2 #052
微软发布的开源 图像到 3D 生成 AI 模型。
SHARP #053
苹果推出的开源单目视图 3D 场景合成模型。
字节跳动Seed #054
字节跳动发布的通用 Agent AI 模型。
SAM Audio #055
Meta 推出的统一多模态音频分离 AI 模型。
混元世界模型1.5 #056
腾讯发布的实时交互式 3D 世界生成模型。
GPT Image 1.5 #057
OpenAI 发布的最新图像生成与编辑 AI 模型,作为 ChatGPT Images 的核心引擎,它以 最高达 4× 更快的生成速度、更强的指令执行力、精细细节保留与创意转换能力 为特性,支持创意图像生成、照片编辑与...
MiMo-V2-Flash #058
小米开源的高效混合专家(MoE)大语言模型,具备 3090亿参数、150亿激活参数、150 tokens/s 超高速推理、256K 超长上下文支持,在推理、代码生成与智能体任务上表现出色。
LongCat-Video-Avatar #059
美团 LongCat 团队开源的音频驱动长视频角色动画生成模型。
Live Avatar #060
一个面向 AI 工具使用者的先进 实时音频驱动交互式头像生成系统。
Seedance 1.5 Pro #061
字节跳动 Seed 团队最新发布的 音视频联合生成 AI 模型。该模型具备专业级音画同步、高质量视频生成、复杂叙事理解与多模态输入支持,为内容创作者及 AI 工具使用者提供强大的短片和影视级视频创作能力。
万相2.6 #062
阿里通义万相最新发布的视频生成 AI 模型,支持文本/图像/参考视频多模态生成、多镜头叙事、角色扮演和原生音画同步,为 AI 工具使用者实现专业级短片创作与影视级内容自动化提供强大支持。
GWM-1 #063
GWM-1 是由 Runway 发布的首个通用世界模型(General World Model),基于 Gen-4.5 架构,通过逐帧像素预测模拟动态环境、物理规律和时间演化。GWM-1 包括 GWM Worlds、G...
GPT-5.2 #064
GPT-5.2 是 OpenAI 于 2025 年 12 月 11 日发布的最新大模型版本,专为专业知识工作、复杂多步骤任务以及更高效的生成式智能体验打造,在生成电子表格、演示文稿、代码、长文本理解和工具调用等方面显著...
