dhxiaoheiyun

应无所住,而生其心。
GPT-5.3 Codex

GPT-5.3 Codex

GPT-5.3 Codex 是 OpenAI 于 2026 年推出的最新编码与智能代理模型变体,集成于 Codex 生态系统中,针对真实软件工程任务、代理协作和长流程执行进行了优化,提供跨环境集成与专业工作流支持。
0800
Kilo CLI 1.0

Kilo CLI 1.0

Kilo CLI 1.0 是一个开源、模型无关的终端优先命令行工具,设计用于支持在各种开发场景中执行 AI 驱动的编码、调试与任务自动化。该工具基于 OpenCode 开源基础构建,能访问 500+ 模型并支持多种工作模式,以便在命令行环境中完成计划、开发、调试与自动化任务。
0910
Voxtral Transcribe 2

Voxtral Transcribe 2

Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列,包含用于批量转录的 Voxtral Mini Transcribe V2 和用于实时转写的 Voxtral Realtime。该系列支持 13 种语言、精准说话人分离、上下文偏向、词级时间戳和极低延迟的实时转录能力,并提供开源权重与企业部署选项。
0700
Intern-S1-Pro

Intern-S1-Pro

Intern-S1-Pro 是上海 AI 实验室开源的万亿参数级科学多模态大模型,具备混合专家(MoE)架构与通专融合架构(SAGE),在 AI4Science 科学推理与多模态理解任务上展现领先能力,支持跨学科科学研究与科研流程自动化。
0790
MOVA

MOVA

MOVA(MOSS Video and Audio)是上海创智学院 OpenMOSS 团队与模思智能(MOSI)联合发布的开源端到端音视频生成基础模型。该模型采用异构双塔架构与双向交叉注意力机制,在单次推理中同步生成视频与音频输出,具备多语言唇形同步与环境音效生成等能力,支持最高 720p 和最长 8 秒的视听片段生成。
0910
TTT‑Discover

TTT‑Discover

TTT‑Discover 是一种测试时训练(Test‑Time Training)框架,应用在线强化学习于大语言模型在推理阶段持续训练以发现高奖励解决方案。该方法在数学优化、GPU 内核设计、算法竞赛与生物数据分析等多领域刷新最优成果,并且可复现运行于开源模型与工具链。
0680
Project Genie

Project Genie

Project Genie 是 Google Labs 推出的实验性 AI 世界生成工具,由 Genie 3 世界模型驱动,允许用户通过文字或图像提示创建、探索和重混可交互虚拟世界。本文提供 Project Genie 的定义、架构、能力、使用指南、应用场景与常见问题的结构化事实内容。
0590
GLM-OCR

GLM-OCR

GLM-OCR 是智谱 AI(Zhipu AI)发布的开源轻量级多模态 OCR 模型,参数约 0.9B,基于 GLM-V 架构及 CogViT 视觉编码器,优化复杂文档解析、表格识别、公式识别与结构化输出。支持多种推理引擎部署与结构化结果输出。
0640
Step 3.5 Flash

Step 3.5 Flash

Step 3.5 Flash 是 StepFun 发布的开源大语言模型,采用稀疏 Mixture-of-Experts (MoE) 架构以提升推理与逻辑任务效率,支持长上下文与高速度生成能力,适合用于编码、代理任务及复杂多步骤推理。模型提供本地部署与 API 接入选项,支持长达 256K 上下文处理能力。
0580
Happy

Happy

Happy(Happy Coder)是开源的 AI 编程远程控制工具,用于从移动设备或网页控制本地运行的 Claude Code 或 Codex,支持实时同步、端到端加密、多会话与语音控制等功能。
0650
ACE-Step 1.5

ACE-Step 1.5

ACE-Step 1.5 是一个开源 AI 音乐生成基础模型,采用混合架构支持快速生成整首音乐、歌词对齐、多语言支持及灵活编辑功能,输出结构化内容资产聚焦音乐生成能力、用例及用户指南。
0610
可灵3.0模型

可灵3.0模型

可灵3.0模型 是快手推出的新一代统一多模态AI创作模型,支持图像与视频生成、智能分镜、多语言音画同步等功能。
0680