dhxiaoheiyun

应无所住，而生其心。

文章12 网址2543 书籍8 软件83 评论0

GPT-5.3 Codex

GPT-5.3 Codex 是 OpenAI 于 2026 年推出的最新编码与智能代理模型变体，集成于 Codex 生态系统中，针对真实软件工程任务、代理协作和长流程执行进行了优化，提供跨环境集成与专业工作流支持。

0800

最近收录AI 编程工具 # GPT-5.3-Codex # 专业推理 # 智能代理

Kilo CLI 1.0

Kilo CLI 1.0 是一个开源、模型无关的终端优先命令行工具，设计用于支持在各种开发场景中执行 AI 驱动的编码、调试与任务自动化。该工具基于 OpenCode 开源基础构建，能访问 500+ 模型并支持多种工作模式，以便在命令行环境中完成计划、开发、调试与自动化任务。

0910

最近收录AI # AI 编码 CLI # 模型切换 # 终端工具

Voxtral Transcribe 2

Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列，包含用于批量转录的 Voxtral Mini Transcribe V2 和用于实时转写的 Voxtral Realtime。该系列支持 13 种语言、精准说话人分离、上下文偏向、词级时间戳和极低延迟的实时转录能力，并提供开源权重与企业部署选项。

0700

大模型开源工具与社区 # 多语言支持 # 实时转录 # 语音转写

Intern-S1-Pro

Intern-S1-Pro 是上海 AI 实验室开源的万亿参数级科学多模态大模型，具备混合专家（MoE）架构与通专融合架构（SAGE），在 AI4Science 科学推理与多模态理解任务上展现领先能力，支持跨学科科学研究与科研流程自动化。

0790

大模型开源工具与社区 # AI4Science 推理 # MoE 混合专家 # 科学多模态大模型

MOVA

MOVA（MOSS Video and Audio）是上海创智学院 OpenMOSS 团队与模思智能（MOSI）联合发布的开源端到端音视频生成基础模型。该模型采用异构双塔架构与双向交叉注意力机制，在单次推理中同步生成视频与音频输出，具备多语言唇形同步与环境音效生成等能力，支持最高 720p 和最长 8 秒的视听片段生成。

0910

大模型开源工具与社区 # MOVA # 端到端多模态模型 # 音视频同步生成

TTT‑Discover

TTT‑Discover 是一种测试时训练（Test‑Time Training）框架，应用在线强化学习于大语言模型在推理阶段持续训练以发现高奖励解决方案。该方法在数学优化、GPU 内核设计、算法竞赛与生物数据分析等多领域刷新最优成果，并且可复现运行于开源模型与工具链。

0680

教育与学习最近收录AI # 在线强化学习 # 测试时训练 # 科学发现AI

Project Genie

Project Genie 是 Google Labs 推出的实验性 AI 世界生成工具，由 Genie 3 世界模型驱动，允许用户通过文字或图像提示创建、探索和重混可交互虚拟世界。本文提供 Project Genie 的定义、架构、能力、使用指南、应用场景与常见问题的结构化事实内容。

0590

最近收录AI # AI 世界生成 # Google Labs Project Genie # 可交互 3D 世界

GLM-OCR

GLM-OCR 是智谱 AI（Zhipu AI）发布的开源轻量级多模态 OCR 模型，参数约 0.9B，基于 GLM-V 架构及 CogViT 视觉编码器，优化复杂文档解析、表格识别、公式识别与结构化输出。支持多种推理引擎部署与结构化结果输出。

0640

大模型开源工具与社区 # OCR 模型 # 多模态 OCR # 结构化输出

Step 3.5 Flash

Step 3.5 Flash 是 StepFun 发布的开源大语言模型，采用稀疏 Mixture-of-Experts (MoE) 架构以提升推理与逻辑任务效率，支持长上下文与高速度生成能力，适合用于编码、代理任务及复杂多步骤推理。模型提供本地部署与 API 接入选项，支持长达 256K 上下文处理能力。

0580

大模型开源工具与社区 # Agent 基座模型 # 上下长文 # 大语言模型

Happy

Happy（Happy Coder）是开源的 AI 编程远程控制工具，用于从移动设备或网页控制本地运行的 Claude Code 或 Codex，支持实时同步、端到端加密、多会话与语音控制等功能。

0650

开源工具与社区最近收录AI # AI编程控制 # 实时会话同步 # 远程终端控制

ACE-Step 1.5

ACE-Step 1.5 是一个开源 AI 音乐生成基础模型，采用混合架构支持快速生成整首音乐、歌词对齐、多语言支持及灵活编辑功能，输出结构化内容资产聚焦音乐生成能力、用例及用户指南。

0610

大模型开源工具与社区 # ACE-Step 1.5 # AI 音乐生成 # 音乐生成基础模型

可灵3.0模型

可灵3.0模型是快手推出的新一代统一多模态AI创作模型，支持图像与视频生成、智能分镜、多语言音画同步等功能。

0680

大模型最近收录AI # AI图像生成 # AI视频生成 # Kling 3.0

AI大学堂