子曰3（Confucius3‑Math）

10个月前更新 294 00

子曰3（Confucius3‑Math）是网易有道开源的 14B 数学大模型，专注 K‑12 教育，具备高考题 98.5 分实力，可在 RTX 4090 D 单卡上运行，服务成本仅 0.15 美元／百万 tokens，性价比极高。

站点语言：

收录时间：

2025-07-01

打开网站手机查看

大模型开源工具与社区最近收录AI 模型管理与部署 # AI数学辅导工具 # K‑12 数学教育 # 数学推理大模型

子曰3（Confucius3‑Math）

打开网站

什么是子曰3（Confucius3‑Math）？

子曰3（英文名：Confucius3‑Math）是网易有道于 2025 年 6 月 23 日正式发布并开源的数学推理大模型，参数规模约 140 亿，聚焦中国 K‑12 数学教育场景。它通过强化学习与多项创新技术实现轻量化设计，使其在消费级 GPU（如 RTX 4090D）上运行流畅，推理性能高达 DeepSeek‑R1 模型的 15 倍。

为什么选择子曰3（Confucius3‑Math）？

高性能：GAOKAO‑Bench（Math）评测得分高达 98.5 分，CK12‑MATH、MathBench、MATH500 等多个主流 benchmark 均领先 DeepSeek‑R1 和 Qwen3‑14B 等模型。
低成本：训练成本仅 2.6 万美元，服务推理成本低至 0.15 美元／百万 tokens，比一般通用大模型更高效。
易部署：可在 RTX 4090D 等级的消费级单 GPU 上部署，资源门槛低，用于教育行业更具实用性。
开源：代码、论文、Demo 均可从 GitHub 和官网免费获取，便于研究与二次开发。

技术亮点解读

模型架构与训练策略

参数规模适中
子曰3 模型含约 140 亿参数，在保持模型轻量的同时，确保具备强大的数学推理能力。
强化学习（RLHF）强化训练
利用目标熵正则化（Targeted Entropy Regularization）、样本恢复机制、策略特定难度加权等技术，稳定训练并有效提升推理能力。
推理性能领先对手
基于 vLLM + FP8 技术，算力效率极强：单卡 RTX 4090D 情况下，推理吞吐量达到数千 tokens/s，远超 DeepSeek‑R1 671B 等通用模型。

应用范围与价值

K‑12 数学教育：高考题、奥数题、课堂练习题都能高效解答；
数学辅导工具：教师与学生皆可借助其生成解析、讲解思路，提高教学效率；
教育公平推进：通过开源低成本模型，帮助资源匮乏地区获得优质 AI 教学支持。

性能评测与对比

Benchmark	DeepSeek‑R1	Qwen3‑14B	子曰3（Confucius3‑Math）
CK12‑MATH	92.7	94.0	96.2
GAOKAO‑Bench（Math）	93.3	93.0	98.5
MathBench（K12）	90.0	96.5	95.1
MATH‑500	95.8	95.9	96.1
AIME 2024	79.8	79.3	81.2
AIME 2025	70.0	70.4	69.9（提升幅度显著）

（数据来源：公开论文及“量子位”等媒体报道）

如何部署子曰3（Confucius3‑Math）？

下载模型与代码：
GitHub 上已有完整模型和训练代码：
选用设备：
推荐 RTX 4090D 级别 GPU; 如资源更高，可使用 H800 等服务器级 GPU。
部署推理：
使用 vLLM 框架和 FP8 精度，效率极高，吞吐量可达到数千 tokens/s。基于吞吐评测，单 H800 服务器每小时可处理 1.069 亿 tokens，运行成本约 0.15 美元／百万 tokens
接入业务系统：
支持 REST 启动推理服务、批量题目解析、在线辅导系统接入等。
二次开发：
支持 fine‑tune、蒸馏、知识增强、LORA 等方式继续优化。

常见问题（FAQ）

Q1：子曰3（Confucius3‑Math）与通用大模型有什么区别？
A1：它专注于数学逻辑推理，结构和训练策略针对数学场景优化，胜在高效、正确率高、部署门槛低。

Q2：是否能部署在更低规格 GPU？
A2：最佳性能在消费级高端卡上（如 RTX 4090D），理论上也可部署在更低卡，但性能与吞吐可能下降。

Q3：会持续更新或支持其他学科吗？
A3：目前开源模型专注 K‑12 数学，后续可能加入拓展版或其他学科模型，欢迎社区贡献。

Q4：如何接入在线辅导系统？
A4：可以通过 REST API 调用、微服务方式部署推理接口，接入教师/家长平台，实现题目解析、答案评估等功能。

结语

子曰3（Confucius3‑Math）是教育 AI 应用的一次重大进步。它通过专注数学训良、创新训练机制和低成本部署，为 K‑12 数学教育带来了实用而高效的人工智能工具，真正实现“技术普惠”。未来更多垂类 LLM 都将借鉴它的设计理念：小巧、专业、高效、开源。

数据统计