什么是子曰3(Confucius3‑Math)?
子曰3(英文名:Confucius3‑Math)是网易有道于 2025 年 6 月 23 日正式发布并开源的数学推理大模型,参数规模约 140 亿,聚焦中国 K‑12 数学教育场景。它通过强化学习与多项创新技术实现轻量化设计,使其在消费级 GPU(如 RTX 4090D)上运行流畅,推理性能高达 DeepSeek‑R1 模型的 15 倍。
为什么选择子曰3(Confucius3‑Math)?
高性能:GAOKAO‑Bench(Math)评测得分高达 98.5 分,CK12‑MATH、MathBench、MATH500 等多个主流 benchmark 均领先 DeepSeek‑R1 和 Qwen3‑14B 等模型。
低成本:训练成本仅 2.6 万美元,服务推理成本低至 0.15 美元/百万 tokens,比一般通用大模型更高效。
易部署:可在 RTX 4090D 等级的消费级单 GPU 上部署,资源门槛低,用于教育行业更具实用性。
开源:代码、论文、Demo 均可从 GitHub 和官网免费获取,便于研究与二次开发。
技术亮点解读
模型架构与训练策略
参数规模适中
子曰3 模型含约 140 亿参数,在保持模型轻量的同时,确保具备强大的数学推理能力。强化学习(RLHF)强化训练
利用目标熵正则化(Targeted Entropy Regularization)、样本恢复机制、策略特定难度加权等技术,稳定训练并有效提升推理能力。推理性能领先对手
基于 vLLM + FP8 技术,算力效率极强:单卡 RTX 4090D 情况下,推理吞吐量达到数千 tokens/s,远超 DeepSeek‑R1 671B 等通用模型。
应用范围与价值
K‑12 数学教育:高考题、奥数题、课堂练习题都能高效解答;
数学辅导工具:教师与学生皆可借助其生成解析、讲解思路,提高教学效率;
教育公平推进:通过开源低成本模型,帮助资源匮乏地区获得优质 AI 教学支持。
性能评测与对比
| Benchmark | DeepSeek‑R1 | Qwen3‑14B | 子曰3(Confucius3‑Math) |
|---|---|---|---|
| CK12‑MATH | 92.7 | 94.0 | 96.2 |
| GAOKAO‑Bench(Math) | 93.3 | 93.0 | 98.5 |
| MathBench(K12) | 90.0 | 96.5 | 95.1 |
| MATH‑500 | 95.8 | 95.9 | 96.1 |
| AIME 2024 | 79.8 | 79.3 | 81.2 |
| AIME 2025 | 70.0 | 70.4 | 69.9(提升幅度显著) |
(数据来源:公开论文及“量子位”等媒体报道)
如何部署子曰3(Confucius3‑Math)?
下载模型与代码:
GitHub 上已有完整模型和训练代码:选用设备:
推荐 RTX 4090D 级别 GPU; 如资源更高,可使用 H800 等服务器级 GPU。部署推理:
使用 vLLM 框架和 FP8 精度,效率极高,吞吐量可达到数千 tokens/s。基于吞吐评测,单 H800 服务器每小时可处理 1.069 亿 tokens,运行成本约 0.15 美元/百万 tokens接入业务系统:
支持 REST 启动推理服务、批量题目解析、在线辅导系统接入等。二次开发:
支持 fine‑tune、蒸馏、知识增强、LORA 等方式继续优化。
常见问题(FAQ)
Q1:子曰3(Confucius3‑Math)与通用大模型有什么区别?
A1:它专注于数学逻辑推理,结构和训练策略针对数学场景优化,胜在高效、正确率高、部署门槛低。
Q2:是否能部署在更低规格 GPU?
A2:最佳性能在消费级高端卡上(如 RTX 4090D),理论上也可部署在更低卡,但性能与吞吐可能下降。
Q3:会持续更新或支持其他学科吗?
A3:目前开源模型专注 K‑12 数学,后续可能加入拓展版或其他学科模型,欢迎社区贡献。
Q4:如何接入在线辅导系统?
A4:可以通过 REST API 调用、微服务方式部署推理接口,接入教师/家长平台,实现题目解析、答案评估等功能。
结语
子曰3(Confucius3‑Math)是教育 AI 应用的一次重大进步。它通过专注数学训良、创新训练机制和低成本部署,为 K‑12 数学教育带来了实用而高效的人工智能工具,真正实现“技术普惠”。未来更多垂类 LLM 都将借鉴它的设计理念:小巧、专业、高效、开源。
数据统计
子曰3(Confucius3‑Math)访问数据评估
本站AI工具导航提供的子曰3(Confucius3‑Math)页面内容基于公开资料、第三方工具目录与用户可访问信息整理,不代表官方立场,也不构成商业承诺或事实背书。内容均由chatgpt系列生成。同时,对于该外部链接的指向,不由AI工具导航实际控制,在2025年7月1日 下午7:25收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具导航不承担任何责任。
相关AI工具平替
EVI 3




