CURRENTVIEWING
CHAI 大模型 / 对话
VIEWS464
▸ AI 大模型 / 对话 · SITES

混元‑A13B SITES

混元‑A13B 是腾讯混元团队开源的首个 13B 激活参数 MoE 混合推理模型,提供高效推理、超长上下文(256K tokens)、Agent 工具调用能力和推理模式切换。本文全面解析其架构、性能、部署优化、应用场景和 FAQ,帮助 AI 用户快速理解与落地。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2025年7月4日更新 2025年7月4日浏览 464

// 01 混元‑A13B 是什么

什么是混元‑A13B?

混元‑A13B(Hunyuan‑A13B)是腾讯混元团队发布的开源 MoE(稀疏专家混合)大模型,具有 800 亿总参数、13B激活参数,兼顾推理效率与模型能力

  • 架构类型:Mixture‑of‑Experts,13B激活但达 80B总参数

  • 多 Agent 能力:支持调用多工具(地图、天气、编程等)

  • 超长上下文处理:原生支持 256 K token,适合长文档理解与分析

  • 推理效率:比同级模型推理速度更快,吞吐量约为 2 倍

  • 开源可部署:已上线 GitHub 与 Hugging Face,支持 INT4/INT8/FP8 等量化,单卡部署可行


架构与训练原理

MoE 专家机制

混元‑A13B 采用 Mixture‑of‑Experts 架构,共有数十个专家模块,推理时仅激活约 13B 参数,从而在保留能力的前提下大幅降低计算开销

双模式推理:快思考 v.s 慢思考

  1. 快思考:用于日常问答,计算资源低,响应快

  2. 慢思考:启用 Chain‑of‑Thought 逻辑推理,用于复杂任务

256K 超长上下文窗口

原生支持 256K tokens,以应对论文、法律条文、商业报告等长文理解任务,显著缓解上下文遗失问题

混元 Scaling Law 科学设计

团队构建适用于 MoE 架构的 Scaling Law 理论,优化模型层次、专家数量与预训练策略

阶段式后训练

从基础模型(Pre-train)、指令微调(Instruct)、CoT + 强化学习等多阶段训练,强化推理、Agent调用、文本生成能力


性能评测

多项基准测试

  • MMLU / BBH / SuperGPQA / MultiPL-E / MBPP 等评测坐稳前列

  • 数学、科学题表现优异:如 GPQA、MATH、CMATH 达高分区间

Agent 工具调用

在 BFCL‑v3、τ‑Bench、C3‑Bench 中获得领先,支持规划路线、执行编程、信息检索等

推理吞吐量与部署效率

配合 TensorRT‑LLM 引擎,推理吞吐可达 2000 tokens/s,支持 TP/EP/FPT‑X 量化策略


部署与推理优化指南

本地部署要求

  • 单卡(中低端 GPU)部署可行

  • 支持量化版本:INT8、INT4、FP8(GPTQ)

推荐推理引擎

  • TensorRT‑LLM:NVIDIA 官方优化,全栈加速支持

  • 摩尔线程支持:国产 GPU 深度适配

高效模式切换

通过 prompt 增加 /think/no_think 控制推理模式,兼顾速度与推理深度

可选量化模式

提供 INT8、INT4、FP8 等多种量化模型选择,适配性能与精度权衡


应用场景示例

1. Agent 任务生态

  • 旅游规划:调用地图、天气和酒店 API 提供完整行程安排

  • 数据分析:自动生成图表、清洗数据、输出 Excel 报告

2. 长文处理

  • 论文摘要、法律条文解析、商业报告提炼,适合大文本需求

3. 教育与科研

数学题、多步逻辑、代码评估基于 ArtifactsBench 提供优质支撑

已在腾讯内部 400+ 业务中应用,日请求量超 1.3 亿次,用于客服准确回答与文案生成


// 04 常见 问题

混元‑A13B 是什么?
混元‑A13B 是腾讯混元团队开源的首个 13B 激活参数 MoE 混合推理模型,提供高效推理、超长上下文(256K tokens)、Agent 工具调用能力和推理模式切换。本文全面解析其架构、性能、部署优化、应用场景和 FAQ,帮助 AI 用户快速理解与落地。
混元‑A13B 适合哪些场景?
可优先参考它所属的 AI 大模型 / 对话 分类,以及 相关能力 等标签。
混元‑A13B 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
混元‑A13B 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

类似工具 // V4 图谱1 条
搭档工具 // workflow0 条
◇ ◇ ◇
"关系待挖掘"
暂无搭档工具数据
▸ 我来推荐

同频段 更多信号

查看 AI 大模型 / 对话 全部