混元‑A13B 如何收费？

混元‑A13B 的定价模式为：unknown。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI 大模型 / 对话

▸ AI 大模型 / 对话 · SITES

混元‑A13B SITES

混元‑A13B 是腾讯混元团队开源的首个 13B 激活参数 MoE 混合推理模型，提供高效推理、超长上下文（256K tokens）、Agent 工具调用能力和推理模式切换。本文全面解析其架构、性能、部署优化、应用场景和 FAQ，帮助 AI 用户快速理解与落地。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年7月4日更新 2025年7月4日浏览 464

// 01 混元‑A13B 是什么

什么是混元‑A13B？

混元‑A13B（Hunyuan‑A13B）是腾讯混元团队发布的开源 MoE（稀疏专家混合）大模型，具有 800 亿总参数、13B激活参数，兼顾推理效率与模型能力。

架构类型：Mixture‑of‑Experts，13B激活但达 80B总参数
多 Agent 能力：支持调用多工具（地图、天气、编程等）
超长上下文处理：原生支持 256 K token，适合长文档理解与分析
推理效率：比同级模型推理速度更快，吞吐量约为 2 倍
开源可部署：已上线 GitHub 与 Hugging Face，支持 INT4/INT8/FP8 等量化，单卡部署可行

架构与训练原理

MoE 专家机制

混元‑A13B 采用 Mixture‑of‑Experts 架构，共有数十个专家模块，推理时仅激活约 13B 参数，从而在保留能力的前提下大幅降低计算开销。

双模式推理：快思考 v.s 慢思考

快思考：用于日常问答，计算资源低，响应快
慢思考：启用 Chain‑of‑Thought 逻辑推理，用于复杂任务

256K 超长上下文窗口

原生支持 256K tokens，以应对论文、法律条文、商业报告等长文理解任务，显著缓解上下文遗失问题。

混元 Scaling Law 科学设计

团队构建适用于 MoE 架构的 Scaling Law 理论，优化模型层次、专家数量与预训练策略。

阶段式后训练

从基础模型（Pre-train）、指令微调（Instruct）、CoT + 强化学习等多阶段训练，强化推理、Agent调用、文本生成能力。

性能评测

多项基准测试

MMLU / BBH / SuperGPQA / MultiPL-E / MBPP 等评测坐稳前列
数学、科学题表现优异：如 GPQA、MATH、CMATH 达高分区间

Agent 工具调用

在 BFCL‑v3、τ‑Bench、C3‑Bench 中获得领先，支持规划路线、执行编程、信息检索等。

推理吞吐量与部署效率

配合 TensorRT‑LLM 引擎，推理吞吐可达 2000 tokens/s，支持 TP/EP/FPT‑X 量化策略。

部署与推理优化指南

本地部署要求

单卡（中低端 GPU）部署可行
支持量化版本：INT8、INT4、FP8（GPTQ）

高效模式切换

通过 prompt 增加 /think 或 /no_think 控制推理模式，兼顾速度与推理深度

可选量化模式

提供 INT8、INT4、FP8 等多种量化模型选择，适配性能与精度权衡

应用场景示例

1. Agent 任务生态

旅游规划：调用地图、天气和酒店 API 提供完整行程安排
数据分析：自动生成图表、清洗数据、输出 Excel 报告

2. 长文处理

论文摘要、法律条文解析、商业报告提炼，适合大文本需求

3. 教育与科研

数学题、多步逻辑、代码评估基于 ArtifactsBench 提供优质支撑

已在腾讯内部 400+ 业务中应用，日请求量超 1.3 亿次，用于客服准确回答与文案生成

// 04 常见问题

混元‑A13B 是什么？

混元‑A13B 适合哪些场景？

可优先参考它所属的 AI 大模型 / 对话分类，以及相关能力等标签。

混元‑A13B 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

混元‑A13B 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5852.html 官网或下载入口https://github.com/Tencent-Hunyuan/Hunyuan-A13B 分类与标签体系AI 大模型 / 对话

UI-TARS Desktop

AI 大模型

92%

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

混元‑A13B 工具资料卡

NavXD2025年7月4日

LPM 1.0

新一代“视频生成 + 对话智能体（Video-based Agent）”体系，重点探索如何让 AI 在视频中实现持续、自然、具备情绪与动作的角色表现能力。

最近收录AIAI 工具

QinyanClaw

由“沁言学术”体系推出的云端智能体产品，并基于 OpenClaw 架构构建，属于偏科研与知识工作流的 AI Agent 系统。

最近收录AIAI 工具

Mano-P 1.0

通过“看屏幕”的方式理解 GUI 界面，并执行点击、输入、切换窗口等操作，从而实现跨软件、跨系统的通用自动化能力。

最近收录AIAI 工具

OmniShow

面向人-物交互（HOI, Human-Object Interaction）视频生成的研究型模型框架。

最近收录AIAI 工具

混元‑A13B SITES

// 01 混元‑A13B 是什么

什么是混元‑A13B？

架构与训练原理

MoE 专家机制

双模式推理：快思考 v.s 慢思考

256K 超长上下文窗口

混元 Scaling Law 科学设计

阶段式后训练

性能评测

多项基准测试

Agent 工具调用

推理吞吐量与部署效率

部署与推理优化指南

本地部署要求

推荐推理引擎

高效模式切换

可选量化模式

应用场景示例

1. Agent 任务生态

2. 长文处理

3. 教育与科研

// 04 常见问题

// 05 资料来源

同频段更多信号

混元‑A13B SITES

// 01 混元‑A13B 是什么

什么是混元‑A13B？

架构与训练原理

MoE 专家机制

双模式推理：快思考 v.s 慢思考

256K 超长上下文窗口

混元 Scaling Law 科学设计

阶段式后训练

性能评测

多项基准测试

Agent 工具调用

推理吞吐量与部署效率

部署与推理优化指南

本地部署要求

推荐推理引擎

高效模式切换

可选量化模式

应用场景示例

1. Agent 任务生态

2. 长文处理

3. 教育与科研

// 04 常见 问题

// 05 资料 来源

// 04 常见问题

// 05 资料来源