一、什么是EXAONE 4.0?
EXAONE 4.0 是由 LG AI Research 于 2025 年 7 月发布的 首款混合智能(hybrid AI)模型,融合了自然语言处理与高级推理能力。它基于 EXAONE 3.5 的易用性与 EXAONE Deep 的强推理能力,再一次整合成单一模型,支持工具调用(Function Calling)与 Agentic 模式,在英文、韩文和西班牙文等多语言环境中具备出色表现。
EXAONE 4.0 系列包含:
32B 专家级模型:用于高性能服务与复杂场景部署;
1.2B 轻量版模型:可在终端设备本地部署,兼顾隐私与计算资源。
全部开源发布,可供研究与开发者下载使用。
二、架构与技术创新
2.1 混合注意力机制
32B 模型采用 Local + Global attention 混合机制(3:1),在保持局部信息的同时提升全局上下文感知能力,舍弃 RoPE 来增强全局表现力。
2.2 QK-Reorder-Norm 技术
将 LayerNorm 应用于注意力后输出,将 Q/K 矩阵加入 RMS normalization,提升下游任务表现,即便计算开销略增。
2.3 双模式推理
Non-reasoning 模式:响应速度快、适合聊天与常规任务;
Reasoning 模式:通过
<think>tags 启动多步思考流程,适合复杂逻辑、数学、代码推理等 。
三、性能对比与基准成绩
在多项评测基准中,EXAONE 4.0 均表现卓越:
MMLU-Redux:92.3;MMLU-Pro:81.8;
AIME(数学):85.3;
LiveCodeBench v6(代码):66.7;
GPQA-Diamond(科学):75.4。
与 Phi‑4、Qwen 3、Gemma 3、Llama‑4‑Maverick 等一流开源模型相比,实力不相上下,技术领先地位明确。
四、使用方式与集成指南
4.1 安装与加载模型
4.2 切换推理模式
不启用 thinking mode 时 enable_thinking=False,适合常规聊天。
4.3 工具调用(Agentic Tool Use)
支持 Function Calling,你可定义 schema 由模型调用函数执行特定任务,并返回结果,适合多步骤智能 Agent 构建。
4.4 部署支持
llama.cpp:支援 GGUF 格式,本地推理;
TensorRT-LLM、vllm 等平台亦兼容;
FriendliAI API:可连接 API,免硬件部署即可使用。
五、适合 AI 工具使用者的应用场景
5.1 高阶助手与 Agent
利用 reasoning 模式与工具调用构建智能助手,例如代码分析、数据处理 Agent。
5.2 企业自动化服务
使用 32B 模型处理复杂任务,如法律咨询、科研文案、营销自动化、客户支持等。
5.3 边缘 AI 与隐私设备
1.2B 模型适合手机、智能家电、汽车模块等本地 AI 应用,满足隐私与低延迟要求。
5.4 多语言产品
支持韩语、西语、英语,适合国际化方案开发。
六、常见问题 FAQ
Q1:EXAONE 4.0 是否完全开源?
是,模型权重、代码与评测工具均在 Hugging Face 发布,采用开放许可,可用于教育与研究。
Q2:32B 与 1.2B 模型区别?
32B 针对高性能服务器部署;1.2B 适合终端设备本地运行。
Q3:如何激活 reasoning 模式?
通过 tokenizer 调用时使用 enable_thinking=True,即可启用思考流程标记。
Q4:支持哪些语言?
目前支持英、韩、西,未来将扩展更多语言环境。
Q5:是否支持商用?
模型采用 EXAONE AI Model License,允许教育与研究用途,商用接洽 LG 官网或邮箱。
Q6:如何接入 API?
通过 FriendliAI 平台一键部署,或自行在服务器/edge 端部署 llama.cpp / TensorRT 等运行环境。
Q7:有哪些使用限制?
存在潜在偏差或误导信息风险,LG 建议避免使用于敏感违法场景,并已做限制控制。
Q8:如何参与社区贡献?
可在 Hugging Face 或 GitHub 提交改进建议、推广样例与工具,参与 EXAONE ecosystem 共建。
七、优势与局限比较
| 特性 | EXAONE 4.0 | 其他开源模型 | 闭源大模型 |
|---|---|---|---|
| 混合推理能力 | ✅ 支持显式 reasoning & non‑reasoning | ❌ 多为单一模式 | ✅ 有但闭源 |
| 模型大小覆盖 | ✅ 1.2B & 32B | △ 模型需自行适配大小 | ✅ 取决供应商 |
| 多语言支持 | ✅ 英、韩、西 | △ 多数只支持英语 | ✅ 通常支持好几语种 |
| Agent 工具调用 | ✅ 内置工具调用能力 | ✖ 需二次开发 | ✅ API形式 |
| 开源授权 | ✅ 教研开源许可 | ✅ 通常开源 | ✖ 闭源 / SaaS |
| 部署灵活性 | ✅ 本地/edge/cloud | △ 部署复杂 | ✅ 云服务简单好用 |
八、未来展望与建议
扩展推理能力:包含更多高阶思考指令与 memory-saving 机制;
语言覆盖:推进日语、法语、中文等多语言支持;
模型创新:加入视觉、多模态输入搭建更广泛的 Agent 体系;
商业化推进:提供专业版服务与商业授权;
集中生态发展:聚合工具调用库、社区插件与长期 benchmark 建设。
九、总结
EXAONE 4.0 是一款架构创新、性能卓越、部署灵活且开源透明的混合智能大模型。它不仅适合 AI 工具使用者用作底层引擎,更是开发智能 Agent、构建本地 AI 系统与多语言解决方案的重要资源。无论是企业研发者、学术研究者还是产品开发者,EXAONE 4.0 提供了边缘到云端的全面支持,是未来智能应用开发的关键助推器。
数据统计
EXAONE 4.0访问数据评估
本站AI工具导航提供的EXAONE 4.0页面内容基于公开资料、第三方工具目录与用户可访问信息整理,不代表官方立场,也不构成商业承诺或事实背书。内容均由chatgpt系列生成。同时,对于该外部链接的指向,不由AI工具导航实际控制,在2025年7月22日 上午9:14收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具导航不承担任何责任。
相关AI工具平替
WorldVLA
Aurora
AI检测




