// 01 EXAONE 4.0 是什么
一、什么是EXAONE 4.0?
EXAONE 4.0 是由 LG AI Research 于 2025 年 7 月发布的 首款混合智能(hybrid AI)模型,融合了自然语言处理与高级推理能力。它基于 EXAONE 3.5 的易用性与 EXAONE Deep 的强推理能力,再一次整合成单一模型,支持工具调用(Function Calling)与 Agentic 模式,在英文、韩文和西班牙文等多语言环境中具备出色表现。
EXAONE 4.0 系列包含:
32B 专家级模型:用于高性能服务与复杂场景部署;
1.2B 轻量版模型:可在终端设备本地部署,兼顾隐私与计算资源。
全部开源发布,可供研究与开发者下载使用。
二、架构与技术创新
2.1 混合注意力机制
32B 模型采用 Local + Global attention 混合机制(3:1),在保持局部信息的同时提升全局上下文感知能力,舍弃 RoPE 来增强全局表现力。
2.2 QK-Reorder-Norm 技术
将 LayerNorm 应用于注意力后输出,将 Q/K 矩阵加入 RMS normalization,提升下游任务表现,即便计算开销略增。
2.3 双模式推理
Non-reasoning 模式:响应速度快、适合聊天与常规任务;
Reasoning 模式:通过
<think>tags 启动多步思考流程,适合复杂逻辑、数学、代码推理等 。
三、性能对比与基准成绩
在多项评测基准中,EXAONE 4.0 均表现卓越:
MMLU-Redux:92.3;MMLU-Pro:81.8;
AIME(数学):85.3;
LiveCodeBench v6(代码):66.7;
GPQA-Diamond(科学):75.4。
与 Phi‑4、Qwen 3、Gemma 3、Llama‑4‑Maverick 等一流开源模型相比,实力不相上下,技术领先地位明确。
四、使用方式与集成指南
4.1 安装与加载模型
4.2 切换推理模式
不启用 thinking mode 时 enable_thinking=False,适合常规聊天。
4.3 工具调用(Agentic Tool Use)
支持 Function Calling,你可定义 schema 由模型调用函数执行特定任务,并返回结果,适合多步骤智能 Agent 构建。
4.4 部署支持
llama.cpp:支援 GGUF 格式,本地推理;
TensorRT-LLM、vllm 等平台亦兼容;
FriendliAI API:可连接 API,免硬件部署即可使用。
五、适合 AI 工具使用者的应用场景
5.1 高阶助手与 Agent
利用 reasoning 模式与工具调用构建智能助手,例如代码分析、数据处理 Agent。
5.2 企业自动化服务
使用 32B 模型处理复杂任务,如法律咨询、科研文案、营销自动化、客户支持等。
5.3 边缘 AI 与隐私设备
1.2B 模型适合手机、智能家电、汽车模块等本地 AI 应用,满足隐私与低延迟要求。
5.4 多语言产品
支持韩语、西语、英语,适合国际化方案开发。
