CURRENTVIEWING
CHAI 大模型 / 对话
VIEWS413
▸ AI 大模型 / 对话 · SITES

Mu SITES

Mu 是微软推出的 330M 参数小型语言模型,专为 Copilot+ PC 上的 NPU 本地运行优化,驱动 Windows 设置中的 AI Agent,支持自然语言控制系统设置。超快速响应(

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
3 条来源,含 NavXD 收录
类型
网页工具
Web · en
收录 2025年7月1日更新 2025年7月1日浏览 413

// 01 Mu 是什么

Mu 是微软在 2025 年 6 月 23 日在 Windows Experience Blog 正式发布的小型语言模型,拥有约 3.3 亿参数,采用 encoder‑decoder 架构,专门针对 NPU(Neural Processing Unit)在 Copilot+ PC 上的本地部署进行了深度优化。它为 Windows Settings 上的 AI Agent 提供自然语言解析能力,使用户可以使用“打开蓝牙”、“调整亮度”等普通语言,系统自动执行对应设置。


为什么选择 Mu?

极致高效:本地 NPU 推理

Mu 完全在设备本地推理,无需云端,响应速度超快:揭示为每秒 100+ tokens,首次 token 延迟降低约 47%,解码速度达 decoder‑only 模型的 4.7 倍。根据 Windows Central 透露,其响应时间保持在 500ms 以内

架构优势:encoder‑decoder 模式

Muon 使用 encoder‑decoder 架构,由 encoder 一次性消化输入,将其压缩为 latent 表示,然后 decoder 基于 latent 表示生成输出;相比 decoder‑only 模型,它能显著降低内存与算力开销,更适合边缘设备部署

硬件协同优化

Mu 在设计时与芯片厂商(AMD、Intel、Qualcomm)紧密合作,通过权重共享(如共享 token embedding)、只使用 NPU 优化 operator、Grouped‑Query Attention、RoPE、Dual LayerNorm 等技术,进一步提升性能并压缩内存与功耗


Mu 如何赋能 Windows Settings AI Agent?

多阶段训练与微调

1.预训练:在 Azure A100 GPU 上使用数百亿高质量学习语料进行预训练。

2.知识蒸馏:从更大的 Phi 系列模型蒸馏知识,提升参数效率。

3.任务微调:在 3.6M 系统设置指令样本上微调,通过 LoRA 和 prompt tuning 等技术,优化任务表现。

用户体验

当用户输入“打开深色模式”或“将亮度调高一点”,Mu 可解析意图并在 Settings 中执行操作,无需额外点击。对于模糊输入,系统会用常规搜索作为 fallback 保证稳定体验。此机制目前已向 Windows Insider Dev Channel 的 Copilot+ 用开放

隐私与安全

Mu 在设备本地运行,无需上传任何数据至云端,确保用户隐私安全;同时部署在 NPU 上,比 CPU 或 GPU 更节能高效。


技术亮点解析

Dual LayerNorm 与 GQA 提升效率

Mu 应用了 dual LayerNorm 稳定训练,同时集成 grouped‑query attention(GQA),显著减少 attention 参数与计算需求,提升推理速度

RoPE 支持长上下文

借助 Rotary Positional Embeddings(RoPE),Mu 在理解和生成长上下文时更稳定,适应更复杂的自然语言指令

权重共享简化模型

Mu 输入输出层权重共享,不仅减少总参数量,还提高模型在 encoder‑decoder 间的语义一致性

模型量化与 NPU 调优

Mu 使用 PTQ 将权重转换为 8/16 位整数,并联合芯片厂商定制 operator,确保在边缘 NPU 中保持高准确率和高速度


真实体验效果如何?

  • 延迟低于 500ms:无论是 “开启飞行模式“ 或 “关闭通知”,Mu 能快速响应

  • 本地执行:无需网络连接,无数据外泄风险

  • 控制精细:兼容数百项系统设置操作,支持撤销操作,用户体验良好

多位开发者和行业观察者也在 Reddit 和 InfoQ 的社区中表达关注,并称这可能“悄然改变桌面 AI 体验”


Mu 与同类技术对比

模型参数量架构部署方式速度本地运行
Mu330Mencoder‑decoderNPU100+ tokens/s,<500 ms
Phi‑3.5‑mini~3.3Bdecoder‑onlyCPU/GPU较慢
decoder‑only 同类模型~300Mdecoder‑onlyCPU/GPU延迟高,吞吐低

语境控制、部署便捷性与能耗对比中,Mu 优势明显。


对 AI 工具用户的意义

开发价值

Mu 展现了如何将专用小型语言模型整合入系统级应用中,实现高效、低延迟的自然语言交互。对工具开发者来说,这提供了用于设计边缘 AI Agent 的参考框架。

启发新的应用场景

类似模式可用于其他本地 AI Agent,如文件管理、图片分类、应用导航等,无限打开本地 AI 的可能。

隐私合规优势

Mu 非常适合企业、政务及注重隐私的场景——无需上传数据,即可提供智能交互能力,降低风险。


// 04 常见 问题

Mu 是什么?
Mu 是微软推出的 330M 参数小型语言模型,专为 Copilot+ PC 上的 NPU 本地运行优化,驱动 Windows 设置中的 AI Agent,支持自然语言控制系统设置。超快速响应(
Mu 适合哪些场景?
可优先参考它所属的 AI 大模型 / 对话 分类,以及 相关能力 等标签。
Mu 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
Mu 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 05 资料 来源

类似工具 // V4 图谱1 条
搭档工具 // workflow0 条
◇ ◇ ◇
"关系待挖掘"
暂无搭档工具数据
▸ 我来推荐
相关评测 // review1 条

同频段 更多信号

查看 AI 大模型 / 对话 全部