Mu是微软推出的小参数语言模型,仅3.3亿参数,支持在 NPU 和边缘设备上高效运行。模型基于编码器解码器架构,基于硬件感知优化、模型量化及特定任务微调,实现每秒超100 tokens的响应速度。Mu支持Windows设置智能体,能将自然语言指令实时转化为系统操作,如调整屏幕亮度、鼠标指针大小等。与-Phi3.5-mini相比,Mu参数量小10倍,但性能相当。其创新包括双重层归一化、旋转位置嵌入和分组查询注意力等技术,提升训练稳定性和推理效率。

Mu – 微软推出的小参数语言模型  第1张
(图片来源网络,侵删)
Mu – 微软推出的小参数语言模型  第2张
(图片来源网络,侵删)