Mu是微软推出的小参数语言模型,仅3.3亿参数,支持在 NPU 和边缘设备上高效运行。模型基于编码器解码器架构,基于硬件感知优化、模型量化及特定任务微调,实现每秒超100 tokens的响应速度。Mu支持Windows设置智能体,能将自然语言指令实时转化为系统操作,如调整屏幕亮度、鼠标指针大小等。与-Phi3.5-mini相比,Mu参数量小10倍,但性能相当。其创新包括双重层归一化、旋转位置嵌入和分组查询注意力等技术,提升训练稳定性和推理效率。


Mu是微软推出的小参数语言模型,仅3.3亿参数,支持在 NPU 和边缘设备上高效运行。模型基于编码器解码器架构,基于硬件感知优化、模型量化及特定任务微调,实现每秒超100 tokens的响应速度。Mu支持Windows设置智能体,能将自然语言指令实时转化为系统操作,如调整屏幕亮度、鼠标指针大小等。与-Phi3.5-mini相比,Mu参数量小10倍,但性能相当。其创新包括双重层归一化、旋转位置嵌入和分组查询注意力等技术,提升训练稳定性和推理效率。
全部评论
留言在赶来的路上...
发表评论