Llama-baidu093.1-baidu09Minitron – 英伟达联合Meta推出的Llama 3.1 4B参数模型

baidu09_com 2025-08-29 8 0

Llama-3.1-Minitron是由英伟达和Meta合作开发的AI模型，通过剪枝和知识蒸馏技术从Llama 3.1 8B模型精炼而成的更小型4B参数模型。这种优化减少了模型大小和复杂性，同时保持了核心性能。Llama-3.1-Minitron 4B在多个基准测试中表现优异，与更大模型相比具有竞争力，且在FP8精度下吞吐量提升显著，是AI绘画和写作等领域的强大技术支持。