Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的后训练,加入推理能力,在科学推理、高级数学、编程、指令遵循和工具调用等方面表现出色。Llama Nemotron模型家族包括Nano、Super和Ultra三种类型,分别适用于从轻量级推理到复杂决策的多种企业级AI代理需求。

Nano(llama-3.1-nemotron-nano-8b-v1)基于Llama 3.1 8B微调而来,专为PC和边缘设备而设计。

Super(llama-3.3-nemotron-super-49b-v1)基于Llama 3.3 70B蒸馏而来,针对数据中心GPU进行优化,实现最高吞吐量下的最佳准确性。

Llama Nemotron – 英伟达推出的系列推理模型  第1张
(图片来源网络,侵删)

Ultra(Llama-3.1-Nemotron-Ultra-253B-v1)基于Llama 3.1 405B蒸馏而来,专为多GPU数据中心打造最强智能体设计,在一系列基准测试中,Llama-3.1-Nemotron-Ultra-253B-v1与相当,优于Meta最新发布的Llama 4 Behemoth和Llama 4 Maverick。

Llama Nemotron – 英伟达推出的系列推理模型  第2张
(图片来源网络,侵删)