Llama Nemotron – 英伟达推出的系列推理模型

baidu09_com 2025-08-29 8 0

Llama Nemotron是NVIDIA推出的一系列推理模型，专注于推理和多种智能代理（agentic AI）任务。模型基于Llama开源模型，经过NVIDIA的后训练，加入推理能力，在科学推理、高级数学、编程、指令遵循和工具调用等方面表现出色。Llama Nemotron模型家族包括Nano、Super和Ultra三种类型，分别适用于从轻量级推理到复杂决策的多种企业级AI代理需求。

Nano（llama-3.1-nemotron-nano-8b-v1）基于Llama 3.1 8B微调而来，专为PC和边缘设备而设计。

Super（llama-3.3-nemotron-super-49b-v1）基于Llama 3.3 70B蒸馏而来，针对数据中心GPU进行优化，实现最高吞吐量下的最佳准确性。

（图片来源网络，侵删）

Ultra（Llama-3.1-Nemotron-Ultra-253B-v1）基于Llama 3.1 405B蒸馏而来，专为多GPU数据中心打造最强智能体设计，在一系列基准测试中，Llama-3.1-Nemotron-Ultra-253B-v1与相当，优于Meta最新发布的Llama 4 Behemoth和Llama 4 Maverick。