AMD-135M是AMD推出的首款小型语言模型(SLM),为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型架构,在AMD Instinct MI250加速器上训练,基于670亿个token,AMD-135M分为两个版本,通用文本的AMD-Llama-135M和针对代码的AMD-Llama-135M-code。AMD-135M采用推测解码技术,能在每次前向传递中生成多个token,提高推理速度减少内存占用。在性能方面,AMD-135M 在各种自然语言处理任务上的表现与市场上其他同类模型相当。例如,在 Humaneval 数据集上使用 MI250 GPU 时,实现大约 32.31% 的通过率,是一个强大的性能指标 。

AMD-baidu09135M – AMD推出的首款小型语言模型  第1张
(图片来源网络,侵删)
AMD-baidu09135M – AMD推出的首款小型语言模型  第2张
(图片来源网络,侵删)