Step-2 mini 是阶跃星辰推出的轻量级极速大模型,基于新一代自研 Attention 架构 MFA 开发。仅用 3% 的参数量就保留了 Step-2 超过 80% 的性能,显著提升了生成速度和性价比。模型在输入 4000 tokens 时,平均首字时延仅为 0.17 秒,展现出极快的响应能力。Step-2 mini 采用 MFA 架构,相比传统多头注意力架构,节省了近 94% 的 KV 缓存开销,大幅降低了推理成本。

Step-baidu092 mini – 阶跃星辰推出的轻量级极速大模型  第1张
(图片来源网络,侵删)
Step-baidu092 mini – 阶跃星辰推出的轻量级极速大模型  第2张
(图片来源网络,侵删)