SmolVLA 是 开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,模型小巧,可在CPU上运行,单个消费级GPU即可训练,能在MacBook上部署。SmolVLA 完全基于开源数据集训练,数据集标签为“lerobot”。

SmolVLA – Hugging Face开源的轻量级机器人模型  第1张
(图片来源网络,侵删)
SmolVLA – Hugging Face开源的轻量级机器人模型  第2张
(图片来源网络,侵删)