EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时的高计算复杂度问题。基于用简单的非层次化Vision Transformer(ViT)作为图像编码器,引入高效的记忆模块降低计算复杂度,实现在保持分割质量的同时减少延迟和模型大小。EfficientTAM在多个视频分割基准测试中表现出与SAM 2相当的性能,具有更快的处理速度和更少的参数,特别适用于移动设备上的视频对象分割应用。

EfficientTAM – Meta AI推出的视频对象分割和跟踪模型  第1张
(图片来源网络,侵删)
EfficientTAM – Meta AI推出的视频对象分割和跟踪模型  第2张
(图片来源网络,侵删)