MAGREF(Masked Guidance for Any‑Reference Video Generation)是字节跳动推出的多主体框架。MAGREF仅需一张参考图像和文本提示,能生成高质量、主体一致的视频,支持单人、多人及人物与物体、背景的复杂交互场景。基于区域感知动态掩码和像素级通道拼接机制,MAGREF能精准复刻身份特征,保持视频中人物、物体和背景的协调性与一致性,适用内容创作、广告制作等多种场景,展现极强的生成能力和可控性。

MAGREF – 字节跳动推出的多主体视频生成框架  第1张
(图片来源网络,侵删)
MAGREF – 字节跳动推出的多主体视频生成框架  第2张
(图片来源网络,侵删)