DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的,基于实体表示的可控方法,基于简单的轨迹输入实现对视频中任意物体的精确运动控制。DragAnything用扩散模型的潜在特征表示视频中的每个实体,克服传统方法中单纯拖动像素点无法精确控制物体运动的局限性。DragAnything 提供用户友好的交互方式,支持前景、背景及相机运动的灵活控制,在 FID、FVD 和用户研究等评估指标上达到新的最佳性能。

DragAnything – 快手联合浙大等机构开源的可控视频生成方法  第1张
(图片来源网络,侵删)
DragAnything – 快手联合浙大等机构开源的可控视频生成方法  第2张
(图片来源网络,侵删)