DreamVideo-2是创新的零样本视频定制框架,复旦大学和阿里巴巴集团等机构联合推出。DreamVideo-2能根据单一图像和界定框序列生成具有特定主题和精确运动轨迹的视频,无需在测试时进行微调。框架用参考注意力机制学习主题外观,基于从界定框导出的二值掩码控制运动轨迹,实现精确的运动控制。DreamVideo-2引入混合掩码参考注意力和重加权扩散损失,增强主题表征、平衡主题学习与运动控制。研究团队用WebVid-10M数据集和内部数据支持零样本视频定制任务。DreamVideo-2在主题定制和运动控制方面均优于现有的先进方法,展现在视频定制领域的潜力和实用性。

DreamVideo-baidu092 – 复旦和阿里联合多机构推出的零样本视频定制生成框架  第1张
(图片来源网络,侵删)
DreamVideo-baidu092 – 复旦和阿里联合多机构推出的零样本视频定制生成框架  第2张
(图片来源网络,侵删)