HumanVid是香港中文大学和上海人工智能实验室共同推出的高质量数据集,专为人类图像动画训练设计。结合了现实世界视频和合成数据,通过精心设计的规则筛选高质量视频,并使用2D姿势估计和SLAM技术进行注释。HumanVid旨在提高视频生成的控制性和稳定性,通过基线模型CamAnimate验证了其有效性,在控制人物姿势和摄像机运动方面达到了先进水平。项目计划在2024年9月底公开代码和数据集。

HumanVid – 专为人类图像动画生成而设计的高质量数据集  第1张
(图片来源网络,侵删)
HumanVid – 专为人类图像动画生成而设计的高质量数据集  第2张
(图片来源网络,侵删)