T2V-Turbo是一种先进的文本到视频生成模型,由Google、UC Santa Barbara(加利福尼亚大学圣塔芭芭拉分校)、和University of Waterloo(滑铁卢大学)的研究人员共同推出。基于在预训练的T2V模型的一致性蒸馏过程中整合来自多种可微分奖励模型的反馈,实现快速且高质量的视频生成。T2V-Turbo在仅有4步推理的情况下生成的视频质量超过50步迭代的现有模型,在VBench评估平台上得到验证,得分超过Gen-2和Pika等更复杂的模型。T2V-Turbo 引入T2V-Turbo-v2,整合各种监督信号,包括高质量的训练数据、奖励模型反馈和条件指导,到一致性蒸馏过程中,进一步提升视频的视觉质量和文本视频对齐。

T2V-baidu09Turbo – 谷歌开源的文本到视频生成模型  第1张
(图片来源网络,侵删)
T2V-baidu09Turbo – 谷歌开源的文本到视频生成模型  第2张
(图片来源网络,侵删)