VideoTuna是集成多种AI视频生成模型的代码库,支持文本到视频、图像到视频和文本到图像的转换。VideoTuna提供预训练、持续训练、后训练对齐和微调等全面视频生成流程,支持U-Net和DiT架构,并计划推出3D视频VAE及可控面部视频生成模型。VideoTuna能简化视频内容生成,提高视频质量和可控性,降低技术门槛,让非专业人士也能轻松创作高质量视频。

VideoTuna – AI视频生成应用代码库,支持多模型和全面的视频生成流程  第1张
(图片来源网络,侵删)
VideoTuna – AI视频生成应用代码库,支持多模型和全面的视频生成流程  第2张
(图片来源网络,侵删)