通义万相2.2(Wan2.2)是阿里巴巴开源的先进模型。共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-5B)三款模型,总参数量达270亿。模型首次引入混合专家(MoE)架构,有效提升生成质量和计算效率,同时首创电影级美学控制系统,能精准控制光影、色彩、构图等美学效果。此次开源的5B参数紧凑视频生成模型,支持文本和图像生成视频,能在消费级显卡上运行,基于高效的3D VAE架构,实现高压缩率和快速生成高清视频的能力。目前,开发者可通过GitHub、HuggingFace等平台获取模型和代码,企业可通过调用API进行应用开发,用户能在官网和直接体验。

通义万相Wan2.2 – 阿里开源的AI视频生成模型  第1张
(图片来源网络,侵删)
通义万相Wan2.2 – 阿里开源的AI视频生成模型  第2张
(图片来源网络,侵删)