万相2.1是阿里推出的升级版本。基于自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现中文文字视频生成功能。升级后的通义万相在VBench榜单上荣登第一。万相2.1能稳定展现复杂人物运动,逼真还原现实物理规律,一键生成中英文视频特效,具备强大的影视质感与艺术风格转换能力。万相2.1支持文生组图,采用IC-LoRA图像生成训练方法,增强文本到图像的上下文能力,轻松实现关联图像间的组合生成。

文字特效

万相2.1 – 通义万相最新推出的视频生成模型  第1张
(图片来源网络,侵删)

运动

万相2.1 – 通义万相最新推出的视频生成模型  第2张
(图片来源网络,侵删)

特效

写实

人物特写

多人场景/大场面/多镜头