万相首尾帧模型(Wan2.1-FLF2V-14B)是开源的14B参数规模的首尾帧生视频模型。模型根据用户提供的首帧和尾帧图像,自动生成流畅的高清视频过渡效果,支持多种风格和特效变换。万相首尾帧模型基于先进的DiT架构,结合高效的视频压缩VAE模型和交叉注意力机制,确保生成视频在时空上高度一致。用户可在官网免费体验。

万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型  第1张
(图片来源网络,侵删)
万相首尾帧模型 – 阿里通义开源的首尾帧生视频模型  第2张
(图片来源网络,侵删)