MirrorMe是阿里通义实验室推出的实时、高保真音频驱动肖像动画框架。框架基于LTX视频模型,结合三项关键创新,身份注入机制、音频驱动控制模块和渐进式训练策略,解决实时生成高保真、时间一致动画视频的挑战。MirrorMe在EMTD基准测试中登顶,展现出卓越的图像保真度、唇形同步精度和时间稳定性,具备高效推理速度,满足实时生成需求,为电商直播等应用场景提供强大的技术支持。

MirrorMe – 阿里通义推出的音频驱动肖像动画框架  第1张
(图片来源网络,侵删)
MirrorMe – 阿里通义推出的音频驱动肖像动画框架  第2张
(图片来源网络,侵删)