首页 / AI工具 / ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架

AI工具

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架

baidu09_com 2025-08-27 5 0

ACTalker 是用于生成逼真说话人头部视频的端到端视频扩散框架。支持单信号或多信号控制，如音频、表情等。核心架构包括并行 Mamba 结构，通过多个分支利用不同驱动信号分别控制面部区域，基于门控机制和掩码丢弃策略，实现灵活且自然的视频生成。在 CelebV-HQ 数据集上，ACTalker 的 Sync-C 和 Sync-D 分数表现优异，分别为 5.317 和 7.869，FVD-Inc 分数为 232.374，展现了良好的音频同步和视频质量。

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架第1张

（图片来源网络，侵删）

ACTalker – 港科大联合腾讯、清华推出的端到端视频扩散框架第2张

（图片来源网络，侵删）

科大linke 联合国科技大学科大联合培养科克大学合作院校科大联培什么意思 keck institute 科大icl

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/13137.html

上一篇

【每天学点AI】实战仿射变换在人工智能图像处理中的应用

下一篇

阿维塔回应网传“风阻系数造假”：近期将公开测试

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部