首页 / AI工具 / FLOAT – 基于流匹配的音频驱动说话人头像生成模型

AI工具

FLOAT – 基于流匹配的音频驱动说话人头像生成模型

baidu09_com 2025-08-28 6 0

FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型，基于流匹配生成模型，学习运动潜在空间实现高效的时间一致性运动设计。模型基于Transformer架构的向量场预测器，实现帧间时间一致性，支持语音驱动的情感增强，让生成的说话动作更自然、富有表现力。FLOAT在视觉质量、运动保真度和生成效率方面均超越现有的基于扩散和非扩散的方法，达到业界领先水平。

FLOAT – 基于流匹配的音频驱动说话人头像生成模型第1张

（图片来源网络，侵删）

FLOAT – 基于流匹配的音频驱动说话人头像生成模型第2张

（图片来源网络，侵删）

float.parsefloat float语句 float(*p)(float)float_complex float用%lf float对应输出 float详解

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/13654.html

上一篇

专为人形机器人应用打造，助力具身智能行业发展，泰科机器人关节模组持续升级！

下一篇

复古骑士新地标凯旋摩托新店落户海淀

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部