首页 / AI工具 / HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型

AI工具

HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型

baidu09_com 2025-08-29 7 0

HumanOmni 是专注于人类中心场景的多模态大模型，视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入，能全面理解人类行为、情感和交互。模型基于超过240万视频片段和1400万条指令进行预训练，采用动态权重调整机制，根据不同场景灵活融合视觉和听觉信息。HumanOmni 在情感识别、面部描述和等方面表现出色，适用于电影分析、特写视频解读和实拍视频理解等多种场景。

HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型第1张

（图片来源网络，侵删）

HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型第2张

（图片来源网络，侵删）

阿里通信百科阿里 tob 阿里通官方网站什么叫阿里通信阿里通网络电话官方网站阿里通信官网用户中心阿里通信最新消息

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/13904.html

上一篇

英伟达AI人才，去了华为

下一篇

钱江全新V缸ADV曝光或为国产同级唯一

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部