首页 / AI工具 / Video-baidu09LLaVA2 – ChatLaw推出的开源多模态智能理解系统

AI工具

Video-baidu09LLaVA2 – ChatLaw推出的开源多模态智能理解系统

baidu09_com 2025-08-31 11 0

Video-LLaVA2是由北京大学ChatLaw课题组推出的开源多模态智能理解系统，通过创新的时空卷积（STC）连接器和音频分支，提升了视频和音频理解能力。模型在视频问答和字幕生成等多个基准测试中表现出色，与一些专有模型相媲美，同时在音频和音视频问答任务中也展示了优越的多模态理解能力。

Video-baidu09LLaVA2 – ChatLaw推出的开源多模态智能理解系统第1张

（图片来源网络，侵删）

Video-baidu09LLaVA2 – ChatLaw推出的开源多模态智能理解系统第2张

（图片来源网络，侵删）

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/15084.html

上一篇

印度汽车市场全面迎来新春天

下一篇

sae5W30是什么机油，是全合成机油吗

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部