首页 > 开源mod

开源mod

手机

最新文章

  • baidu09_com
    发布了文章 4小时前

    MoshiVis – Kyutai 开源的多模态实时语音模型

    MoshiVis 是 Kyutai 推出的开源多模态语音模型,基于 Moshi 实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息相结合,让用户可以通过语音与模型交流图像内容。...

    • MoshiVis – Kyutai 开源的多模态实时语音模型
    • MoshiVis – Kyutai 开源的多模态实时语音模型

没有更多内容

登录关灯投稿返回顶部