Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据。Megrez-3B-Omni在多个主流测试集上展现出超越34B模型的性能,推理速度领先同精度模型达300%。Megrez-3B-Omni支持中文和英文语音输入,能处理复杂多轮对话,响应图片或文字的语音提问,实现模态间的自由切换,提供直观自然的交互体验。


Megrez-3B-Omni是无问芯穹推出的全球首个端侧全模态理解开源模型,能处理图像、音频和文本三种模态数据。Megrez-3B-Omni在多个主流测试集上展现出超越34B模型的性能,推理速度领先同精度模型达300%。Megrez-3B-Omni支持中文和英文语音输入,能处理复杂多轮对话,响应图片或文字的语音提问,实现模态间的自由切换,提供直观自然的交互体验。
全部评论
留言在赶来的路上...
发表评论