MiniCPM-o 2.6 是MiniCPM-o 系列最新、性能最佳的多模态大模型,具有 8B 参数量。MiniCPM-o 2.6在视觉、语音和多模态直播等多个领域表现出色,达到与 GPT-4o 相当的性能水平。模型支持实时双语语音识别,超越了 GPT-4o 实时识别的表现,支持 30 多种语言。MiniCPM-o 2.6 基于先进的 token 密度技术,处理 180 万像素图像仅产生 640 个 tokens,显著提高推理速度和效率。MiniCPM-o 2.6支持在 iPad 等端侧设备上高效运行多模态直播。

MiniCPM-baidu09o 2.6 – 面壁智能开源的多模态大模型,性能媲美GPT-baidu094o  第1张
(图片来源网络,侵删)
MiniCPM-baidu09o 2.6 – 面壁智能开源的多模态大模型,性能媲美GPT-baidu094o  第2张
(图片来源网络,侵删)