Whisper-baidu09Medusa – aiOla推出的开源AI语音识别模型

baidu09_com 2025-08-31 8 0

Whisper-Medusa是aiOla推出的开源AI语音识别模型，结合了OpenAI的Whisper技术与aiOla的创新，Whisper-Medusa引入了多头注意力机制，实现了并行处理，显著提升了推理速度，平均提速达到50%。模型专为英语优化，支持超过100种语言，适用于翻译、金融、旅游等多个行业。Whisper-Medusa在LibriSpeech数据集上训练，有出色的性能和准确度，通过弱监督方法和训练技巧，减少了对大量手动标注数据的依赖。aiOla计划进一步扩展模型的多头注意力机制，以实现更高的效率。