首页 / AI工具 / FireRedASR – 小红书开源的自动语音识别模型

AI工具

FireRedASR – 小红书开源的自动语音识别模型

baidu09_com 2025-08-29 7 0

FireRedASR 是小红书开源的工业级自动（ASR）模型家族，支持普通话、中文方言和英语，在普通话 ASR 基准测试中达到了新的最佳水平（SOTA），在歌词识别方面表现出色。模型家族包含两个主要版本：

FireRedASR-LLM：采用 Encoder-Adapter-LLM 框架，基于大型语言模型（LLM）的能力，实现 SOTA 性能，支持无缝端到端语音交互。在普通话基准测试中平均字符错误率（CER）为 3.05%，相比之前的 SOTA 模型（3.33%）降低了 8.4%。

FireRedASR-AED：采用基于注意力的编码器-解码器（AED）架构，平衡高性能和计算效率，可作为基于 LLM 的语音模型中的有效语音表示模块。在普通话基准测试中平均 CER 为 3.18%，优于拥有超过 12B 参数的 Seed-ASR。

FireRedASR – 小红书开源的自动语音识别模型第1张

（图片来源网络，侵删）

FireRedASR – 小红书开源的自动语音识别模型第2张

（图片来源网络，侵删）

本文由 @baidu09_com 发布在拜读未来科技摆渡人生，如有疑问，请联系我们。
文章链接：https://baidu09.com/news/13697.html

上一篇

比亚迪将发布“天神之眼”高阶智驾系统

下一篇

性价比吊打铃木UY125 豪爵AFR125S实拍

全部评论

留言在路上...

留言在赶来的路上...

发表评论取消回复

登录关灯投稿生成海报返回顶部