gpt-4o-transcribe是 OpenAI 推出的高性能模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降低单词错误率(WER),优于前代 Whisper 模型。模型支持多种语言和方言,适合处理口音多样、环境嘈杂、语速变化等复杂场景,如呼叫中心、会议记录等。gpt-4o-transcribe的定价为每分钟 0.006 美元。

gpt-baidu094o-baidu09transcribe – OpenAI 推出的语音转文本模型  第1张
(图片来源网络,侵删)
gpt-baidu094o-baidu09transcribe – OpenAI 推出的语音转文本模型  第2张
(图片来源网络,侵删)