聯發科技集團旗下的聯發創新基地,推出一款全新開源語音辨識模型 MR Breeze ASR 25,主打更能理解台灣用語與口音的本土化 AI 模型。這套模型是建立在 OpenAI Whisper 架構之上,針對台灣常見的語言使用習慣進行強化,特別在中英文混用(code-switching)的情境中,辨識準確度比 Whisper 高出 56%,整體精準度也提升近 10%。
聯發創新基地指出,市面上的語音辨識技術雖不斷進步,但對於台灣在地語言的支援仍有明顯落差。例如像「發生什麼事」常被辨識為「花生什麼事」,這種偏差對日常使用會造成困擾。為此,他們特別強化語料訓練,讓模型能「聽得懂台灣人講話」。
MR Breeze ASR 25 採用 Apache 2.0 授權釋出,使用上更具彈性,適合廣泛應用於各類裝置端創新,例如智慧客服、語音控制、文字輸入輔助等。此次模型也已於 HuggingFace 平台開放下載,有興趣的開發者與研究者可自由使用與參與改進。
除了語音辨識,聯發創新基地自 2025 年起也已陸續開源多種繁體中文 AI 模型,包括整合視覺辨識的語言模型(V-LLM)、針對台灣口音調整的文字轉語音模型(TTS),以及支援函式呼叫功能的模型架構。這些工具的出現,為繁體中文語系的 AI 發展注入更多可能,也提升了 AI 在在地應用的實用性。





