品玩4月20日訊,據阿里通義實驗室官方消息,通義實驗室正式發布語音識別大模型Fun-ASR 1.5,標志著語音技術在多方言與多文化理解領域取得重大突破。該模型基于統一架構,單模型即可無縫覆蓋30種語言及漢語七大方言體系,典型方言場景字錯誤率相對下降56.2%,其中5種方言準確率突破90%。
Fun-ASR 1.5在技術上實現四大核心升級。一是深度適配20余種地區口音,涵蓋中原、西南、粵語等復雜方言場景;二是支持30種主流語言自由混說識別,無需預設語種;三是專項優化古詩詞識別,字符級準確率達97%;四是強化文本歸一化能力,智能處理標點、數字及日期格式,輸出規范文本。
目前,該模型已通過阿里云百煉平臺上線API服務,廣泛應用于縣域教育、地方政務及跨國協作等場景。Fun-ASR 1.5的推出,推動語音識別從“聽得清”邁向“聽得懂”的工業級新階段。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.