<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      阿里甩出AI語音轉(zhuǎn)寫神器!準確率擊敗字節(jié)騰訊,連方言都能寫對

      0
      分享至


      智東西
      作者 王涵
      編輯 心緣

      智東西4月20日報道,剛剛,阿里發(fā)布語音識別大模型Fun-ASR1.5,該模型是千問端到端語音識別大模型的新一代版本。

      該模型可以識別30種語言,覆蓋中文七大方言體系20余種地方口音,并強化了古詩詞誦讀的專項識別。Fun-ASR1.5可以分辨出語音中的抑揚頓挫,重點優(yōu)化了標點預測和文本歸一化能力,可以應用于會議紀要、新聞采訪整理、法律筆錄等場景。

      技術(shù)團隊介紹稱,與Seed-ASR和Tencent-ASR模型相比,F(xiàn)un-ASR1.5在西班牙語、葡萄牙語和英語方面的識別準確率成績較為突出,均在96分以上。


      ▲Fun-ASR1.5在開源多語言測試集中獲得多項SOTA

      中文方言方面,F(xiàn)un-ASR1.5則在四川話、閩南話、長沙話、蘇州話等13種方言識別準確率上,超越Seed-ASR和Tencent-ASR模型。


      ▲Fun-ASR1.5在工業(yè)方言測試集中獲得多項SOTA

      智東西第一時間體驗了其音頻轉(zhuǎn)寫功能。我們上傳了一段三星CES 2026“First Look”演講的錄音音頻。在原音頻中,背景環(huán)境聲音嘈雜,演講人使用英語演講但帶有韓語口音,且錄制聲音較小。

      Fun-ASR1.5不僅將演講內(nèi)容準確完整地轉(zhuǎn)寫了出來,還根據(jù)演講人的語氣和內(nèi)容,對相關(guān)語句進行了大寫強調(diào)處理,提高了會議轉(zhuǎn)寫的效率。


      ▲智東西實測體驗音頻轉(zhuǎn)寫

      目前用戶可以在魔搭社區(qū)體驗該模型,開發(fā)者可以通過阿里云百煉平臺調(diào)用API。

      體驗地址:

      https://modelscope.cn/studios/iic/FunAudio-ASR

      API調(diào)用地址:

      https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr

      一、能識別30種語言,跨語言切換無需預設

      Fun-ASR1.5可精準識別歐洲、東亞、東南亞、南亞及中東主流語種,覆蓋中、英、日、韓、法、德、西、葡、俄、阿拉伯語等30種語言


      韓語:

      https://oss.zhidx.com/0c1334bb064e4804fac98804e8864afd/69e4fc00/uploads/2026/04/69e60878d3303_69e60878cff43_69e60878cff14_%E9%9F%A9%E8%AF%AD.mp3

      ▲ASR結(jié)果:?? ? ??? ?? ? ?? ????, ?? ??? ??? ??? ??? ?? ?? ????.

      馬來語:

      https://oss.zhidx.com/df84f9c8e5b0a14b2d1ad18b2da036b5/69e4fc00/uploads/2026/04/69e6087aa2a56_69e6087a9effe_69e6087a9efbe_%E9%A9%AC%E6%9D%A5%E8%AF%AD.mp3

      ▲ASR結(jié)果:Kejayaan projek ini tidak dapat dipisahkan daripada usaha pasukan, terutamanya kerja keras siang malam oleh jabatan penyelidikan dan pembangunan.

      西班牙語:

      https://oss.zhidx.com/4ec3a38deaef8d34abd6e48199584b27/69e4fc00/uploads/2026/04/69e60884522aa_69e608844f3b1_69e608844f384_%E8%A5%BF%E7%8F%AD%E7%89%99%E8%AF%AD.mp3

      ▲ASR結(jié)果:La diversidad cultural es un tesoro invaluable para la sociedad humana, y debemos respetar y proteger todas las tradiciones culturales.

      在跨語言切換(Code-Switching)場景下,F(xiàn)un-ASR1.5可以做到無需預設語種標簽,就自動識別并切換,保證轉(zhuǎn)寫的準確性。比如,同一段對話里夾雜多種語言,模型也能準確識別,無需提前告訴它接下來要說哪種語言。

      英語日語切換:

      https://oss.zhidx.com/02e1ae3cb2276d7e9741c3c7ad9dd267/69e4fc00/uploads/2026/04/69e6088478b93_69e60884757af_69e6088475780_%E8%8B%B1%E8%AF%AD%E6%97%A5%E8%AF%AD%E5%88%87%E6%8D%A2.mp3

      ▲ASR結(jié)果:We’ve all had that experience of finally visiting a place we’ve dreamed about for years,only to find that it doesn’t quite live up to our expectations.There’s even a term for this in one of the most visited cities in the world,Paris Syndrome.何年も前から行きたかった場所をやっと訪れてみたら、思っていたほどではなかったという経験は誰しもあることだと思います。

      技術(shù)團隊介紹稱,這種多語言能力,源于模型的架構(gòu)和訓練創(chuàng)新。Fun-ASR1.5采取MoE(混合專家)架構(gòu),模型內(nèi)部可以分工協(xié)作,聽到特定語言時僅激活相關(guān)部分進行處理,因而更為靈活高效。

      同時,技術(shù)團隊在模型的訓練階段分級、分階段地使用精準數(shù)據(jù),也可以使模型更能適配真實世界中的復雜語音場景。

      二、錯字率下降56.2%,古詩詞準確率達97%

      在中文本土化方面,基于數(shù)十萬小時真實方言語音數(shù)據(jù)訓練,技術(shù)團隊稱,F(xiàn)un-ASR1.5的平均字錯誤率(CER)相比上一版本下降56.2%


      上海話:

      https://oss.zhidx.com/4d98af0e967bd26bf6003b68544ccbe8/69e4fc00/uploads/2026/04/69e6087b09883_69e6087b06100_69e6087b060d2_%E4%B8%8A%E6%B5%B7%E8%AF%9D.mp3

      ▲ASR結(jié)果:現(xiàn)在發(fā)展了蠻快個現(xiàn)在伊拉用戶算大戶唻。

      客家話:

      https://oss.zhidx.com/bb79e377f42d86250ca3f0475a018be8/69e4fc00/uploads/2026/04/69e60879186b9_69e6087914434_69e60879143ff_%E5%AE%A2%E5%AE%B6%E8%AF%9D.mp3

      ASR結(jié)果:呃,那些吃的不就這樣的土筍凍啊,我覺得不好吃。

      閩南話:

      https://oss.zhidx.com/204cdf65dd037809c3f95eb5636ea49c/69e4fc00/uploads/2026/04/69e6087ad2b6b_69e6087acf672_69e6087acf636_%E9%97%BD%E5%8D%97%E8%AF%9D.mp3

      ▲ASR識別結(jié)果:但是一個人若是兩三兩百箍一百外箍安無算貴吧,吼自助餐啊,啊你也有肉咯也有菜咯也有水果咯也有甜點咯,啥物計有咯。

      粵語:

      https://oss.zhidx.com/0e662ae422f6836cfa6309c2abcaf4a4/69e4fc00/uploads/2026/04/69e60884aeeea_69e60884a5c5e_69e60884a5c24_%E7%B2%A4%E8%AF%AD.mp3

      ▲ASR結(jié)果:誒,其實可能有時候覺得去超市都幾遠下噶。

      此外,該模型不僅聽得懂,還能“寫得地道”,F(xiàn)un-ASR1.5可原汁原味還原方言,如上海話的“儂”、蘇州話“倷”(均指“你”),為下游模型處理方言文字提供了準確的基礎(chǔ)語料。

      不同于現(xiàn)代口語,文言語法特殊、典故生僻字繁多,具有不少挑戰(zhàn)。例如,文言語法簡練,省略主謂賓;押韻嚴格,節(jié)奏固定(如五言、七言律詩);多用典故、異體字、古今異義詞;誦讀時存在拖腔、停頓、吟詠等非自然語流特征。

      Fun-ASR1.5對中文古詩詞識別進行專項優(yōu)化。研究團隊構(gòu)建了先秦至近代的古詩詞語音-文本對齊語料庫,涵蓋《詩經(jīng)》《楚辭》、李白杜甫詩集、蘇軾辛棄疾詞作等經(jīng)典文本的真人誦讀錄音。

      在內(nèi)部評測集中,F(xiàn)un-ASR1.5對古詩詞的字符級準確率達到97%,可應用于國學在線課程和有聲詩詞,助力文化傳承。

      https://oss.zhidx.com/b0578e51ee3b8b5f98603c402f87b730/69e4fc00/uploads/2026/04/69e6087879bee_69e608787658a_69e6087876557_%E5%8F%A4%E8%AF%97%E8%AF%8D1.mp3

      ▲ASR結(jié)果:蓬山此去無多路,青鳥殷勤為探看。

      https://oss.zhidx.com/691a0349d3fdd374a0eebc4a2233d31f/69e4fc00/uploads/2026/04/69e60878ae3f2_69e60878aac04_69e60878aabd4_%E5%8F%A4%E8%AF%97%E8%AF%8D2.mp3

      ▲ASR結(jié)果:子夏曰,博學而篤志,切問而近思,仁在其中矣。

      三、能自動插入標點符號,口語表達一鍵規(guī)范

      語音識別最終都要落腳于生成可直接使用的文本,F(xiàn)un-ASR1.5在后處理環(huán)節(jié)也重點優(yōu)化了標點預測和文本歸一化兩項能力,大幅降低了會議紀要、新聞采訪整理、法律筆錄等場景的后期人工校對和編輯成本,具體如下:

      1、標點預測:更加智能模型基于上下文語義自動插入逗號、句號、問號、感嘆號等標點,使轉(zhuǎn)寫結(jié)果接近書面表達。例如:

      輸入語音:“今天天氣怎么樣啊我想出去走走但又怕下雨”輸出文本:“今天天氣怎么樣啊?我想出去走走,但又怕下雨。”

      2、文本歸一化(ITN)表現(xiàn):進一步提升將口語中的非標準表達自動轉(zhuǎn)換為規(guī)范格式:

      數(shù)字:“三千五百六十二” → “3562”

      日期:“二零二六年三月二十九號” → “2026年3月29日”

      金額:“五萬八千塊” → “58000元”

      電話:“幺三八零零幺三八零零零” → “13800138000”

      結(jié)語:AI語音模型正穩(wěn)步落地應用

      會議紀要、法律筆錄等場景,長期處于“半自動”應用狀態(tài),核心痛點是AI識別結(jié)果需人工進行大量校對,不僅未能有效提升工作效率,還影響了實際工作推進。

      阿里Fun-ASR1.5針對這一痛點進行定向優(yōu)化,補齊了傳統(tǒng)語音識別的部分短板,也降低了各行業(yè)引入AI語音技術(shù)的門檻。

      目前,科大訊飛、百度、字節(jié)等企業(yè)的語音模型均在持續(xù)迭代,AI語音大模型正從技術(shù)研發(fā)逐步向?qū)嶋H應用推進,語音識別作為AI與人交互的重要入口,其實用性直接關(guān)系到行業(yè)落地的實際效果。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      央國企的幾大亂象:關(guān)系戶橫行、巨大的虛假繁榮......

      央國企的幾大亂象:關(guān)系戶橫行、巨大的虛假繁榮......

      燈錦年
      2026-04-22 17:16:25
      出色的即興公眾講話,要學會五借

      出色的即興公眾講話,要學會五借

      說情感世界
      2026-04-23 08:00:24
      從“恐俄”到“祛魅”:俄烏戰(zhàn)爭如何終結(jié)了歐洲的百年心魔

      從“恐俄”到“祛魅”:俄烏戰(zhàn)爭如何終結(jié)了歐洲的百年心魔

      民間胡扯老哥
      2026-04-22 04:47:09
      私家車主怒斥乘客:我不是貨拉拉,令人捧腹的神回復來了!

      私家車主怒斥乘客:我不是貨拉拉,令人捧腹的神回復來了!

      娛樂圈的筆娛君
      2026-04-22 15:56:55
      35歲下海經(jīng)商,55歲娶孔東梅,69歲已是百億富豪,長子成他的驕傲

      35歲下海經(jīng)商,55歲娶孔東梅,69歲已是百億富豪,長子成他的驕傲

      冷紫葉
      2026-04-21 16:09:57
      黃渤和鄧超為什么無戲可拍了?

      黃渤和鄧超為什么無戲可拍了?

      閑人電影
      2026-04-16 18:55:11
      一季度核心寬基申贖數(shù)據(jù)曝光,“國家隊”動向大揭秘|基金放大鏡

      一季度核心寬基申贖數(shù)據(jù)曝光,“國家隊”動向大揭秘|基金放大鏡

      界面新聞
      2026-04-22 20:07:06
      張凌赫這波“本名回歸”太狠了,竟把內(nèi)娛玩成了“賽博穿越”?

      張凌赫這波“本名回歸”太狠了,竟把內(nèi)娛玩成了“賽博穿越”?

      科學發(fā)掘
      2026-04-23 06:45:36
      熱菲尼奧單刀笑噴了!李金羽坐得太穩(wěn)了 球迷:三鎮(zhèn)咋贏的大連?

      熱菲尼奧單刀笑噴了!李金羽坐得太穩(wěn)了 球迷:三鎮(zhèn)咋贏的大連?

      刀鋒體育
      2026-04-23 09:55:43
      施明靈堂鬧劇!李泳漢得意微笑完勝離場 ,81 歲鼎爺心力交瘁瘦脫相

      施明靈堂鬧劇!李泳漢得意微笑完勝離場 ,81 歲鼎爺心力交瘁瘦脫相

      草莓解說體育
      2026-04-23 07:25:41
      馬龍許昕來成都備戰(zhàn),樊振東為何不回來幫忙?國乒出征直播引爭議

      馬龍許昕來成都備戰(zhàn),樊振東為何不回來幫忙?國乒出征直播引爭議

      體育大學僧
      2026-04-22 10:20:59
      金價:大家不用等待!不出意外,金價或?qū)v史重演

      金價:大家不用等待!不出意外,金價或?qū)v史重演

      次元君情感
      2026-04-23 06:39:45
      北京首鋼拒絕爆冷!超級外援CBA首秀,曾凡博出戰(zhàn),央視直播

      北京首鋼拒絕爆冷!超級外援CBA首秀,曾凡博出戰(zhàn),央視直播

      體壇瞎白話
      2026-04-23 10:10:09
      人類滅絕大局已定?科學家算出人類滅絕日期,我們能僥幸存活嗎?

      人類滅絕大局已定?科學家算出人類滅絕日期,我們能僥幸存活嗎?

      混沌錄
      2026-04-22 19:51:05
      遭證監(jiān)會立案,蘭石重裝等4股均跌停

      遭證監(jiān)會立案,蘭石重裝等4股均跌停

      北京商報
      2026-04-23 10:11:28
      隊記:開拓者曾有意面試名帥邁克-馬龍,但只愿給400萬美元年薪

      隊記:開拓者曾有意面試名帥邁克-馬龍,但只愿給400萬美元年薪

      懂球帝
      2026-04-22 22:21:01
      朝鮮男人煙不離手,金正恩抽什么牌子的香煙?一包煙的價格是多少

      朝鮮男人煙不離手,金正恩抽什么牌子的香煙?一包煙的價格是多少

      番外行
      2026-04-16 08:25:40
      拼多多暴力抗法——到底有多囂張?

      拼多多暴力抗法——到底有多囂張?

      細雨中的呼喊
      2026-04-22 21:55:56
      美媒:中國簡直“逆天”!竟想用電磁力,把月球上的氦-3運回地球

      美媒:中國簡直“逆天”!竟想用電磁力,把月球上的氦-3運回地球

      阿庫財經(jīng)
      2026-04-23 07:05:04
      國民黨臺北市松信區(qū)議員初選出爐!藍營“最美發(fā)言人”出線

      國民黨臺北市松信區(qū)議員初選出爐!藍營“最美發(fā)言人”出線

      海峽導報社
      2026-04-22 11:52:17
      2026-04-23 12:59:00
      智東西 incentive-icons
      智東西
      智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應用帶來的千行百業(yè)產(chǎn)業(yè)變革。
      11668文章數(shù) 117037關(guān)注度
      往期回顧 全部

      科技要聞

      車沒賣爆,利潤卻大漲,特斯拉發(fā)布財報

      頭條要聞

      媒體:當下越南"極度不安" 蘇林訪華簽文件對沖"焦慮"

      頭條要聞

      媒體:當下越南"極度不安" 蘇林訪華簽文件對沖"焦慮"

      體育要聞

      萊斯特城降入英甲,一場虧麻了的豪賭

      娛樂要聞

      《凌探未來》公益紀錄片今日發(fā)布

      財經(jīng)要聞

      全球第一個國家宣布:儲備6月耗盡

      汽車要聞

      長安"1445"戰(zhàn)略:一張走向"世界長安"的行軍地圖

      態(tài)度原創(chuàng)

      旅游
      藝術(shù)
      本地
      公開課
      軍事航空

      旅游要聞

      男子玩“窩囊版”蹦極摔傷后起訴,景區(qū)通報:該案明日第二次開庭

      藝術(shù)要聞

      生完7個女兒后,60歲的她被香奈兒邀請走高定秀!

      本地新聞

      SAGA GIRLS 2026女團選秀

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普宣布延長停火 伊朗表態(tài)

      無障礙瀏覽 進入關(guān)懷版