![]()
劃重點(diǎn):
1、第八屆世界聲博會(huì)暨全球1024開(kāi)發(fā)者節(jié)上,科大訊飛董事長(zhǎng)劉慶峰判斷,AI產(chǎn)業(yè)紅利兌現(xiàn)需聚焦自主可控、軟硬一體、行業(yè)縱深和個(gè)性化四大核心。作為2025年訊飛新出品的AI翻譯軟件,訊飛翻譯APP的迭代煥新尤為引人關(guān)注。
2、一個(gè)革命性的技術(shù)突破,在于非自回歸語(yǔ)音大模型架構(gòu)。這種端到端架構(gòu)與傳統(tǒng)的級(jí)聯(lián)翻譯方案形成了鮮明的技術(shù)代際差異。
3、訊飛翻譯APP迭代的核心,是同聲傳譯功能的全面進(jìn)化。包括四大核心優(yōu)化點(diǎn):引擎煥新、實(shí)時(shí)分享、記錄留存、懸浮字幕,使其從一個(gè)單純的翻譯工具,進(jìn)化為支持協(xié)作的新范式。
4、科大訊飛的戰(zhàn)略并非局限于APP,軟硬一體是其AI在真實(shí)世界應(yīng)用落地的關(guān)鍵。翻譯功能,正是軟硬一體戰(zhàn)略的最佳實(shí)踐場(chǎng)。同時(shí),科大訊飛此前還推出了訊飛翻譯SaaS平臺(tái),提供了從專業(yè)翻譯服務(wù)到數(shù)據(jù)聚合管理的一站式解決方案。
5、科大訊飛正在利用自主可控的底層大模型技術(shù),軟硬一體和更懂你的AI,從根本上重塑實(shí)時(shí)翻譯的體驗(yàn)。
作者 林易
編輯重點(diǎn)君
2025年,全球人工智能產(chǎn)業(yè)正集體邁過(guò)技術(shù)奇點(diǎn),進(jìn)入紅利兌現(xiàn)時(shí)刻。大模型的發(fā)展焦點(diǎn),已從參數(shù)競(jìng)賽轉(zhuǎn)向解決真實(shí)世界問(wèn)題的規(guī)模化落地。
在日益緊密的全球化協(xié)作、旅行和信息消費(fèi)中,跨語(yǔ)言溝通始終是最高頻的剛需之一,也是一道難以逾越的屏障。傳統(tǒng)的翻譯工具在處理實(shí)時(shí)對(duì)話、高噪環(huán)境和專業(yè)領(lǐng)域時(shí),長(zhǎng)期面臨延遲、失準(zhǔn)和體驗(yàn)割裂的挑戰(zhàn)。
行業(yè)需要更根本的解決方案。11月6日,科大訊飛在第八屆世界聲博會(huì)暨全球1024開(kāi)發(fā)者節(jié)上,給出了自己的答案。在這場(chǎng)以《更懂你的AI》為主題的發(fā)布會(huì)上,科大訊飛董事長(zhǎng)劉慶峰判斷,AI產(chǎn)業(yè)紅利兌現(xiàn)需聚焦自主可控、軟硬一體、行業(yè)縱深和個(gè)性化四大核心。
在這一戰(zhàn)略框架下,科大訊飛發(fā)布了深度推理大模型訊飛星火X1.5,以及一系列AI產(chǎn)品。其中,作為2025年訊飛新出品的AI翻譯軟件,訊飛翻譯APP的迭代煥新尤為引人關(guān)注。
科大訊飛的路徑十分清晰:利用自主可控的底層大模型技術(shù),軟硬一體和更懂你的AI,從根本上重塑實(shí)時(shí)翻譯的體驗(yàn)。
為翻譯而生的根技術(shù)
任何一款顛覆性的應(yīng)用,都源于底層根技術(shù)的突破。訊飛翻譯APP體驗(yàn)革新的背后,是科大訊飛在AI翻譯技術(shù)和基礎(chǔ)模型兩條戰(zhàn)線上同時(shí)取得的進(jìn)展。
一個(gè)革命性的技術(shù)突破,在于非自回歸語(yǔ)音大模型架構(gòu)。實(shí)時(shí)翻譯的瓶頸不僅在翻譯的準(zhǔn)度,更在語(yǔ)音識(shí)別的速度。傳統(tǒng)的自回歸模型需要逐字順序生成文本,天然存在延遲。
科大訊飛此次全球首發(fā)的非自回歸語(yǔ)音大模型架構(gòu)(即端到端語(yǔ)音同傳大模型的核心技術(shù)之一),能夠并行、一次性輸出整個(gè)文本序列,帶來(lái)了推理效率的大幅階躍:效果相對(duì)提升16%,而推理成本下降了520%。這項(xiàng)新技術(shù)也為訊飛翻譯APP實(shí)現(xiàn)“語(yǔ)音秒譯”提供了堅(jiān)實(shí)的技術(shù)前提。
![]()
這種端到端架構(gòu)與傳統(tǒng)的級(jí)聯(lián)翻譯方案形成了鮮明的技術(shù)代際差異。傳統(tǒng)方案將任務(wù)拆解為“識(shí)別、翻譯、合成”三個(gè)獨(dú)立模塊,串行處理導(dǎo)致時(shí)延疊加、信息損失和錯(cuò)誤累積。
科大訊飛的端到端同傳大模型則徹底顛覆了這一流程,它使用統(tǒng)一大模型模仿人工口譯思維鏈,實(shí)現(xiàn)了全局最優(yōu)的翻譯質(zhì)量,能深度整合上下文、傳遞源語(yǔ)言韻律,并達(dá)到2秒的極致響應(yīng),為實(shí)時(shí)交流提供了堅(jiān)實(shí)的技術(shù)保障。
技術(shù)路線的選擇決定了未來(lái)。科大訊飛選擇了更具挑戰(zhàn)性的端到端路線并成功實(shí)現(xiàn)商業(yè)化,而傳統(tǒng)級(jí)聯(lián)方案的性能上限已被固有缺陷鎖定。
科大訊飛的領(lǐng)先優(yōu)勢(shì)不僅在于技術(shù)先進(jìn)性,更是全方位的:從率先發(fā)布搶占時(shí)間先機(jī),到9個(gè)月內(nèi)3次升級(jí)的快速迭代;從服務(wù)百萬(wàn)用戶與超42萬(wàn)場(chǎng)會(huì)議積累的海量數(shù)據(jù),到全線產(chǎn)品應(yīng)用端到端技術(shù)的完整布局,再到與產(chǎn)業(yè)鏈緊密合作的深度生態(tài)。這些綜合優(yōu)勢(shì)共同疊加,使其在AI翻譯領(lǐng)域建立了穩(wěn)固的地位。
如果說(shuō)領(lǐng)先的端到端架構(gòu)解決了“快”與“準(zhǔn)”的全局體驗(yàn),那么垂直領(lǐng)域的深度則依賴專業(yè)的同傳大模型。星火語(yǔ)音同傳大模型已升級(jí)至2.0版本,覆蓋超8萬(wàn)個(gè)專業(yè)詞匯,大幅提升了專業(yè)領(lǐng)域的準(zhǔn)確性。
而承載上述所有翻譯技術(shù)突破的堅(jiān)實(shí)底座,則源于自主可控的星火X1.5大模型。自主可控是科大訊飛的基石。劉慶峰在發(fā)布會(huì)上表示,訊飛星火是目前中國(guó)主流大模型中,唯一基于全國(guó)產(chǎn)算力訓(xùn)練的通用大模型。在國(guó)產(chǎn)算力平臺(tái)上訓(xùn)練先進(jìn)的MoE(Mixture of Experts)架構(gòu),科大訊飛已攻克全鏈路訓(xùn)練效率等難關(guān)。
此次發(fā)布的訊飛星火X1.5,推理效率相比X1提升了100%,更重要的是,它為翻譯應(yīng)用提供了強(qiáng)大的多語(yǔ)言能力,目前可支持130多種語(yǔ)言,在拉美、東盟等地區(qū)的14個(gè)重點(diǎn)語(yǔ)言上效果領(lǐng)先。
根據(jù)國(guó)際數(shù)據(jù)公司(IDC)發(fā)布的《中國(guó)AI翻譯技術(shù)評(píng)估》,科大訊飛在AI翻譯速度、效果、專業(yè)度等八大核心維度評(píng)測(cè)中均為行業(yè)第一,其中六項(xiàng)斬獲滿分。堅(jiān)實(shí)的技術(shù)底座,讓訊飛翻譯APP的體驗(yàn)重塑成為可能。
所聽(tīng)即所譯的實(shí)時(shí)體驗(yàn)
利用自研的先進(jìn)技術(shù),訊飛翻譯APP 旨在從兩個(gè)核心的實(shí)時(shí)場(chǎng)景——同聲傳譯和音視頻翻譯出發(fā),徹底改變用戶的跨語(yǔ)言溝通工作流。
本次1024開(kāi)發(fā)者節(jié)期間,訊飛翻譯APP迭代的核心,是同聲傳譯功能的全面進(jìn)化。
在傳統(tǒng)認(rèn)知中,同傳是高度專業(yè)化的服務(wù),或依賴昂貴的人力,或受限于復(fù)雜的硬件。而訊飛翻譯APP則希望將“如譯員在側(cè)”的高效同傳體驗(yàn),賦能給每一個(gè)需要進(jìn)行跨語(yǔ)言會(huì)議、課堂學(xué)習(xí)和演講的普通用戶。
![]()
此次煥新,訊飛翻譯APP圍繞同傳功能構(gòu)建了四大核心優(yōu)化點(diǎn),使其從一個(gè)單純的翻譯工具,進(jìn)化為支持協(xié)作的新范式,比如:
引擎煥新:搭載全新的語(yǔ)音同傳大模型,帶來(lái)更準(zhǔn)、更快、更流暢的實(shí)時(shí)翻譯體驗(yàn)。
實(shí)時(shí)分享:支持一鍵分享實(shí)時(shí)同傳內(nèi)容。這意味著,即便同事或朋友在遠(yuǎn)程參會(huì),也能通過(guò)分享卡片打造的同傳頻道,同步查看實(shí)時(shí)譯文,確保關(guān)鍵信息不再遺漏。
記錄留存:同傳內(nèi)容(包括音頻與文本)會(huì)自動(dòng)保存并支持導(dǎo)出,歷史記錄可隨時(shí)回看。這解決了實(shí)時(shí)會(huì)議中信息易揮發(fā)、難追溯的痛點(diǎn),便于后續(xù)復(fù)盤(pán)和整理。
懸浮字幕:用戶無(wú)需停留在APP界面,即可通過(guò)懸浮字幕查看同傳內(nèi)容。這使得“邊聽(tīng)譯邊處理其他事務(wù)”成為可能,大幅提升了多任務(wù)處理效率。
在1024開(kāi)發(fā)者節(jié)的直播演示中,訊飛翻譯APP產(chǎn)品經(jīng)理展示了全球化辦公的典型場(chǎng)景:面對(duì)全英文會(huì)議,打開(kāi)“同聲傳譯”功能,發(fā)言人話音剛落,精準(zhǔn)的譯文便實(shí)時(shí)呈現(xiàn)于屏幕。
如果說(shuō)同傳功能解決了主動(dòng)溝通的難題,那么沉浸式翻譯則攻克了被動(dòng)接收信息的壁壘。
用戶在日常生活中,面臨大量無(wú)字幕的外文音視頻內(nèi)容,如外文播客、海外影視劇、國(guó)際直播或應(yīng)用。科大訊飛的解決方案是沉浸式翻譯,其核心是“所聽(tīng)即所譯,沉浸不中斷”。
該功能啟動(dòng)后,訊飛翻譯APP會(huì)保持后臺(tái)運(yùn)行,實(shí)時(shí)翻譯手機(jī)上正在播放的任何音頻或視頻內(nèi)容,并以懸浮字幕窗的形式呈現(xiàn)譯文。用戶可以靈活調(diào)整字幕窗口,選擇雙語(yǔ)對(duì)照或只看譯文,真正實(shí)現(xiàn)邊看邊譯的無(wú)縫體驗(yàn)。
在11月6日的1024發(fā)布會(huì)直播期間,訊飛翻譯APP就為全球觀眾免費(fèi)提供了這一功能,支持中文與英、日、韓、法、俄等15種語(yǔ)種的互譯,讓全球觀眾無(wú)障礙觀看。
從解決會(huì)議痛點(diǎn)的同聲傳譯,到打破信息繭房的沉浸式翻譯,訊飛翻譯APP正在借助大模型的能力,將翻譯體驗(yàn)推向一個(gè)更實(shí)時(shí)、更無(wú)縫的新高度。
軟硬一體的戰(zhàn)略縱深
科大訊飛的戰(zhàn)略并非局限于APP。劉慶峰在發(fā)布會(huì)上強(qiáng)調(diào),軟硬一體是AI在真實(shí)世界應(yīng)用落地的關(guān)鍵。大模型需要從手機(jī)、電腦走向機(jī)器人和更多的智能終端。
翻譯功能,正是“軟硬一體”戰(zhàn)略的最佳實(shí)踐場(chǎng)。要實(shí)現(xiàn)精準(zhǔn)的實(shí)時(shí)翻譯,第一步是解決嘈雜環(huán)境下的“聽(tīng)清”問(wèn)題。為此,科大訊飛發(fā)布了“AI+麥克風(fēng)陣列技術(shù)”,并將其應(yīng)用到一系列硬件中:
訊飛智能辦公本X5:首創(chuàng)上4下4環(huán)麥克風(fēng)大陣列,根據(jù)現(xiàn)場(chǎng)視頻演示結(jié)果,在高分貝和遠(yuǎn)距離環(huán)境下的轉(zhuǎn)寫(xiě)效果遠(yuǎn)超iPhone17 pro。
訊飛AI翻譯耳機(jī):首創(chuàng)單耳三麥多感融合降噪系統(tǒng),采用“骨導(dǎo)+氣導(dǎo)”雙拾音,在地鐵等嘈雜環(huán)境準(zhǔn)確率達(dá)97.1%,遠(yuǎn)超AirPods 3。
訊飛雙屏翻譯機(jī)2.0:實(shí)現(xiàn)1米以內(nèi)穹頂式隔音降噪,適應(yīng)轟鳴工廠等極端環(huán)境。
同傳麥克風(fēng):此次發(fā)布的業(yè)界首個(gè)軟硬一體同傳麥克風(fēng),置于會(huì)議桌即可使用,支持10種語(yǔ)言免切換自動(dòng)翻譯,且支持私有化部署,保障數(shù)據(jù)安全。
![]()
與此同時(shí),科大訊飛此前還推出了面向企業(yè)和專業(yè)團(tuán)隊(duì)的訊飛翻譯SaaS平臺(tái)。它整合了文本、文檔、同傳、音視頻譯制、人機(jī)協(xié)同五大核心翻譯能力,通過(guò)打通多端設(shè)備的數(shù)據(jù)鏈路,為企業(yè)提供了從專業(yè)翻譯服務(wù)到數(shù)據(jù)聚合管理的一站式解決方案。
這些硬件與訊飛翻譯APP,共同構(gòu)成了科大訊飛在翻譯領(lǐng)域的生態(tài)護(hù)城河。軟件APP負(fù)責(zé)高頻、便捷的C端應(yīng)用;專業(yè)硬件則攻克高噪、遠(yuǎn)場(chǎng)、B端安全的特定場(chǎng)景;SaaS平臺(tái)則將軟硬能力整合,為企業(yè)級(jí)應(yīng)用提供了統(tǒng)一入口。
![]()
從自主可控的端到端語(yǔ)音同傳大模型,到重塑體驗(yàn)的APP同傳與沉浸式翻譯,再到“軟硬一體”的硬件與SaaS生態(tài)布局,科大訊飛正在AI翻譯這條核心賽道上,完成從技術(shù)紅利到產(chǎn)品紅利和市場(chǎng)紅利的兌現(xiàn)。
正如訊飛翻譯APP在東盟博覽會(huì)作為指定翻譯軟件的實(shí)戰(zhàn)檢驗(yàn),這場(chǎng)聚焦AI生態(tài)落地的1024盛會(huì),最終指向的是一個(gè)明確的價(jià)值——“讓跨語(yǔ)言溝通像母語(yǔ)聊天一樣簡(jiǎn)單”。
而這,才是科技進(jìn)步的意義!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.