據(jù)悉,商湯科技即將在12月15日開始舉辦產(chǎn)品發(fā)布周。從近期開源的多模態(tài)架構NEO到實時數(shù)字人技術SekoTalk,不難看出商湯正展現(xiàn)出一條清晰的路徑:以底層創(chuàng)新推動產(chǎn)品體驗升級,讓實用主義成為AI落地的核心邏輯。
![]()
AI應用技術地基:NEO架構重構多模態(tài)效能,SekoTalk重塑數(shù)字人交互
商湯開源的NEO架構從底層重新設計了多模態(tài)模型的“骨架”,突破了此前業(yè)內(nèi)拼湊式方案存在的效率低、融合淺瓶頸,實現(xiàn)了視覺與語言的深度統(tǒng)一,該架構僅需業(yè)界十分之一的數(shù)據(jù)量即可達到旗艦模型性能。
這種“降溫增效”的特性,讓高質(zhì)量多模態(tài)從高耗能的大型模型向輕量化部署邁出實質(zhì)性一步,這將催生更多實用、好用的C端產(chǎn)品,讓AI普惠到各個細分生產(chǎn)生活場景。
如果說NEO架構體現(xiàn)了商湯在基礎模型層面的深耕,那么SekoTalk技術則展現(xiàn)了其在應用層的精準洞察。SekoTalk實現(xiàn)了多語言環(huán)境下的精準唇形同步和長視頻生成的穩(wěn)定表現(xiàn),在8卡服務器上達到24fps的生成速度,將首幀延遲降至3.5秒,使實時交互數(shù)字人從概念走向?qū)嵱茫鉀Q了行業(yè)長期面臨的“嘴不對音”、延遲漂移等痛點。
這一突破不僅指向視頻制作、虛擬偶像等內(nèi)容市場,更為情感陪伴等交互場景開辟了新空間。
從技術蓄力到產(chǎn)品價值,實用主義構建AI產(chǎn)品邏輯
除此之外,近期商湯還迎來了“1+X”新成員——劍指具身智能場景化商業(yè)落地的“大曉機器人”,近期頻頻的技術動作可見商湯正在構建的產(chǎn)品邏輯:
以底層架構創(chuàng)新降低AI使用門檻,以場景化技術解決實際痛點。這種“實用主義”思路,標志著AI企業(yè)從追逐參數(shù)規(guī)模向關注用戶價值的轉變。
技術研發(fā)的長期主義,最終需要穿透到用戶可感知的產(chǎn)品價值。商湯近期的技術蓄力,正在具象化為日常使用體驗的提升。從模型推理效能的顯著提升,到數(shù)字人交互的自然流暢,這些技術細節(jié)的進步,實則是AI技術真正融入產(chǎn)業(yè)的關鍵一步。
在產(chǎn)品發(fā)布周即將到來之際,期待商湯將展示更多如何將前沿技術轉化為實用產(chǎn)品的思考,為行業(yè)帶來新的啟發(fā)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.