關(guān)于DeepSeek的應(yīng)用和討論,是過去一個月里,互聯(lián)網(wǎng)上的超級明星。
春節(jié)期間,闔家團圓之際,回鄉(xiāng)的年輕人紛紛給爸媽的手機裝上DeepSeek,叮囑“有什么事兒就在里面搜”。和此前的Dora、Suno、Midjourney等僅局限于專業(yè)人士內(nèi)部討論的AI應(yīng)用不一樣,作為語言類大模型的佼佼者,DeepSeek打破了壁壘,讓許多人第一次地切身感受到AI的威力。
那么,除了DeepSeek,中國自研技術(shù)在其他大模型AI的領(lǐng)域,取得了怎樣的成績?
此處必須要提——超寫實數(shù)字人厘里。
先是在美職聯(lián)打棒球,幾乎以假亂真;
![]()
再到電視劇《異人之下》里出演“二壯”——作為國內(nèi)數(shù)字演員首度出演真人劇集,加上二壯在《異人之下》中需用電磁波與人交流的天然適配角色設(shè)定,使得厘里在劇中的表現(xiàn)毫無違和之感。

原本超寫實數(shù)字人的在成本上可謂天價,但自從獲得AI大模型加持后,其運行原理和如今如火如荼的DeepSeek一致,均是依靠精湛的算法、優(yōu)質(zhì)的數(shù)據(jù)庫具象化而成。如今我們看到的數(shù)字人厘里,通過機器視覺技術(shù),采集說話時的面部肌肉細節(jié)進行AI訓練,由此生成豐富的表情和動作,使得厘里的面部表情、肢體動作以及身體光影都和真人差距甚小。而在成本上,以厘里在《異人之下》中的劇情篇幅為例,使用AI方式制作比傳統(tǒng)影視特效節(jié)省了80%的成本,縮短了40%的制作周期。

在影視行業(yè)里證明其適用性后,厘里乘勝追擊,轉(zhuǎn)戰(zhàn)音樂行業(yè)。去年10月,由厘里演唱、阿鯤編曲制作的電影《流浪地球2》電影插曲《空間站墜落》完整版發(fā)布(BTW.阿鯤老師作為當下電影配樂大師,最新作品便是《哪吒》里頭,申公豹縱身一躍時那段音樂的作者)。
![]()
如果你覺得《空間墜落站》其實是一首哼唱作品,還沒能真正展示厘里的演唱實力,那隨后發(fā)布的這首《I’mma get it》 (情感頻率)可說是厘里的完整展現(xiàn)。
撥開數(shù)據(jù)編織成的模擬路線
站在?電圖實時動態(tài)對??
Ah ah ah
如此復雜的情感
Ah ah ah
想要?切變得簡單
踩著打擊樂的shuffle節(jié)奏,在不規(guī)則的2-step反拍鼓點中,厘里以時下潮流的UK Garage曲風進行自我告白。源自于上世紀90年代英國的車庫舞曲,在近年來隨著NewJeans的出圈而回潮,成為年輕女生彰顯自我態(tài)度、不走尋常路的上佳路徑。
厘里充滿彈性的聲音在節(jié)拍上跳躍,和過往我們所聽到的數(shù)字人的聲音相比,厘里的聲音是如此自然,在咬字的清晰度、轉(zhuǎn)音的順滑、整首歌的音高響度的平滑性上,與真人無異。一方面,這得益于厘里所歸屬的阿里大文娛自研的生成式架構(gòu)聲紋轉(zhuǎn)化能力,在大數(shù)據(jù)模型的訓練下,把真人的氣息、音高、響度的變化融入了厘里的聲紋當中,和我們過往所聽的“AI聲”明確的過“準”而失去“人味”全然不同。另一方面,《I’mma get it》 所采用的UKG舞曲勢必強調(diào)VOCAL的壓縮、混響、和聲設(shè)計,歌曲本身的風格化特征也讓厘里作為數(shù)字人如魚得水。包括歌曲中段的RAP段落,這也難不倒厘里,她的flow完全沒問題。
結(jié)合視覺,更是厘里最強的輸出領(lǐng)域。在歌曲的MV里,一開頭,厘里置身于城市的流光溢彩當中。
![]()
進入副歌段落,她化身電子俱樂部女孩,把雙馬尾的白色衛(wèi)衣造型換成了派對打扮,并在抽象幾何空間的特效場景里跳躍。
![]()
![]()
![]()
因為AI的置景、換裝優(yōu)勢,得以讓厘里穿行于虛實交錯之中,圍繞著數(shù)字意識覺醒這一條敘事線,從“學習模式ON快打開”到“歪過頭做個判斷,感官變得真實起來”,暗示AI從數(shù)據(jù)到人格化的演化過程,這是實打?qū)嵉摹扒楦蓄l率”。
歌曲也并非是讓AI自說自話而一發(fā)不可收拾。如同《異人之下》當中厘里也進行了大量的試鏡,《I’mma get it》 也有賴背后的音樂家一同努力。歌曲制作人楊博文Radiax早已在電音圈里極富口碑,在郭采潔、朱婧汐、孟佳等以電子樂為招牌的歌手之作品中你都能看到他的名字。博文作為制作人掌舵,最終形成了人工智能的精密與人類感性溫度的平衡。
從《異人之下》的超寫實演繹,到在《I’mma get it》中的音樂展示,厘里每一次亮相,都是對傳統(tǒng)創(chuàng)作邊界的一次挑戰(zhàn)。若干年前,我們原本認知當中,數(shù)字人只是噱頭,而如今的厘里已超越了技術(shù)展示的范疇,開始真正融入了我們的日常娛樂生活,她在音樂中表達的情感,在視覺中展現(xiàn)的自我,她的聲音數(shù)字重塑與個性的重建,都讓人感受到其背后的生命力。在現(xiàn)階段,也許大家在考慮數(shù)字人的時候,還是以“無限接近人類”去思考的。可就如同當年midi技術(shù)出現(xiàn),我們也花了很長一段路,去尋找到PC MUSIC所特有的審美,而今的數(shù)字人,在未來也應(yīng)該不限于簡單的替代,而是有一片自己的天地。
明年的這個時候,再一起來看看會怎樣。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.