![]()
作者 | 云飛揚
編輯 | 張潔
百度又來WAIC秀AI“肌肉”了。
今天,WAIC 2025世界人工智能大會在上海世博展覽館和世博中心正式召開,老熟人百度也再次參展。
在2024年世界大會上,百度CEO李彥宏曾提到,百度不是要推出一個“超級應(yīng)用”,而是要打造數(shù)百萬級“超級有用”的應(yīng)用。在今年WAIC大會上,百度繼續(xù)貫徹讓AI“超級有用”的思路,展示了多個AI應(yīng)用場景。
WAIC會場附近,參會者就可以看到一輛輛來回穿梭的蘿卜快跑,將來自全球各地的科學(xué)家、企業(yè)家、初創(chuàng)團(tuán)隊等參會者帶去不同主題的場館,讓他們?nèi)ヌ接慉I的現(xiàn)在和未來。此次WAIC,蘿卜快跑不僅擔(dān)任WAIC大會的官方接駁車,還和百度飛槳深度學(xué)習(xí)平臺、百度智算集群一起,入選中國人工智能產(chǎn)業(yè)創(chuàng)新成果展。
走進(jìn)場館內(nèi)部,來到百度的數(shù)字人展位,可以看到朝著參會者打招呼、說段子的羅永浩數(shù)字人。一個月前,在百度慧播星的技術(shù)支持下,羅永浩嘗試了自己的數(shù)字人直播帶貨首秀,最終帶貨超5500萬元,吸引超1300萬人次觀看。
![]()
除此之外,百度的文心大模型4.5Turbo、X1Turbo等四款大模型、無代碼應(yīng)用搭建平臺秒噠、智能代碼助手文心快碼、一站式AI內(nèi)容獲取和創(chuàng)作平臺百度文庫、一站式內(nèi)容服務(wù)平臺百度網(wǎng)盤,以及百度百舸GPU算力平臺、百度智能云千帆大模型平臺等也在WAIC一一亮相。
現(xiàn)如今,“百模大戰(zhàn)”的硝煙逐漸散去,能落地的AI應(yīng)用成為新的競爭焦點。李彥宏曾多次強(qiáng)調(diào),應(yīng)用才是大模型的真正價值所在。
一年過去了,百度的AI應(yīng)用戰(zhàn)略都交出了哪些答卷?百度又是如何讓AI變得“超級有用”的?
![]()
百度大模型加持,讓數(shù)字人超越真人?
百度的數(shù)字人展廳位于大會的H1館,展位上既有百度數(shù)字人的相關(guān)技術(shù)介紹,也有首席體驗官羅永浩的數(shù)字人效果展示。
展示畫面中,羅永浩的數(shù)字人幾乎完全復(fù)刻了羅永浩的聲音、樣貌和動作,不僅能說出一些羅氏梗,能根據(jù)說的話搭配一些手勢動作,還能和搭檔朱蕭木嫻熟配合、插科打諢,接力對產(chǎn)品進(jìn)行介紹,幾乎看不出違和感。
![]()
一個月前的數(shù)字人直播中,除了介紹產(chǎn)品,羅永浩數(shù)字人還能和直播間評論區(qū)實時互動。在“朱蕭木”介紹一款茶葉時,面對“我是顏粉”的評論,“羅永浩”及時插話并幽默回復(fù):“你不黑,我就謝天謝地了,但不管你是真顏粉還是假顏粉,龍哥聽了你這句話都高興。”
難怪直播結(jié)束時,羅永浩在微博感慨:“說真的,這數(shù)字人效果把我自己都嚇了一跳。我和蕭木兩個數(shù)字人在那兒眉來眼去,講著跟我一樣風(fēng)格的段子,有點恍惚。”
據(jù)悉,這場數(shù)字人直播由百度慧播星提供技術(shù)支持,整場直播時長近7小時,用AI生成了9.7萬字的產(chǎn)品講解內(nèi)容,以及雙數(shù)字人搭檔做出的超8300個動作。
![]()
數(shù)字人本身并不算是新物種,早在2022年,直播帶貨行業(yè)就掀起了一股數(shù)字人熱潮,不少人相信,數(shù)字人有望解決真人主播價格高、不可控,以及生產(chǎn)力不足等問題。天眼查數(shù)據(jù)顯示,截至目前,我國現(xiàn)存在業(yè)、存續(xù)狀態(tài)的直播電商相關(guān)企業(yè)超37.3萬家。如果數(shù)字人能大規(guī)模應(yīng)用,將極大解放直播帶貨行業(yè)的生產(chǎn)力。
遺憾的是,因為技術(shù)限制等諸多因素,數(shù)字人始終未能給直播帶貨行業(yè)帶來太多改變。交個朋友副總裁吳加錄提到,過去幾年交個朋友一直對數(shù)字人直播持懷疑和嚴(yán)謹(jǐn)探索態(tài)度,很重要的原因就是數(shù)字人在畫面、語音、交互上存在不足。
直到今年,隨著AI技術(shù)的進(jìn)步,數(shù)字人變得越來越像真人,且成本越來越低。百度副總裁、百度電商總經(jīng)理平曉黎透露,百度的羅永浩數(shù)字人的單個成本不僅控制在了千元左右,還是3.0階段的高說服力數(shù)字人,在體驗、內(nèi)容、視覺、效果四個方面實現(xiàn)了突破。
![]()
在今天的WAIC上,百度慧播星又發(fā)布了以羅永浩數(shù)字?為藍(lán)本的新?代數(shù)字人NOVA,這標(biāo)志著超頭主播能力復(fù)刻進(jìn)入規(guī)模化量產(chǎn)時代,讓數(shù)字人帶貨又往前走了一步,更多帶貨主播、商家將有機(jī)會體驗羅永浩的同款快樂。
以往的數(shù)字人之所以效果欠佳,很大一部分原因在于他們既不夠像,很容易讓消費者看出破綻,又不夠聰明,無法應(yīng)對各種復(fù)雜情況,解決用戶的實際問題。
此次新一代NOVA數(shù)字人實現(xiàn)了三大核心突破:依托文心大模型4.5Turbo的大師級劇本模式,能生成優(yōu)質(zhì)腳本并驅(qū)動多模態(tài)協(xié)同,讓數(shù)字人在直播間實現(xiàn)形神音容的高度匹配;搭載的 AI 大腦可實時接收直播數(shù)據(jù)并自主決策,調(diào)度多智能體完成問答互動,并結(jié)合熱點輸出風(fēng)格化內(nèi)容;高效復(fù)刻能力僅需10分鐘真人樣本,就能完成聲情動作復(fù)刻,實現(xiàn)聲音、動作與氛圍的精準(zhǔn)匹配。
![]()
目前,NOVA 技術(shù)已進(jìn)入邀測階段,提前應(yīng)用于教育、健康等十余個行業(yè)的達(dá)人與商家。數(shù)據(jù)顯示,知識博主艾彌兒的數(shù)字人憑借萬億級知識庫,將用戶停留時長提升 101%;蒙牛悠瑞的數(shù)字人通過全時段服務(wù)與動態(tài)策略,使轉(zhuǎn)化率提高 33%。據(jù)悉,NOVA數(shù)字人預(yù)計將于10月向全行業(yè)開放。
本質(zhì)上,數(shù)字人直播其實是一個可控的、長視頻的生成工作,需要通過視頻、劇本、語言、骨骼等特征,進(jìn)行知識的輸出,通過視頻生成大模型,最后生成多模協(xié)同的視頻片段,完成高一致性長視頻的生成。百度數(shù)字人之所以能達(dá)到以假亂真的效果,得益于文心大模型4.5Turbo的升級。通過深度訓(xùn)練,數(shù)字人不僅能“懂創(chuàng)作”,帶貨塑品擁有更高的專業(yè)度,還可以“有個性”,甚至能“玩梗”。文心大模型4.5Turbo為數(shù)字人注入了個性化的靈魂。
吳加錄提到,交個朋友正是在詳細(xì)了解百度的數(shù)字人解決方案,意識到百度數(shù)字人技術(shù)的領(lǐng)先性后,才有了6月份的那次羅永浩數(shù)字人首播。
在他看來,隨著AI相關(guān)技術(shù)的進(jìn)步,未來數(shù)字人將是真人主播的有力補(bǔ)充。當(dāng)數(shù)字人主播能承擔(dān)起產(chǎn)品參數(shù)講解、非高峰時段直播值守等重復(fù)性、規(guī)律性工作時,真人主播才能將更多精力投入到選品把控、深度用戶互動等核心環(huán)節(jié)。
![]()
從數(shù)字人到蘿卜快跑,百度如何讓AI更好用?
如果說NOVA數(shù)字?以及此前的羅永浩數(shù)字人體現(xiàn)了百度在數(shù)字內(nèi)容領(lǐng)域的多模態(tài)融合能力,那蘿卜快跑就是百度大模型在物理世界的落地證明。
據(jù)悉,蘿卜快跑第六代無人車應(yīng)用了“Apollo ADFM大模型+硬件產(chǎn)品+安全架構(gòu)”方案,通過10重安全冗余方案、6重MRC安全策略確保車輛穩(wěn)定可靠。比如在決策層,蘿卜快跑的雙計算中樞互為“糾錯大腦”,0.01秒內(nèi)就能完成異常接管,系統(tǒng)故障率低至十億分之一。
這背后依靠的是百度在算力、框架、應(yīng)用等AI核心領(lǐng)域強(qiáng)大的全棧自研能力。截至目前,蘿卜快跑已為全球用戶提供超過1100萬次出行服務(wù)。今年以來,蘿卜快跑不僅獲批香港上路測試,還加速出海,接連落地迪拜、阿布扎比等國家。
![]()
此次WAIC大會,百度還展出了文心大模型、秒噠、文心快碼、百度文庫、百度網(wǎng)盤等一系列AI應(yīng)用。
今年以來,百度連續(xù)發(fā)布了文心大模型4.5Turbo、X1Turbo等四款大模型,其中文心大模型X1 Turbo在中國信通院大模型推理能力評估中,獲當(dāng)前最高評級。6月30日,文心大模型4.5系列10款模型正式開源。近期發(fā)布的IDC報告顯示,文心大模型在8大維度調(diào)研中獨占7項滿分,綜合實力最強(qiáng)。
![]()
秒噠通過 “?句話做應(yīng)用+多智能體協(xié)作+多工具調(diào)用”的技術(shù)組合,用戶通過自然語言描述就可以自動生成完整功能代碼,實現(xiàn)“3分鐘?成+1小時迭代”的極致開發(fā)體驗。
![]()
在大模型重構(gòu)下,百度文庫上線了智能PPT、智能寫作、AI繪本、AI全網(wǎng)搜等數(shù)百項多模態(tài)AI能力,覆蓋了學(xué)習(xí)辦公、生活娛樂等場景。2025年6?,極光旗下月狐數(shù)據(jù)發(fā)布的《2025年智能PPT行業(yè)市場研究報告》顯示,百度文庫智能PPT月訪問量超3400萬,用戶規(guī)模年同比翻倍增長。
![]()
除此之外,在WAIC上,百度還展示了文心快碼、百度網(wǎng)盤、百度智能云千帆大模型平臺等分別面向C端和B端用戶的?系列AI應(yīng)用,構(gòu)成了百度的“超級有用”AI全棧圖。
![]()
作為國內(nèi)最早投入AI研發(fā)的企業(yè)之?,百度沒有專注于“技術(shù)炫技”,也沒有執(zhí)著于打造“超級應(yīng)用”,而是依托其AI四層架構(gòu)全棧?研的能力,持續(xù)推動AI產(chǎn)品普及,打造出一套面向技術(shù)用戶和普羅大眾的AI應(yīng)用矩陣。今年的NOVA數(shù)字?、蘿卜快跑以及文心大模型等都是這一AI應(yīng)用戰(zhàn)略的成果。
事實上,作為整個AI行業(yè)的核心引擎,大模型是重中之重,但能實際落地、能為大眾的生活帶來實實在在改變的應(yīng)用同樣重要。任何一個行業(yè),只有扎根用戶需求,緊密融入到真實的商業(yè)社會中,才能獲得更茁壯、長久的生命力。AI技術(shù)的突破固然令人興奮,但更令人驚喜的是AI給生活帶來的實際改變。
未來,比拼大模型之外,能否以大模型為基礎(chǔ)延伸出豐富多元、有用好用的AI應(yīng)用,讓AI走進(jìn)千行百業(yè),將成為AI時代的關(guān)鍵一環(huán)。
「AI新榜交流群」進(jìn)群方式:添加微信“banggebangmei”并備注姓名+職業(yè)/公司+進(jìn)群,歡迎玩家們來群里交流,一起探索見證AI的進(jìn)化。
歡迎分享、點贊、推薦
一起研究AI
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.