![]()
文:董指導
本期要點
馬斯克嘲諷過一部電影,是2017年上映的《銀翼殺手2049》,說它是部爛片;但實際上呢,他對這部電影里的汽車,非常感興趣。
Spinner回旋車,可飛可跑,靈活自如,雖還不是自動駕駛,但也科技感十足。以至于馬斯克都想在特斯拉發(fā)布會上,用電影里汽車的元素。結果卻慘遭被拒,馬斯克也只好用吐槽來發(fā)泄了。
《銀翼殺手2049》還有另一個科技感十足的技術:虛擬數(shù)字人Joi。她不僅具有人工智能的大腦,可以和主角對話、給出情緒價值;而且相貌姣好,還可以瞬時變裝。讓觀眾對未來數(shù)字人充滿期待。
![]()
然而,現(xiàn)在,并不需要等到2049年,活靈活現(xiàn)的數(shù)字人、以及雖還不能上天但地面靈活自如的自動駕駛汽車,都已經(jīng)成為現(xiàn)實。
在2025年世界人工智能大會(WAIC)期間,百度的“蘿卜快跑”、以及數(shù)字人平臺慧播星發(fā)布的新一代數(shù)字人技術NOVA,成為大會亮點。
這兩個不同的產(chǎn)品,其實背后是同一套支撐:大模型的語言、多模態(tài)能力,在物理世界投射出了自動駕駛、在虛擬世界投射出了數(shù)字人。
這些成果,不僅展示了科幻情節(jié)正走進生活,也用實力驗證著AI“超級有用”。來,一起推開AI新世界的大門。
成本小、收益高,這就是數(shù)字人
人們對虛擬人的追求,孜孜不倦。在1987年的電視劇《Max Headroom》中,講述了新聞記者因事故被轉化為了虛擬主持人的故事。
當時的虛擬人制作技術比較普通,只能讓演員穿戴面部塑膠模具與電子眼鏡,同時配合幀率調整、數(shù)字失真特效等技術來模擬計算機生成效果。
但虛擬人帶來的新鮮感,還是令觀眾們非常追捧。
隨后也陸陸續(xù)續(xù)誕生了不少數(shù)字人形象,或在卡通領域、或在娛樂領域,但大部分商用價值并不高。因為,受限于技術,數(shù)字人的表情僵硬、面部不夠細致、回答不夠靈活,顯得很呆板。而要提升效果,就得一大筆支出,性價比并不高。
然而,數(shù)字人的需求卻很旺盛,在客服、銷售、導購等領域,不僅可以彌補出生率下降導致人力不足的風險,更可以為用戶帶來全新體驗。
所以,當大模型不僅提高了AI的智能,更用多模態(tài)等能力讓數(shù)字人更有親和力時,需求在快速爆發(fā)。Data Bridge、Virtue Market等機構,都認為全球數(shù)字人市場規(guī)模未來5年有望實現(xiàn)50%的年復合增長。
數(shù)字人,也成為各大模型公司的一個業(yè)務重點。聚焦國內,在6月15日,羅永浩作為直播帶貨領域的“風向標”之一,以“數(shù)字分身”的形式,在百度電商開啟了直播首秀。
直播中,數(shù)字人老羅和數(shù)字人助播,侃侃而談、全程互動。AI技術,調用了知識庫1.3萬次,生成了9.7萬字的劇本式講解內容,完成8300個動作,語言風格、表情等都實現(xiàn)了和真人的高度還原。而且同樣的直播量,和真人相比,成本還下降了80%。
這場直播也在7小時內成交了5500萬元。以后就是黃金時段真人播,其他時段數(shù)字人。羅老師的“真還傳”可以加速了。
體驗、內容、視覺、效果,數(shù)字人的四大突破,紅利并不局限于大V。百度慧播星作為數(shù)字人平臺,也提供了AI全棧式數(shù)字人直播方案,在向廣大普通商家、播主實現(xiàn)平權。在大會期間,還發(fā)布了新一代數(shù)字人技術NOVA,能力卓著。
![]()
NOVA技術實現(xiàn)了三大核心突破:
依托文心大模型4.5T的大師級劇本模式,能生成優(yōu)質腳本并驅動多模態(tài)協(xié)同,讓數(shù)字人在直播間實現(xiàn)形神音容的高度匹配;
搭載的 AI 大腦可實時接收直播數(shù)據(jù)并自主決策,調度多智能體完成問答互動,并結合熱點輸出風格化內容;
高效復刻能力僅需10分鐘真人樣本,就能完成聲情動作復刻,實現(xiàn)聲音、動作與氛圍的精準匹配。
正所謂,真人會的,我數(shù)字人都會;真人不會的,我數(shù)字人更要會。成本不高、收益不小,這就是數(shù)字人。
賽博朋克地上跑,土豪都說好
馬斯克參政之后,特斯拉投資人可苦了。銷量下降了,代表科技感的Robotaxi又跳票了。與此相反,友商們卻勢頭正旺。
2025 年 7 月,Waymo宣布將其在正式擴大在得州奧斯汀市的無人駕駛出行服務,覆蓋范圍從37平方英里增加到90平方英里;不久前也剛達成全美自動駕駛里程突破1億英里(折合1.6億公里)的重要里程碑。
而Waymo的成績,并不是行業(yè)第一。中國的蘿卜快跑,自動駕駛里程已經(jīng)累計超過了1.7億公里,相當于繞著地球跑4240圈。每跑一圈就是一個日夜,折合下來也基本是蘿卜快跑的技術歷程。自2013年起,百度便深耕自動駕駛領域12年。
生成式大模型出現(xiàn)后,許多傳統(tǒng)領域都面臨著沖擊;但對于自動駕駛而言,先發(fā)優(yōu)勢并沒有消失,反而得到增強。因為,自動駕駛不像用AI寫詩作畫那么隨意,而是有極高的穩(wěn)定性、可靠性要求。
研發(fā)企業(yè),不僅需要大量的數(shù)據(jù)積累,尤其是道路實測經(jīng)驗,還需要多年的工程經(jīng)驗。所以,先發(fā)企業(yè),依然有著顯著的優(yōu)勢。
百度率先在2024年發(fā)布了自動駕駛大模型Apollo ADFM,全球首個支持L4級的大模型。蘿卜快跑也發(fā)布新一代汽車,全面應用“大模型+硬件+安全架構”的方案,提升駕駛性能、以及人們最在意的安全防護。
![]()
百度搜索技術結合大模型,用便捷的檢索式智能搜索提升數(shù)據(jù)處理效率;也可以用較低成本合成新場景,供模型訓練,減少自動駕駛的邊角風險。
蘿卜快跑的安全性也繼續(xù)提升。在感知層,用傳感器集群實現(xiàn)超440米超距探測,是人類視野的7倍;決策方面,采用雙計算中樞,互為“糾錯大腦”,在0.01秒內就完成異常接管,將系統(tǒng)故障率降低至十億分之一。
控制層,轉向、制動、供電等關鍵系統(tǒng)均配備雙備份硬件,其冗余仍能維持90%以上性能。定位與通信,則采用“衛(wèi)星+慣性導航+地面基站”的三重定位、雙運營商通信模組,在極端環(huán)境下也不斷聯(lián)。
當然,技術的先進性,必須轉化為人們生活的幸福度。蘿卜快跑的自動感應尋車、自動開關車門、語音播報等等無障礙功能,都受到了廣大視障人群的好評。女性用戶,在夜間乘坐蘿卜快跑,也更加安心。
蘿卜快跑,不僅為大陸乘客帶來便利,也獲得了香港首個自動駕駛車輛先導牌照,并且不斷擴大可通行范圍。而且,也得到了中東土豪們的青睞。今年3月,迪拜道路交通局RTA也和蘿卜快跑簽署協(xié)議,將在迪拜部署1000臺全無人駕駛汽車。7月,也與Uber合作,進軍美國、歐洲等地區(qū)。
所以,咱也別羨慕科幻電影里的情節(jié),賽博朋克的蘿卜快跑就在身邊。而且,也代表著自動駕駛技術,成為中國技術出海的一張名片。
AI全棧能力,只為應用而生
現(xiàn)在AI界越來越認同一個觀點:大模型,不是小公司的競技場。
海外來看,AI先鋒DeepMind早早就賣身給了谷歌,當紅炸子雞OpenAI也和微軟簽了協(xié)議、通過技術授權獲得高額投資,而因不滿意OpenAI投靠微軟而出走創(chuàng)業(yè)的Anthropic也很快就抱到了亞馬遜的大腿,開源大模型的扛把子則是Meta。
國內來看,百度、阿里、騰訊、字節(jié),都是清一水兒的科技巨頭;DeepSeek背靠量化巨頭,科大訊飛也是老牌IT公司。而七小龍則不斷有人掉隊。
因為大模型,本身就是一個資金密集、技術密集的領域。而且不管是要促進大模型真正落地,還是在大模型競爭中保持優(yōu)勢,僅僅有錢還不夠,而是需要一整套能力來促進應用繁榮。
這個道理,就像僅僅有強大發(fā)電站是不夠的,還需要有特高壓、變電站等輸配電系統(tǒng),以及家電、照明、動力等等廣泛的下游應用。
所以,百度在大模型產(chǎn)業(yè)之初就卷應用。而在蘿卜快跑、數(shù)字人的背后,正是百度的AI全棧能力(算力、框架、模型、應用),促進應用繁榮。
![]()
算力是硬基礎。百度成功點亮了國內首個全自研的三萬卡集群,使用了昆侖芯三代P800,支持1000個客戶同時做百億參數(shù)的模型精調。百舸4.0,作為AI異構計算平臺,可以充分利用客戶已有的算力資源,加速模型訓練、加速、推理。
框架是為了簡化和加速AI開發(fā)的軟件工具集,開發(fā)者基于框架就無需重復寫代碼、造輪子。而百度飛槳(PaddlePaddle)則是中國首個自研、開源的產(chǎn)業(yè)級深度學習平臺,與美國 TensorFlow、PyTorch正面交鋒。
飛槳不僅提升大模型訓練、推理效率,也適配60多款芯片,可以有效屏蔽底層硬件之間復雜多樣的差異。開發(fā)者只需要寫一份代碼,就可以在所有主流芯片上順暢運行。
模型的重要性自不用提。今年以來,百度連續(xù)發(fā)布了文心大模型4.5Turbo、X1Turbo等四款大模型,其中文心大模型X1 Turbo在中國信通院大模型推理能力評估中,獲當前最高評級。
6月30日,文心大模型4.5系列10款模型正式開源。近期發(fā)布的IDC報告顯示,文心大模型在8大維度調研中獨占7項滿分,綜合實力最強。
而且圍繞模型,也打造了百度智能云千帆平臺,可以讓開發(fā)者一站式完成大模型與AI原生應用的開發(fā)。
客悅數(shù)字員工、秒噠用一句話做應用,百度文庫和百度網(wǎng)盤,作為一站式內容創(chuàng)作、服務平臺,提供了AI筆記、AI相機等應用,也共同推出了數(shù)百項多模態(tài)AI Agent,全面覆蓋學習辦公、生活娛樂等場景。
種種技術、平臺,其實都是一個目標:不為炫技,而是降低大模型應用門檻,讓超級有用的AI,走進千家萬戶。
尾聲:前人種樹
當谷歌旗下的人工智能AlphaGo戰(zhàn)勝了李世石后,他們就又組織了和中國棋手柯潔的比賽。在《至高無上》這本書里記載,谷歌希望用這個比賽結果,來擴大自己在中國AI的市場份額,或許可以起到當年“乒乓外交”的作用。
谷歌還大力宣傳其深度學習平臺TensorFlow。但沒想到,已經(jīng)晚了。
中國在人工智能研究方面已經(jīng)取得了長足進步。甚至不需要TensorFlow。因為百度已經(jīng)組建了人工智能研究院,聘請了多位國際人才,也開始了飛槳的研發(fā)。
![]()
如今,百度的蘿卜快跑、飛槳、智算集群等三項成果,都入選了中國人工智能產(chǎn)業(yè)創(chuàng)新成果展。這就是多年前栽種AI的開花結果。
而更美麗、驚艷的成果則是,百度等科技巨頭,正在用一個個實際的進展,打消公眾對AI的質疑,讓公眾享受到“AI超級有用”。
---全文完,歡迎交流
理工/金融 復合背景
暢銷書《英偉達之道》譯者
百億私募/頭部自媒體 雙重經(jīng)歷
看清科技、商業(yè)本質,講出精彩故事
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.