<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      大語言模型無法通往AGI,空間智能才是最優(yōu)路徑

      0
      分享至



      作者|林易

      編輯|重點君

      2月4日,在思科(Cisco)AI峰會上,李飛飛以World Labs創(chuàng)始人的身份,披露了公司首款空間智能產(chǎn)品Marble的技術細節(jié) 。

      作為這一輪生成式AI浪潮的核心奠基者之一,李飛飛并未盲目追逐大語言模型的熱潮。相反,她再次拋出了一個鮮明的反共識觀點:單純的大語言模型無法通往AGI。

      在李飛飛看來,語言在生物進化史上只是最近50萬年的產(chǎn)物,而視覺與觸覺所代表的空間智能,早在5億年前的寒武紀就開啟了神經(jīng)系統(tǒng)的演化競賽。如果AI無法理解三維物理世界、無法具備物理直覺,它就只能被永遠困在數(shù)字的像素中。

      帶著這樣的判斷,李飛飛創(chuàng)辦的World Labs試圖走通一條不同于OpenAI的路徑:通過構建具有物理一致性的世界模型,為AI補上感知的短板。

      我們梳理了這場訪談的核心信息,以下是重點內容:

      1. AGI路線之爭:語言并不是智能的全部,甚至不是智能的基石。

      李飛飛用生物進化的宏觀視角重新審視了AI的發(fā)展路徑:語言在人類進化史上只有約50萬年的歷史,是極其晚近的產(chǎn)物。相比之下,視覺、觸覺等感知能力早在5億年前的寒武紀就開啟了演化競賽。

      結論是:如果AI只有語言能力,它將被永遠困在數(shù)字世界中。只有補齊了比語言更古老、更基礎的空間智能,讓機器擁有理解、推理并與三維物理世界互動的能力,AI才能真正通往AGI。

      2. 重新定義世界模型:物理一致性(Physical Consistency)是關鍵。

      李飛飛介紹,作為一個前沿空間智能模型,Marble能接收多模態(tài)輸入,無論是句子、圖片、視頻還是簡單的3D輸入,并將這些提示詞轉化為一個完全可導航、可交互且具有永久一致性的3D世界。

      與Sora等強調視覺效果的視頻模型不同,Marble生成的環(huán)境具有幾何結構(Geometric Structure)和物理一致性。這意味著生成的不僅僅是一段像素動畫,而是一個擁有物理屬性的虛擬空間,用戶可以在其中自由漫游。

      Marble目前已被用于游戲開發(fā)、影視特效(VFX)、機器人訓練、室內設計等領域,臨床研究人員將Marble用于治療強迫癥,通過生成特定的觸發(fā)環(huán)境(如臟亂的洗衣房)來對患者使用暴露療法。

      3. 隨著合成數(shù)據(jù)技術的成熟,世界模型即將迎來類似LLM的Scaling Law爆發(fā)時刻。

      為什么物理世界的AI 發(fā)展比語言模型慢?核心瓶頸在于數(shù)據(jù)的信噪比。文本數(shù)據(jù)是清晰、語義明確的,而物理世界的像素(Pixels)和體素(Voxels)充滿了噪音,且難以大規(guī)模獲取 。

      為了解決這一難題,World Labs采取了一種混合數(shù)據(jù)策略(Hybrid Data Strategy):利用互聯(lián)網(wǎng)現(xiàn)有的文本、圖像、視頻數(shù)據(jù);結合仿真模擬數(shù)據(jù)(Synthetic Data);加上真實世界采集的數(shù)據(jù)。

      李飛飛預判,隨著合成數(shù)據(jù)技術的成熟,世界模型領域即將迎來類似LLM的Scaling Law爆發(fā)時刻。

      4. 通用機器人才是AI技術的皇冠,因為自動駕駛與通用機器人的邏輯完全相反。

      大眾往往認為自動駕駛是AI技術的皇冠,但在李飛飛看來,通用機器人的維度要高得多。

      自動駕駛是2D 邏輯:汽車本質上是一個在二維平面移動的方塊,它的核心任務是避障,只要不碰到東西就是勝利。

      通用機器人則是3D 邏輯:機器人的核心任務恰恰相反,是接觸,它必須在三維空間中,以不破壞物體的方式進行精確操作。

      5.AI技術的終局是成為新的電力,成為賦能文明的基礎設施。

      面對當前關于AI毀滅人類或技術烏托邦的極化爭論,李飛飛表現(xiàn)出了科學家的審慎與人文關懷。

      她將AI比作一百多年前的電力。電力的成功,不是因為建立了龐大的電網(wǎng),而是因為它點亮了學校的燈、驅動了工廠的機器、延長了人類的壽命。同理,AI的成功不在于模型參數(shù)有多大,而在于它能否像電力一樣,成為一種賦能文明的基礎設施,讓每一個體獲得尊嚴與幸福 。

      李飛飛在訪談結束時透露,World Labs的目標是讓空間智能技術真正進入醫(yī)療健康、農(nóng)業(yè)制造等各個垂直行業(yè)。希望在2026年,我們能看到擁有了空間智能的AI,真正走出屏幕,與物理世界產(chǎn)生美妙的交互。



      以下為李飛飛訪談實錄:

      1、空間智能是AI的下一個前沿領域

      主持人:很高興能親眼見證World Labs在過去一年中所取得的進展。讓我們先來聊聊你們正在做的事情,以及它為何如此重要。

      李飛飛:現(xiàn)在我每天醒來腦子里只思考一件事,那就是空間智能(spatial intelligence)。大約兩年前,我與一群年輕的技術專家共同創(chuàng)立了World Labs。為什么空間智能如此重要?我認為它是AI的下一個前沿領域。如果從進化的角度看待智能發(fā)展,這段歷史可以追溯到5億多年前。最先開啟神經(jīng)系統(tǒng)演化競賽的是感知而非語言。相比之下,語言是一種非常新穎的智能形式,歷史大概只有50萬年。但在15億年前,動物就開始感知光線并觸摸環(huán)境,從而產(chǎn)生了觸覺、視覺、本能和知覺。

      “本能”這個詞雖然有些模糊,但不可否認的是,正是通過觸覺和視覺與物理世界進行身體接觸,才開啟了神經(jīng)系統(tǒng)的發(fā)育,引發(fā)了動物進化的軍備競賽。這使得生物在與環(huán)境交互中變得越來越活躍,也越來越智能。我想表達的是,在真實的3D、4D物理世界中進行理解、推理、交互和導航的能力是基礎性的,與語言智能同樣重要。這一核心關鍵技術就是空間智能。這就是為什么我認為它是AI的下一代前沿領域,也是World Labs一直致力于構建的目標。

      主持人:請跟我們聊聊Marble,這是你們最近剛剛發(fā)布的產(chǎn)品。究竟什么是Marble?

      李飛飛:Marble是我們第一代空間智能模型。雖然我們常隨口稱其為世界模型(world model),但鑒于目前關于世界模型的定義繁多,稱謂其實并不重要。本質上,這是一個前沿的空間智能模型。Marble能接收多模態(tài)輸入,無論是句子、圖片、視頻還是簡單的3D輸入,并將這些提示詞轉化為一個完全可導航、可交互且具有永久一致性的3D世界。這與大家現(xiàn)在看到的視頻模型截然不同,Marble生成的環(huán)境擁有幾何結構,支持模擬機器人動作或編寫游戲代碼等操作。

      李飛飛:我們大約兩個月前發(fā)布了Marble。雖然它仍處于起步階段,是第一代產(chǎn)品,但作為最先進的3D生成式世界模型,我們對開啟這段旅程感到非常激動。

      主持人:有一種觀點認為,如果僅僅依賴語言模型,我們將無法實現(xiàn)AGI,必須對自身的物理性進行某種增強。您顯然深信這一點。那么請談談這個維度,隨著時間推移,未來五年最重要的突破點會是什么?除了機器人技術這個顯而易見的用例,還有哪些我們今天無法想象的應用?

      李飛飛:其實不需要等五年,我們的用戶和客戶已經(jīng)開始嘗試早期版本的模型了。我們看到用戶利用它開發(fā)游戲;視覺特效(VFX)客戶將其用于商業(yè)化的虛擬制作場景;包括Nvidia在內的大公司、初創(chuàng)企業(yè)及學術實驗室等合作伙伴,正在利用Marble作為訓練環(huán)境來訓練機器人;建筑師和設計師則用它進行室內設計

      我們還發(fā)現(xiàn)了一些意想不到的用例。例如,臨床研究人員對Marble表現(xiàn)出了極大的熱情。大量的精神病學和心理健康研究及干預手段都需要沉浸式環(huán)境,且需針對特定情況進行個性化定制。以強迫癥(OCD)為例,患者會被非常具體的場景觸發(fā),比如我個人會被堆積的臟衣服困擾,但每個人的觸發(fā)點各不相同。研究人員發(fā)現(xiàn)搭建實體環(huán)境非常困難,而Marble只需輸入提示詞,幾分鐘內就能生成各種不同類型的環(huán)境。

      此外,還有人將其用于健身訓練,比如個性化的瑜伽環(huán)境。隨著Marble不斷完善,畢竟我們現(xiàn)在還處于早期階段,我相信未來會看到越來越多橫向的應用場景。

      2、AI的社會價值

      主持人:你進入AI行業(yè)已經(jīng)很長時間了。

      李飛飛:這是在委婉地討論我的年齡。

      主持人:不,我的意思是,你不僅僅是那種跟風研究了三年的人,而是將畢生精力都奉獻給了AI。當你創(chuàng)立這家公司并著手構建空間智能時,最讓你感到驚訝的是什么?

      李飛飛:這個問題問得很好。正如我們討論過的,即便到了我們這個年紀,保持求知欲和學習能力依然是最重要的事情。我投身AI領域已經(jīng)很多年了,最初是因為強烈的好奇心,我想探索什么是智能以及如何讓機器變得智能。當時AI還是一個無人問津的冷門領域,大家甚至不知道怎么拼寫AI,那段時光非常有趣。但過去十年發(fā)生了翻天覆地的變化,AI對我而言不再僅僅是個人層面的追求,它已經(jīng)上升到了文明層面。這讓我作為教育者和企業(yè)家多了一層責任感,不僅要在技術上做出貢獻,還要推動其健康發(fā)展。

      作為企業(yè)家,最讓我驚訝的有幾點。首先是過去幾年AI的發(fā)展速度令人屏息。無論我們外表如何淡定,內心深處都難免焦慮,因為有太多的論文要讀、太多的博客、新聞和模型發(fā)布。這種焦慮感正是我們這個時代的寫照,技術正以驚人的速度推動我們前進。這讓我既興奮又清醒,正如蘇格拉底所言“我一無所知”,我希望大家不要放棄學習,保持好奇心。

      另一點讓我驚訝甚至擔憂的是關于AI的極化言論。網(wǎng)絡上的討論往往是非黑即白的:要么是完全的技術烏托邦主義,忽略了技術是一把雙刃劍;要么就是末日論調,仿佛人類時刻面臨生存危機。對于一項對人類文明如此深遠的技術,這種討論方式是不負責任的。主動權掌握在每一位企業(yè)家、產(chǎn)品經(jīng)理、工程師和公民手中,我們需要具備能動性來引導技術的發(fā)展。我真心希望在邁向2026年及未來的過程中,我們能更客觀、細膩且心懷仁慈地看待AI,既保持樂觀,又肩負起責任,而不是為了博取眼球去發(fā)表極端言論。

      主持人:在你心中,未來幾年AI取得什么樣的成果才算成功?我很喜歡你提到的這種兩極分化的觀點,要么工作全部消失盯著大海發(fā)呆,要么技術完全沒用。

      李飛飛:如果我們把時間回撥一百多年,想象一下當時的人們如何定義電力的成功。很難想象那個版本的我們能預見到今天的景象,但我希望那時的愿景是:學校燈火通明,家園溫暖如春,機器被賦予力量實現(xiàn)工業(yè)化,進而延長人類壽命,讓更多孩子接受教育。這就是技術和AI的意義,是一種永恒的價值。成功的定義應該是文明變得更加美好,而文明是由每一個追求幸福、繁榮且擁有尊嚴的個體組成的。這就是AI以及每一項技術成功的定義。

      3、世界模型與具身智能的技術難點

      主持人:接下來我們談談戰(zhàn)術層面。Large World Models(大型世界模型)的計算密集度是否與Language Models(語言模型)相當?

      李飛飛:首先,存在不同種類的大型世界模型。我們致力于創(chuàng)建具有顯式3D表示的世界模型,以賦能機器人、游戲、娛樂和設計等領域。還有一類通常被稱為世界模型的其實是視頻生成模型。目前我們的模型規(guī)模并沒有那么大。從宏觀視角來看,GPT-5的訓練量大約在10的26次方flops(每秒浮點計算)左右,而我們的Marble模型在規(guī)模上仍要小幾個數(shù)量級。

      主持人:這僅僅是因為沒有足夠的數(shù)據(jù)來喂給這些模型嗎?

      李飛飛:我認為兩者兼而有之。規(guī)模化確實始于數(shù)據(jù)和模型參數(shù),數(shù)據(jù)起到了重要作用。但另一方面,這個領域還處于早期階段。Transformer論文發(fā)表于2016年左右,語言模型的發(fā)展已經(jīng)快十年了,而世界模型是一個新得多的領域。雖然過去兩年我們降低了一些科學風險,但仍處于探索模型架構的相對早期階段,所以規(guī)模較小。不過考慮到我們實驗室以及整個領域的進展,接下來的幾年將會非常令人興奮,我們將見證大型世界模型在Scaling Law(規(guī)模定律)曲線上的飛躍。

      主持人:這讓我很著迷。語言模型是在互聯(lián)網(wǎng)上免費、公開的數(shù)據(jù)上訓練的,獲取海量數(shù)據(jù)相對容易。但物理數(shù)據(jù)很難獲取,因此合成數(shù)據(jù)(Synthetic Data)變得至關重要,同時你也需要以更慢的速度去收集真實數(shù)據(jù)。這帶來了哪些限制?世界模型的進步速度會因此變慢嗎?我們會擁有通用機器人,還是因為數(shù)據(jù)限制只能擁有專用機器人?

      李飛飛:這是一個信息量很大的問題。在World Labs,我們采取混合數(shù)據(jù)策略。我非常羨慕研究語言的朋友,因為語言數(shù)據(jù)的輸入是完全可觀測的、單一模態(tài)的,且含義清晰。而像素或體素構成的3D世界則要混亂得多。為了突破技術極限創(chuàng)造3D、4D世界,我們必須意識到我們并沒有海量的3D數(shù)據(jù)。因此我們采取分層混合方法:利用互聯(lián)網(wǎng)規(guī)模的文本、圖像和視頻,結合模擬數(shù)據(jù),再加上真實世界采集的數(shù)據(jù)。這就像自動駕駛公司花費數(shù)十年收集真實和模擬數(shù)據(jù)一樣。

      至于速度,雖然數(shù)據(jù)獲取難,但算力在增強,芯片在進步,整個生態(tài)系統(tǒng)也在成熟。我們現(xiàn)在合作的數(shù)據(jù)供應商在三年前甚至不存在。合成數(shù)據(jù)確實發(fā)揮了很好的作用,而且我們正在制作的模型也將反過來為模擬世界貢獻數(shù)據(jù),形成飛輪效應。

      關于通用機器人,這幾句話就能概括,但做起來很難。我在斯坦福運營機器人實驗室十多年,作為科學家,我必須承認這是一個極具挑戰(zhàn)的問題。看清北極星并不意味著旅程會很短。回想2006年,我和同事帶領團隊創(chuàng)造了第一輛在沙漠行駛138英里的自動駕駛汽車,當時我們預言20年后會有自動駕駛汽車。直到去年,Waymo才開始在城市街道大規(guī)模運行,這確實是一段漫長的旅程。

      汽車與機器人的區(qū)別在于,汽車可以被視作一個在二維平面上移動的方塊機器人,它的目標是不要碰到任何東西。而機器人是一個三維實體,在三維世界中運行,通用機器人的目標是必須接觸物體而不破壞它們。這是一個更高維度的問題,加上手部模擬的極高難度、視覺的精準度以及空間理解的需求,挑戰(zhàn)巨大。這就是我創(chuàng)立World Labs的原因。我不喜歡過度承諾,但這確實是我們致力于解決的重要問題。

      主持人:最后,對于企業(yè)界人士,他們應該如何看待世界模型、物理AI以及你正在思考的整個領域?

      李飛飛:雖然我的思維方式有時候還像個研究生,總想著要有免費食物才行,但對于企業(yè)而言,World Labs非常樂意與合作伙伴交流。世界模型和空間智能是一項橫向技術。我們談論機器人、模擬和沉浸式交互娛樂,但這不僅僅局限于此。我們還沒有深入探討醫(yī)療保健、教育產(chǎn)品、現(xiàn)場服務、金融服務、農(nóng)業(yè)制造、倉儲檢測以及城市規(guī)劃等領域。利用空間智能我們可以做的事情還有很多,這確實是下一個前沿領域,我邀請大家無論是與我們合作還是獨立開展研究,都加入到這個進程中來。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      要價2億歐!西媒曝馬競同意出售小蜘蛛,巴薩可蠱惑球員施壓降價

      要價2億歐!西媒曝馬競同意出售小蜘蛛,巴薩可蠱惑球員施壓降價

      夏侯看英超
      2026-02-25 00:53:57
      “小婉君”金銘45歲現(xiàn)狀:個子太矮事業(yè)受挫,住北京豪宅不婚不育

      “小婉君”金銘45歲現(xiàn)狀:個子太矮事業(yè)受挫,住北京豪宅不婚不育

      削桐作琴
      2026-01-29 00:03:53
      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      喜歡歷史的阿繁
      2026-02-07 14:21:17
      冬奧冠軍“戰(zhàn)袍走光”惹爭議,耐克把FILA打蒙了

      冬奧冠軍“戰(zhàn)袍走光”惹爭議,耐克把FILA打蒙了

      首席品牌觀察
      2026-02-24 16:41:56
      雷軍估計五味雜陳!“前兄弟”把紅米換成iPhone 17,公開叫板了

      雷軍估計五味雜陳!“前兄弟”把紅米換成iPhone 17,公開叫板了

      火山詩話
      2026-02-22 08:04:21
      以不跟西方走,全力學華,這六國為何會死心塌地站在中國這一邊?

      以不跟西方走,全力學華,這六國為何會死心塌地站在中國這一邊?

      殘夢重生來
      2026-02-25 01:24:49
      消息一出,日本軍工圈徹底傻眼!中國這次精準掐住了它的軍工命脈

      消息一出,日本軍工圈徹底傻眼!中國這次精準掐住了它的軍工命脈

      霽寒飄雪
      2026-02-24 19:30:32
      丁嘉麗:我這輩子最后悔的決定,就是捧紅孫紅雷這個“白眼狼”

      丁嘉麗:我這輩子最后悔的決定,就是捧紅孫紅雷這個“白眼狼”

      小熊侃史
      2025-12-17 09:46:44
      路都走不穩(wěn),全程開原音假唱,還想去鳥巢開演唱會,誰給她的自信

      路都走不穩(wěn),全程開原音假唱,還想去鳥巢開演唱會,誰給她的自信

      動物奇奇怪怪
      2026-02-04 07:04:47
      歐洲小偷,都傳瘋了,達成了一個行業(yè)共識,中國人的錢包,隨便拿

      歐洲小偷,都傳瘋了,達成了一個行業(yè)共識,中國人的錢包,隨便拿

      西樓知趣雜談
      2026-02-14 18:35:51
      怪不得高市底氣十足:76%的日本人狀告高市,要繼續(xù)對華強硬!

      怪不得高市底氣十足:76%的日本人狀告高市,要繼續(xù)對華強硬!

      通文知史
      2026-02-24 23:55:03
      復工第一天,領導就將我辭退,當晚卻接到十多個電話

      復工第一天,領導就將我辭退,當晚卻接到十多個電話

      船長與船1
      2026-02-24 12:22:21
      老了才醒悟:人過六十,在兄弟姐妹面前,再親也別做這幾件事

      老了才醒悟:人過六十,在兄弟姐妹面前,再親也別做這幾件事

      阿凱銷售場
      2026-02-25 02:00:12
      從左權之妻到改嫁左權秘書,再到山西奪權,劉志蘭究竟經(jīng)歷了什么

      從左權之妻到改嫁左權秘書,再到山西奪權,劉志蘭究竟經(jīng)歷了什么

      舊書卷里的長安
      2026-02-22 00:08:58
      破防了!人到中年才發(fā)現(xiàn)拼命攢錢毫無意義?網(wǎng)友的分享一針見血

      破防了!人到中年才發(fā)現(xiàn)拼命攢錢毫無意義?網(wǎng)友的分享一針見血

      放開他讓wo來
      2026-02-24 15:41:53
      豐盈:一種拒絕被削足適履的完整

      豐盈:一種拒絕被削足適履的完整

      疾跑的小蝸牛
      2026-02-24 22:19:30
      華為去年營收超8800億元,上半年凈利潤下降32%,研發(fā)反向增長9%

      華為去年營收超8800億元,上半年凈利潤下降32%,研發(fā)反向增長9%

      電科技網(wǎng)
      2026-02-24 16:16:26
      38歲中國商人在土耳其被綁架殺害,其遭同行女子引誘擄上車,10名嫌疑人已落網(wǎng)

      38歲中國商人在土耳其被綁架殺害,其遭同行女子引誘擄上車,10名嫌疑人已落網(wǎng)

      揚子晚報
      2026-02-24 14:21:20
      全球160國都接入,為啥偏偏越南上星鏈炸了鍋?

      全球160國都接入,為啥偏偏越南上星鏈炸了鍋?

      達文西看世界
      2026-02-24 14:56:20
      恩里克:說我執(zhí)教的巴黎能和瓜帥手下的巴薩相比?我們剛起步

      恩里克:說我執(zhí)教的巴黎能和瓜帥手下的巴薩相比?我們剛起步

      懂球帝
      2026-02-25 00:54:39
      2026-02-25 02:35:00
      劃重點KeyPoints incentive-icons
      劃重點KeyPoints
      去除噪音,劃下重點 追蹤全球AI科技,記錄中國硬核崛起 溝通?一把把一傘一久耳久久漆
      165文章數(shù) 18關注度
      往期回顧 全部

      科技要聞

      宇樹科技發(fā)布四足機器人Unitree As2

      頭條要聞

      武契奇遭"滅門式"暗殺陰謀:他們計劃虐殺我的孩子

      頭條要聞

      武契奇遭"滅門式"暗殺陰謀:他們計劃虐殺我的孩子

      體育要聞

      蘇翊鳴總結米蘭征程:我仍是那個熱愛單板滑雪的少年

      娛樂要聞

      汪小菲官宣三胎出生:承諾會照顧好3個孩子

      財經(jīng)要聞

      縣城消費「限時繁榮」了十天

      汽車要聞

      入門即滿配 威蘭達AIR版上市 13.78萬元起

      態(tài)度原創(chuàng)

      親子
      手機
      數(shù)碼
      教育
      公開課

      親子要聞

      我嫁中國生了3個孩子,每天帶娃堪比春晚!

      手機要聞

      蘋果發(fā)布iOS 26.4 Beta 2系統(tǒng)更新,液態(tài)玻璃設計有新變化!

      數(shù)碼要聞

      《死亡擱淺2》PC版推薦配置RTX 3060可FHD 60幀,Steam國區(qū)298元

      教育要聞

      馬馬馬上上岸!!!TTS《大吉大利復試手冊》+復試班:紙質筆記與1v1模擬面試堂堂上線!!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版