據量子位報道,當地時間11月10日,斯坦福大學教授、World Labs聯合創始人李飛飛發布長文,首次系統性闡述空間智能為AI下一個前沿。她指出,當前大語言模型雖能處理抽象知識,但缺乏對物理世界的根基性理解,空間智能將成為突破的關鍵。
李飛飛提出“世界模型”需具備三項核心能力:生成性(創造遵守物理定律的虛擬世界)、多模態(處理圖像、視頻、動作等輸入)、交互性(預測世界演變狀態)。她強調,這種模型將徹底革新創造力、機器人、科學及醫療等領域。
World Labs創始人李飛飛透露,團隊已開發出Marble平臺早期版本——全球首個可通過多模態輸入生成一致性3D環境的世界模型。該平臺允許用戶實時探索并構建虛擬世界,目前正逐步向公眾開放。
李飛飛回顧其研究歷程時提到,ImageNet數據集與神經網絡、GPU共同催生了現代AI。她認為,空間智能的進化源于生物“感知-行動”循環,而當前AI在距離估計、物體旋轉等基礎空間任務中表現仍遠遜于人類。
World Labs成立于2024年初,正致力于解決世界模型的技術壁壘:設計通用訓練任務函數、構建大規模多模態數據集、開發新型模型架構。團隊近期推出的RTFM模型采用空間記憶機制,實現了實時生成且保持世界一致性。
李飛飛特別強調AI需增強人類能力而非取代,空間智能將賦能創作者、科學家及護理人員。在斯坦福實驗室與醫療機構合作中,她觀察到空間智能在藥物研發、影像診斷及家庭護理機器人領域的應用潛力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.