《科創板日報》1月31日訊(編輯 宋子喬) 如果人工智能領域的進步可以看作一部交響樂,那么過去幾年,樂章的主題無疑是“生成”——生成文字、圖像、聲音乃至視頻。然而,在2026年初,一段嶄新的旋律被奏響:它不僅生成,更能構建。
![]()
谷歌大樓 網絡圖
北京時間1月30日凌晨,谷歌DeepMind向外部開放了Project Genie,它被認為是目前最先進的世界模型之一,可以算是世界模型Genie3的實驗性研究原型,也是這套世界模型第一次以可交互形態對公眾開放。
“Genie”這個單詞源于阿拉伯語jinni(精靈),后經法語變形成génie后成為一個英語詞匯,最常見的含義是指阿拉伯和伊斯蘭神話傳說中,一個能實現召喚者愿望的“精靈”或“神怪”。谷歌DeepMind將其世界模型項目命名為“Project Genie”(精靈計劃),正是在闡釋該神話的內涵:這個AI模型能將你用文字描述的任何場景(召喚者的愿望),瞬間生成一個可以進入并交互的虛擬世界。
當AI不僅能夠描繪夢境,更能讓人走進夢境并與之互動時,我們所討論的“虛擬”與“現實”的邊界,或許已到了需要被重新思考的時刻。
目前,該原型率先向年滿18歲的美國Google AI Ultra(3個月125美元)訂閱用戶開放。
Project Genie有何不同?
Project Genie的底層是世界模型Genie 3。與OpenAI的Sora等內容生成大模型不同,它的功能不局限于多模態內容生成(比如AI視頻生成工具可為用戶創作一段影片,模型可依據、參考的一切數據來自人類儲存好的文字庫、圖像庫及視頻庫),而是可以生成一個完整的空間,實現“憑空造世”:
只需用文字描述一個場景或上傳一張圖片,例如“一座被巧克力河環繞的棉花糖城堡”,一個實時的、可交互的3D虛擬世界便會在幾秒鐘內生成。
用戶能夠像玩電子游戲一樣,指揮角色在其中自由行走、飛行或駕駛,探索這個想象出來的世界。
周圍的環境則根據視角和行為動態、連續地生成。這并非依賴傳統的游戲引擎解碼固定數據,而是對潛在物理規律與空間邏輯的一次即時推演與具現,能在用戶移動時,實時生成前方的路徑和環境。
從技術本質上看,世界模型的核心是模擬環境的動態變化,預測環境的演化和行為對環境的影響。
谷歌DeepMind在諸如國際象棋、圍棋等特定環境的AI智能體研發上已有深厚積累,但要實現通用人工智能(AGI),系統必須能夠理解和應對現實世界近乎無限的復雜性與多樣性。
Genie 3正是在這一方向上邁出的關鍵一步。它提供了一種前所未有的模擬能力,能夠生成任何現實或虛構場景的交互式環境。這為機器人技術、動畫制作乃至歷史場景的虛擬探索等領域提供了強大的工具。
對于AI的發展而言,Project Genie的深意遠不止于炫酷的體驗。它最核心的價值,在于為AI智能體(及未來的機器人)提供了一個無限、安全且成本可控的“模擬訓練場”、“試錯沙盒”。智能體可以在Genie創造的海量、多樣化的模擬環境中進行學習和訓練,理解現實世界的物理規則和因果邏輯,這正是邁向通用人工智能不可或缺的基石。
從這個角度看,世界模型并非一個內容端的創作工具,而是一座連接當前AI與未來“具身智能”的橋梁,是讓AI學會“常識”與“因果”的關鍵基礎設施。
AI學術大佬、科技巨頭爭相布局
人工智能先驅們幾乎一致認為,世界模型對打造下一代人工智能至關重要。許多人表示,該技術終將助力創造超越人類的AGI。
斯坦福大學教授、人工智能“教母”李飛飛創立了世界模型初創公司World Labs,據知情人士本月透露,“AI教母”李飛飛正與投資者展開新一輪洽談,該公司最新估值有望達到約50億美元;早些時候的消息顯示,“AI教父”楊立昆的世界模型初創公司AMI Labs在一輪融資中吸引了包括Cathay Innovation在內的潛在支持者,該輪融資可能使這位前Meta首席人工智能科學家的公司估值達到35億美元;英偉達CEO黃仁勛早早表態,世界模型能助力實現“物理人工智能”,自主操控機器人、自動駕駛汽車等設備;Meta的超級智能AI實驗室與機器人團隊合作,正是為了構建世界模型,通過模擬現實世界物理規律,為機器人提供空間感知和精細操作能力,彌補現有機器人的不足……
當然,作為初期成果,Project Genie為代表的世界模型仍非常不成熟。以Project Genie為例,該模型每次生成和探索的時間被嚴格限定在60秒以內,生成的世界在物理效果上可能不夠逼真,有時無法精確遵循提示詞或現實世界的物理定律,角色的操控也時常出現延遲或響應不精確的問題。此外,一些在早期演示中提及的高級功能,如通過即時指令改變世界事件,尚未在此版本中實現。
這些限制部分源于世界模型巨大的計算消耗,這也是當前AI模型技術面臨的核心矛盾。DeepMind的研究人員坦言,用戶每使用一次,背后都有一塊專用的計算芯片為其服務。每一次看似輕松的“造世”,背后都依賴專用計算芯片的全功率運轉。這決定了它在現階段,更像一扇僅供窺探未來的窄窗,而非可以隨意出入的大門。
游戲或成世界模型的首個試水行業
谷歌DeepMind、World Labs等領先的AI團隊都認為,世界模型可能會首先重塑游戲、影視行業。
傳統的3D資產創建與場景搭建是人力與時間密集型的核心環節。Project Genie展示的可能性是,將部分前期概念設計、場景原型構建乃至動態分鏡預覽的過程,壓縮至幾分鐘甚至幾秒鐘。這并非要取代專業的創作引擎,而是可能重塑創作流程的起點,極大地釋放創意驗證的速度。
DeepMind世界模型項目Genie 3的聯合負責人Shlomi Fruchter此前表示:“軟件開發,尤其是游戲開發,正在發生巨大變化,我預計在未來幾年,這種變化甚至可能是徹底性的。”
去年年底,World Labs正式推出了其首款商業產品、由生成式AI驅動的三維世界生成系統Marble。李飛飛表示,這項技術將影響Unity和Epic旗下Unreal等游戲引擎,“這一切都將被顛覆,模擬類游戲引擎確實到了該升級的時候了。”
除了游戲領域,xAI、英偉達等公司,也希望將世界模型嵌入機器人和自動駕駛汽車中。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.