![]()
HappyOyster官網視頻截圖
阿里巴巴今日正式發布世界模型產品 HappyOyster(快樂生蠔),該產品支持用戶實時構建可互動、可演繹、可探索的 AI 數字世界(官網鏈接:https://www.happyoyster.cn/)。這是繼視頻生成模型HappyHorse 之后,阿里 ATH 創新事業部在 AI 領域的又一重磅發布。
據悉,HappyOyster 基于原生多模態架構構建,支持多模態理解與音視頻聯合生成,目前已實現漫游(Wander)和導演(Direct)兩大核心能力。用戶生成的數字世界不僅能被完整保存,還可開放給其他用戶進行二次創作,不過該產品目前處于限量早期體驗階段。
世界模擬器流派的差異化競爭
相比大語言模型相對成熟的模型架構和技術范式,世界模型仍屬于前沿探索領域。阿里的 HappyOyster 與谷歌的 Genie3 同屬于"世界模擬器"流派。區別于傳統文生視頻模型"輸入提示詞—等待渲染—獲得成片"的被動流程,這一流派采用長時間跨度上的世界演化建模方式。
通過學習海量長視頻數據,以及文本、動作指令、圖像參考等多樣控制信號,模型能夠主動理解空間、物理與因果規律,預測情節和畫面的演變,從而把"被動生成內容"轉變為"主動模擬世界演化"。據阿里官方產品介紹,HappyOyster 采用了時間跨度更長的世界演化建模方式,使得模型能夠保持高保真、長時序的動態場景生成。
在國際競爭格局中,騰訊已于同日發布并開源混元 3D 世界模型 2.0(HY-World 2.0),該模型可直接生成可二次編輯的 3D 資產文件,支持與現有游戲工作流無縫對接;Alphabet 旗下谷歌則運營著閉源的世界模型 Genie 系列。此次阿里入局,標志著中國科技公司在這一前沿領域的進一步布局。
在產品能力上,HappyOyster 差異化優勢在于,漫游模式(Wander)下,用戶僅需一句話或一張圖,即可生成具備物理一致性的完整空間,物體位置穩定、場景持久存在,視角與光照也能跟隨第一人稱視角持續移動。目前 HappyOyster 支持長達 1 分鐘的連續實時位移與鏡頭控制,并支持多樣化的風格切換。
導演模式(Direct)則是 HappyOyster 的獨家功能。用戶能夠在視頻的任意節點,通過文字、語音或圖像等多模態輸入,隨時實現鏡頭切換、劇情改寫、角色調度,在充分的交互中生成一個光照、重力、角色動作與場景因果持續演化的世界,并能選擇題材風格。目前,導演模式支持連續生成 3 分鐘以上的 480p 或 720p 實時畫面。
值得注意的是,當前漫游與導演兩大模式尚未完全打通。未來用戶有望在漫游過程中直接與世界深度互動、實時改寫場景規則,真正實現邊探索、邊創造的無縫融合體驗。
場景:游戲、影視、文旅
世界模型的發展仍處于早期階段,但在實際應用中,HappyOyster 已在改變傳統的內容創作模式和交互體驗。
在游戲領域,開發者可快速生成可玩原型,玩家能實時驅動世界演化,無需預設腳本即可實現動態劇情分支與開放世界探索,大幅降低內容生產成本并提升沉浸感。在影視創作中,導演無需等待漫長的渲染周期,只需用自然語言描述創意,系統即可實時生成分鏡畫面,并支持在視頻的任意節點改變鏡頭、角色和劇情,讓創意驗證時間大大縮短。
在文旅與教育領域,用戶不再被動觀看歷史復原視頻,而是能以第一視角走進名畫現場或過往文明,在交互中探索因果、改寫走向,實現從知識傳遞到沉浸體驗的躍遷。
未來,HappyOyster 還能應用于線下智能空間或娛樂場景,例如與穿戴設備等智能硬件結合,根據人的位置、動作與語言動態,實時生成沉浸式內容,讓數字世界與現實共振。
此次發布是阿里近期密集推出 AI 產品的最新動作。據報道,阿里巴巴已將云計算與 AI 業務確立為核心增長引擎,并設定目標,計劃在五年內將相關年收入提升至 1000 億美元。阿里集團 CEO 吳泳銘在 2026 財年 Q3 財報電話會議上宣布了這一目標,較現有規模增長約五倍。財報顯示,阿里云本季度收入同比增長 36%,AI 相關產品收入連續第十個季度實現三位數增長。
HappyOyster 由阿里旗下新設業務單元 Token Hub(ATH 創新事業部)研發,與此前發布的 HappyHorse 同屬一個團隊。阿里近期持續加快 AI 產品發布節奏,并對內部組織架構進行調整,以強化技術商業化落地能力,推動前期投入轉化為實際營收。
世界模型的"iPhone 時刻"何時到來?
盡管技術層面展現出差異化優勢,但 HappyOyster 的商業化路徑仍待觀察。目前該產品僅向部分用戶開放早期訪問權限,大規模商業化模式尚未明確。
世界模型作為前沿探索領域,其技術成熟度與市場接受度仍需時間驗證。相較于大語言模型已形成相對清晰的商業模式,世界模型在游戲、影視、文旅等場景的付費意愿、定價策略、生態建設等方面仍有待探索。此外,如何平衡生成質量、實時性與成本控制,也是產品規模化過程中需要解決的問題。
在國際競爭中,谷歌 Genie 系列仍保持閉源狀態,已積累較多技術儲備;騰訊混元 3D 世界模型 2.0 采取開源策略,可直接導出 3D 資產文件搶占開發者生態。阿里 HappyOyster 選擇在此時入局,既是對自身多模態技術能力的信心體現,也是在 AI 基礎設施層面的戰略布局。
從技術演進角度看,HappyOyster 的發布標志著世界模型從實驗室研究向產品化邁出關鍵一步。其漫游與導演的雙模式設計,為交互式內容創作提供了新的可能性。然而,正如大語言模型經歷了多年迭代才迎來 ChatGPT 的爆發,世界模型距離真正的"iPhone 時刻"或許仍有距離。
對于阿里而言,HappyOyster 不僅是技術實力的展示,更是其在 AI 時代爭奪內容生產基礎設施話語權的重要嘗試。在谷歌、騰訊等巨頭的環伺之下,這款產品的市場表現與技術迭代速度,將決定阿里能否在世界模型賽道占據一席之地。(本文首發鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 秦聰慧)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.