網易首頁 > 網易號 > 正文申請入駐

螞蟻深夜開源比肩Genie 3的世界模型，我也看到了具身智能的未來。

2026-01-29 10:06:47　來源: 數字生命卡茲克

天津舉報

分享至

AI圈最近是卷瘋了嗎，模型跟不要錢一樣kuku的往外發。

今天凌晨的時候。

螞蟻在毫無預兆的情況下，他們旗下的具身智能公司，靈波科技，開源了一個非常非常離譜的世界模型。

LingBot-World。

我其實本身是真的沒有當回事的，就是因為我對世界模型還比較關注，就隨手點進去看了眼。

結果，我真的有點停不下來了，我在這個頁面里，花了半個小時的時候，幾乎看完了所有的案例。

我是真的覺得有點離譜，幾乎可以對標Google Genie 3的質量，而且，開源。

我直接放個case。

一個1分鐘的，第一人稱探索的視角。

我不知道你們是什么感覺，如果玩游戲很多的朋友，可能會說，這有啥稀奇的，不就是一個普通的游戲里面的那種廢棄小鎮場景嗎，不就是第一人稱在里面探索嗎。

對，但是如果你知道，這一切的源頭，這個世界里面所有的一切，都是根據你的方向鍵，用視頻動態生成的。

我相信你一定會有不一樣的感覺。

這是一個完完全全的，一邊探索一邊生成的世界。

這個視頻里面的一切，都是實時交互的，實時按鍵實時運動的。

言出法隨，指哪打哪。

我凌晨1點多，第一次看到這個demo，同時意識到，這是一個世界模型的時候，我其實是起了一些雞皮疙瘩的。

還有這個，實時生成的巨物壓迫感，真的非常的真實了。

最離譜的是這個。

一個10分鐘的視頻，他們讓模型一個人就這么沿著古建筑群瞎逛，逛了整整十分鐘，中間確實偶爾有一些變形，但是，到最后了，這個古建筑居然沒有崩掉，太離譜了。

之前測過一個叫 Odyssey的世界模型產品。

別說10分鐘了，1分鐘就直接崩成這樣了。

而且毫無記憶能力，我只要一回頭，這個世界就變了樣，而且是每回頭一次，它就變一次。

相當的嚇人。。。

如果說要跟Sora、可靈這種視頻生成模型最大的區別是什么，我那覺得，一個是預先錄制的電影，另一個是可實時演算的模擬器。

視頻生成模型，是他已經把整部電影拍完、剪好，加好特效，然后放給你看。

畫面很精美，故事很完整，但你是純粹的觀眾，只能被動接受，無法改變任何事。

而LingBot-World，你按W，它就往前生成世界，你按A，它就往左拓開空間。

你輸一句“下雨了”，天空就真的變陰云密布，你說“來點煙花”，遠處城堡上空立刻炸開一朵。

所有的一切，都是邊走邊算出來的，而不是提前渲染好放給你看。

前者是敘事的終點，后者是世界的起點。

太離譜了，要知道，這個模型，是跟之前Google Genie 3的路線一致，是可實時生成的世界模型。

老粉可能還記得，我去年寫過。

這篇文章到現在也是我覺得是我的一個很大的遺憾，它明明那么強，可是我沒有把它寫火讓更多的人看到，這是我的問題。

我一直都非常關注這種可交互的實時生成的世界模型，但是坦率的講，Genie 3之后，幾乎再無同類，而且已經幾個月了，Genie 3到現在也不能體驗上。

但今天，不僅有了，而且，還開源，甚至他們，把論文都發出來了。

真的有點不敢相信這是我之前認知里那個螞蟻。。。

項目網址在此： https://technology.robbyant.com/lingbot-world

目前已經在github上開源了第一個版本，另外兩個版本等待放出。

這三個版本我大概解釋一下。

LingBot-World-Base (Cam) 代表Base系列里帶Camera Poses控制的版本。

你在推理時會額外喂相機位姿或相機運動軌跡這類信號，所以它更擅長把鏡頭運動做得可控，適合你想明確指定推進鏡頭、環繞、俯仰、平移這類拍法的場景。

表里寫的480P和720P也對應它當前提供的推理配置，這個版本目前已經放出權重和下載鏈接。

LingBot-World-Base (Act) 代表Base系列里帶Actions控制的版本。

這里的 Actions 更像“動作指令”或“行為控制”，讓你能用更結構化的方式去約束主體怎么動，往哪走，抬手，轉身之類。

它的目標是把可控性從鏡頭擴展到行為層面，目前等待開源中。

LingBot-World-Fast代表Fast系列，核心取向是低延遲與實時交互，一般會通過結構改造與加速手段，把推理做得更適合流式生成和邊交互邊出畫面。

代價通常是質量上限會比 Base 略低一點點，優勢是響應更快更像實時世界模擬，延遲能低于1秒，能做到每秒16幀，目前等待開源中。

模型參數量在28B左右，推理應該在14B。

在看完了所有的case，以及論文以后。

我給它總結了3個特點。

分別是長時記憶很穩定、風格泛化性極強、很棒的動作代理。

一. 長時記憶很穩定

說實話，我們看世界模型，最核心的一個東西，看的一定是長時記憶。

就跟我們用文本大模型一樣，他能不能記住前面的那么多的信息，這個事非常的重要。

而在世界模型里，這個事，尤為重要，甚至就是第一位的。

如果沒有長時記憶的模型，你可以想一想這個場景，你去廁所拉屎，打開了廁所門，進門，掀開馬桶蓋，一回頭，廁所門沒了，變成了一個不知道通往哪的過道，你再一回頭，馬桶也沒了，變成了一個小女孩就這么瞪著你。

現在是凌晨3點20多，我寫下這段話的時候，我還忍不住回頭看了好幾次，我說實話，我真的突然有點慌。。。

這就是沒有長時記憶的問題。

可能在文字輸出的時候，他不記得之前的事了，可能影響還沒那么大。

但是在一個可以互動的世界里，如果沒有了長時記憶，那就成了徹頭徹尾的恐怖片了，我們俗稱，鬼打墻。。。

而 LingBot-World解決了這個問題。

比如說這個case。

可以看到，在這個過程中，在這個廊橋上，不管你怎么走，前看后看左看右看，那些建筑也絕對一直都在，甚至高墻和后面的建筑的遮擋關系，都會隨著你行走的距離而改變，當你扭頭看向別處的時候，回頭看，還在。

這個長時記憶，就太牛逼了。

還有這個。

從看到這個開始，然后從肚皮下面穿越過去，在差不多的時候，你可以看到，你的視角是真的穿過了這個異獸的橫向面積，讓你感受到很真實。

而沒有長時記憶的世界模型，可能在你穿的時候，直接就在它的肚皮下面穿了將近1分多鐘，甚至就在那鬼打墻了一直穿不過去，明顯時間尺度和距離尺度都不對。

而Lingbot-World在這點上，就表現的非常好。

二. 風格泛化性極強

很多的世界模型，其實在風格上都比較固定。

只能搞現實世界的，就是超寫實的那種，但是一旦涉及到非寫實的，一般效果就非常的差了。

但是lingbot-World居然保持的相當好。

比如這個例子。

明顯能感覺到，雖然大劍還稍微有一點點不穩定，但是其他的地方，保持的非常好，已經媲美一些游戲的質感了。

還有這個。

在這種畫風下，整個世界模型沒有崩塌，這一點其實非常的難能可貴。

核心其實在于LingBot-World在訓練的時候，真實視頻、游戲錄像、UE合成場景，全塞在一鍋里里面訓了，他們搞了大量游戲世界的數據，還有UE的合成數據。

現實世界的視頻負責教它物理世界大概長啥樣，游戲世界負責教它人類在虛擬世界里是怎么玩的，然后合成世界則負責補齊那些現實很難系統采集的視角，比如各種極端運動軌跡、復雜相機路徑、極限視角。

對模型來說，這三種東西在輸入上其實是統一的。

就是都是一幀一幀的視頻，外加相機位置、動作指令、文本描述。

它其實并不會像人類那樣心里有一條線，說哦這是真實的，哦這邊是游戲，它看到的只是不同分布的像素序列。

這一點其實有點像機器人領域的域隨機化。

就是很多具身公司，在做仿真訓練的時候，經常會把地面材質、光照、物體貼圖全打亂，讓機器人習慣各種詭異的組合，這樣下放到真實世界的成功率反而更高。

Lingbot-World在這塊做的相當好。

三. 很棒的動作代理

世界模型如果只會自己滾動，不會被控制，那最多也就是一個超長、有記憶的屏保。

真正好玩的是，當你把WASD和方向鍵綁上去，甚至把一個動作代理塞進去，在你操控的同時，里面的角色還可以自主行動和規劃。

從而涌現出一些全新的事件和玩法，而不是那種單純的，步行模擬器，只會單純的走路和跑步而已。

比如這個。

你可以明顯的看到，這個布偶隨著方向的變化，而自主在房間里進行運動，在過程中還碰到了沙發，從而掉頭，避免了穿模。

還有這個。

并不是千篇一律的滑行，而是有急停、有變道，有自主運動。

這一點也是完全不一樣的點，是我從來沒有見過的，很新，也很強。

看了下論文，LingBot-World在動作這塊，主要干了兩條線的事。

一條線是最直接的，你自己按鍵。

你按 W，它往前生成，你按S，它往后拉，你長按A，它會幫你推演側身走一段路應該是什么樣子，這個看著好像理所當然，但其實背后代表著模型已經學會了一種還蠻重要的東西。

動作不是單幀的，而是一個連續意圖。

你按一下W，它不會只管下一幀往前挪一點點，而是會在內部自動幫你補出一整個往前走兩三步的節奏，把腿步伐、相機抖動、視差變化協同起來。

否則你按W一下停一下，畫面只會抖成幀動畫。

另一條線，是他們搞的那個AI玩自己世界的動作代理。

你可以把它理解成給LingBot-World添了一個玩家。

這個玩家看不到底層張量，它只看畫面和一些文字提示，然后決定“我要往哪走”“我要不要拐彎”“我要不要停下來多看一眼”。

論文里是用一個微調的視覺語言模型來做這件事，看一幀圖，輸出接下來幾秒鐘的命令，讓 LingBot-World去執行。

所以還真的挺有意思的，就真的像，我們在玩游戲的感覺。

只不過這個游戲，我們是觀測者，我們決定向什么方向去，而AI，會在生成的空間，自主運動。

這一點，確實是一個非常有意思的創新。

LingBot-World很強，很有意思，讓我突然有了一種。

24年春節2月16號的時候，同樣的深夜，同樣的凌晨，看到Sora的那一刻。

世界模型，一直是一個全新的、未被探索、還有廣闊空間的領域。

他不僅對游戲、對影視、對娛樂都有非常強的意義。

而真正我覺得最核心的場景，其實是為了具身智能，一個優秀的、泛化能力強的世界模型，也能為具身的訓練，為他們對現實世界的理解和長程任務，提供低成本高保真的試錯空間。

世界模型，也是AI真正由虛到實，進入我們現實空間中的必要條件之一。

而螞蟻，居然是螞蟻。

把這個進程，向前推了一大步。

并且直接選擇開源，造福所有人。

我很少會對一個技術demo感到興奮，而最近的興奮，坦誠的講，幾乎都來自世界模型。

而LingBot-World讓我又有了當年最開始玩AI的那種感覺。

世界模型成熟之后，來臨的，必然就是井噴式的、進入我們實體世界的、隨處可見的具身智能們。

而那時。

才是我心中，真正的AI時代。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉發三連吧，如果想第一時間收到推送，也可以給我個星標?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克

>/ 投稿或爆料，請聯系郵箱：wzglyay@virxact.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

具身數據戰開打！普通人都能上手，邊采邊篩，只喂機器人愛吃的

量子位 2026-01-12 12:20:02
0 跟貼 0
世界模型==VQA？機器人不用想象畫面，預測語義就夠了

機器之心Pro 2025-10-28 10:14:22
1 跟貼 1

ReconVLA：具身智能研究首次獲得AI頂級會議最佳論文獎

機器之心Pro 2026-01-26 13:51:30
0 跟貼 0

春晚機器人天團：宇樹成三朝元老，銀河通用悶聲發財

量子位 2026-02-16 13:12:39
1 跟貼 1
美國開發六足機器人，跑起來堪比飛人博爾特

裝甲鏟史官 2026-01-03 11:19:04
798 跟貼 798

新穎鰭足機器人，水陸兩棲行動自如，適應各種地形

裝甲鏟史官 2025-12-25 10:58:04
1 跟貼 1

馬斯克：3年內機器人超越頂尖醫生

財聯社 2026-01-09 15:31:35
1 跟貼 1
波士頓機器狗練成“輕功”！連續七個后空翻

量子位 2025-09-07 01:03:18
21 跟貼 21

對話鹿明機器人：在具身智能的“數據荒”里，做一個送水人｜AI Founder 請回答

鈦媒體APP 2026-01-11 12:48:38
0 跟貼 0
人形機器人產業突破關鍵在于“大腦”核心技術

每日經濟新聞 2025-09-16 20:30:32
1 跟貼 1
人形機器人，霸屏春晚！《武BOT》如何驚艷全場？王興興揭秘機器人“練功秘籍”

每日經濟新聞 2026-02-17 10:26:25
0 跟貼 0
Seedance 2.0畫出駿馬與繁花，人形機器人首次開口演小品，豆包、千問、元寶爭相用紅包“炸開”用戶手機??揭秘2026年春晚AI“煙火氣”

每日經濟新聞 2026-02-17 10:05:09
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
三維空間太難懂？1

機器之心Pro 2025-12-31 13:49:25
0 跟貼 0
靈巧手作為獨立執行平臺，實現工業與家庭場景應用

量子位 2025-12-11 03:38:13
0 跟貼 0
讓機器人看視頻學操作技能

機器之心Pro 2026-01-19 13:12:57
0 跟貼 0
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0
機械手真正「活」了04

機器之心Pro 2025-11-06 14:07:32
0 跟貼 0
破解機器人「慢半拍」難題1

機器之心Pro 2026-02-10 14:06:54
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
最強開源大模型除夕登場！397B參數千問3.5超越Gemini 3

量子位 2026-02-16 19:08:19
11 跟貼 11
2026年，大模型訓練的下半場屬于「強化學習云」

機器之心Pro 2026-01-12 14:03:47
0 跟貼 0
英特爾具身智能機器人，竟解鎖了rap技能

機器之心Pro 2025-11-26 15:20:41
0 跟貼 0
小心！你的AI正在一本正經地忽悠你

財聯社 2026-02-05 16:35:01
0 跟貼 0
剛剛，春節殺手锏“源神”登場！

智東西 2026-02-16 19:15:13
1 跟貼 1
人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
微軟AI掌門放狠話：12-18個月，多數白領工作將被AI徹底替代？

鈦媒體APP 2026-02-17 11:55:20
0 跟貼 0
當螞蟻遇到食物會怎么樣

小豹子樂園 2026-02-13 11:48:11
1 跟貼 1
世界上投籃最強的人，連投籃機器人也無法戰勝，是如何訓練的？

王小開心 2026-02-14 02:40:01
8 跟貼 8
螞蟻出手VLA

機器之心Pro 2026-01-28 14:14:24
0 跟貼 0
具身智能守年關

光子星球 2026-02-14 15:04:37
1 跟貼 1
看似只有十歲的小姑娘，真實身份竟是機器人

快樂追劇吧 2026-02-15 12:29:30
1 跟貼 1
除夕重磅！千問開源Qwen3.5，最大吞吐量提升至19倍

DeepTech深科技 2026-02-16 21:37:36
1 跟貼 1
雙王對決大結局：行軍蟻雖猛，卻敗給了天意！

痞子說動物 2026-02-16 09:51:47
1 跟貼 1
館長2.16看春晚機器人表演中國大陸現在的發展不要小瞧

冷白喵 2026-02-17 09:15:16
0 跟貼 0

劉青山處決前夕被嚇傻，當聽清楚行刑前的措施后，感動地嚎啕大哭

史之銘

2026-01-20 03:27:11

不上市的字節，正在改寫中國互聯網的戰爭規則

新浪財經

2026-02-15 23:17:51

除夕當天，安徽通報：魏學林被查

上觀新聞

2026-02-16 21:47:10

“收費時代”來了？原本免費的東西開始收費，網友：是搶瘋了嗎？

復轉小能手

2026-02-14 22:21:17

中國收到以色列警告，稱若協助伊朗發展核武器，將面臨災難性后果

紀中百大事

2026-02-16 11:29:14

痛心！10歲男童吃豬腳卡喉身亡，母親：為何一口肉要了他的命

環球網資訊

2026-02-15 11:31:16

炸裂！王菲出席春晚，助理提裙被攔下，王菲當場扯掉走人，太酷了

淡淡稻花香s

2026-02-15 02:15:28

為什么領導很少生病請假，總是精力充沛？主要有這4點

細說職場

2026-02-11 17:27:08

離岸人民幣兌美元上漲176.0個基點，報6.8835

每日經濟新聞

2026-02-17 06:56:04

春晚魔術火了，有人提前押中春晚魔術，鄧男子這套是魔法還是代碼

新金牌娛樂觀察家

2026-02-17 09:08:23

退休后的同學聚會，撕開了“體制內”和“體制外”的那層遮羞布

朗威談星座

2026-02-17 03:51:37

特朗普下達最后通牒，要臺當局立即付1.25萬億，否則取消對臺軍售

音樂時光的娛樂

2026-02-17 11:14:55

高市早苗大獲全勝之后，我們一些人真該好好反思

少年一白

2026-02-11 02:54:53

王菲六登春晚，獻唱《你我經歷的一刻》，水滴鉆石耳環再次出圈

可樂談情感

2026-02-16 22:32:46

西甲-丟掉榜首！亞馬爾失點+失單刀巴薩1-2遭赫羅納絕殺

見聞新視野

2026-02-17 11:04:22

回顧“91女神”琪琪：五官出眾，卻因天真讓自己“受傷”

就一點

2025-11-22 10:36:39

豐田章男：如果只造我喜歡的車，那就只有GR卡羅拉和GR雅力士

IT之家

2026-02-14 15:11:08

這就是回家要脫褲子才能上床的原因！網友：看完天都塌了！

夜深愛雜談

2026-02-07 19:05:55

王毅警告日本后，新加坡對日態度大變，高市突然給全體華人拜年

東極妙嚴

2026-02-17 09:08:55

軟件崩完物流崩！AI正在血洗股市，普通人只剩這一條活路

侃故事的阿慶

2026-02-16 22:18:13

數字生命卡茲克

反復橫跳于不同的AI領域，努力分享一些很酷的AI干貨

461文章數 539關注度

往期回顧全部

科技要聞

春晚這些機器人是怎樣做到的？

頭條要聞

蔡磊一家三口出鏡送祝福兒子將手放在他手上輕輕撫摸

頭條要聞

蔡磊一家三口出鏡送祝福兒子將手放在他手上輕輕撫摸

體育要聞

谷愛凌：'不小心"拿到了銀牌祝大家馬年大吉

娛樂要聞

春晚三大感人瞬間：周深于和偉上榜

財經要聞

大年初一，這三件事很不尋常

汽車要聞

問界M6更多信息：乾崑智駕ADS4.0+鴻蒙座艙5.0

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

本地

房產

時尚

公開課

旅游要聞

和縣光影秀點亮新春佳節

本地新聞

春花齊放2026：《駿馬奔騰迎新歲》

房產要聞

三亞新機場，又傳出新消息！

今年春天最流行的4組配色，過年穿時髦又高級！

公開課

手機 / 數碼

房產 / 家居

螞蟻深夜開源比肩Genie 3的世界模型，我也看到了具身智能的未來。

春晚這些機器人是怎樣做到的？

蔡磊一家三口出鏡送祝福 兒子將手放在他手上輕輕撫摸

蔡磊一家三口出鏡送祝福 兒子將手放在他手上輕輕撫摸

谷愛凌：'不小心"拿到了銀牌 祝大家馬年大吉

春晚三大感人瞬間：周深于和偉上榜

大年初一，這三件事很不尋常

問界M6更多信息：乾崑智駕ADS4.0+鴻蒙座艙5.0

態度原創

春花齊放2026：《駿馬奔騰迎新歲》

三亞新機場，又傳出新消息！

今年春天最流行的4組配色，過年穿時髦又高級！

蔡磊一家三口出鏡送祝福兒子將手放在他手上輕輕撫摸

蔡磊一家三口出鏡送祝福兒子將手放在他手上輕輕撫摸

谷愛凌：'不小心"拿到了銀牌祝大家馬年大吉