<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      浙大教授章國鋒帶隊創(chuàng)業(yè),打造無限時長實時3D世界模型

      0
      分享至



      編輯|澤南

      AI 領域最前沿的方向「世界模型」,正在出現(xiàn)一場革命。

      互聯(lián)網(wǎng)上,OpenClaw 的「賽博龍蝦」在虛擬數(shù)字世界中靈活穿梭,無所不能;現(xiàn)實中,具身機器人卻依然受困于試驗場的圍欄,難以邁向復雜的物理空間。這道橫跨虛擬與現(xiàn)實的鴻溝,本質(zhì)上是智能體對空間智能(Spatial Intelligence)感知的缺失。

      2024 年,被譽為「AI 教母」的李飛飛教授創(chuàng)立World Labs強勢入局,正式點燃了空間智能這一千億級賽道的全球戰(zhàn)火。就在不久前,該公司完成了最新一輪融資,估值直接飆升至 50 億美元RTFM(實時幀模型)是 World Labs 去年 10 月發(fā)布的實時生成式世界模型,其核心在于構(gòu)建一個擁有永久一致性(Persistence)的 3D 場景,讓智能體不僅能「看見」空間,更能真正理解并實時交互物理世界。

      在 50 億美元估值神話的背后,這一空間智能的最新高地正被國內(nèi)創(chuàng)業(yè)公司攻克并推向產(chǎn)業(yè)縱深。近日,影溯(InSpatio)正式發(fā)布并開源了其實時幀生成模型InSpatio-WorldFM,一個實時交互的 3D 世界模型。這標志著中國團隊在空間智能底層技術(shù)上取得了奠基性突破,而且以開放的姿態(tài),正成為推動 AI 從虛擬屏幕走向物理現(xiàn)實的關(guān)鍵破局者。



      • InSpatio-WorldFM 項目主頁:https://inspatio.github.io/worldfm/
      • 模型 GitHub:https://github.com/inspatio/worldfm
      • 模型在線體驗:http://www.inspatio.com/worldfm

      InSpatio-WorldFM 的發(fā)布和開源不僅是對全球頂尖技術(shù)路線的快速響應,更是中國團隊在空間智能領域的獨立思考。由浙江大學計算機輔助設計與圖形系統(tǒng)全國重點實驗室教授、國家杰青章國鋒博士領銜,影溯憑借在 3D 視覺和空間計算領域深耕 20 多年的底蘊,跳出了單純依賴極稀缺「原生 3D 數(shù)據(jù)」的傳統(tǒng)路徑,通過獨創(chuàng)的「數(shù)據(jù)升維」與「幾何約束」策略,成功激活了互聯(lián)網(wǎng)海量 2D 存量視頻數(shù)據(jù)中蘊含的 3D 空間知識。

      這一技術(shù)路徑精準破解了困擾行業(yè)已久的「高質(zhì)量、規(guī)模化 3D 數(shù)據(jù)貧礦」局限,將海量 2D 存量數(shù)據(jù)高效轉(zhuǎn)化為驅(qū)動 3D 世界模型的高維原動力。

      InSpatio-WorldFM 能夠高效地進行多視角一致的空間推理,并支持實時交互式探索。它的效果是這樣的:



      該項目發(fā)布后迅速獲得硅谷多位 AI 領域意見領袖轉(zhuǎn)發(fā)關(guān)注,在線 Demo 訪問量短時間內(nèi)激增,一度出現(xiàn)排隊和訪問擁堵。



      得益于 3D 的模型機制,其生成的虛擬世界有高度的一致性,模型生成的場景在空間幾何與光照與物理規(guī)律上非常穩(wěn)定,無限時長推理不會出現(xiàn)遺忘和衰退。

      值得關(guān)注的是,相比以往的世界模型,InSpatio-WorldFM 對于算力的需求很低。影溯的目標是讓實時的空間推理能在消費級 GPU 上實現(xiàn),將空間智能從數(shù)據(jù)中心擴展到邊緣設備 —— 甚至在單塊 RTX 4090 GPU 上就能實現(xiàn)實時的推理,這就一下子打開了商業(yè)價值的想象空間。

      生成的空間還支持整體一致性編輯 —— 不再是對單個物體或局部區(qū)域的零散修改,而是在保持幾何結(jié)構(gòu)、光照關(guān)系、材質(zhì)屬性與物理邏輯全局一致的前提下,進行跨視角、跨區(qū)域的統(tǒng)一調(diào)整。

      比如從這樣:



      到這樣:



      無論是整體風格遷移、空間布局重構(gòu),光照材質(zhì),系統(tǒng)都能確保改動在所有視角與后續(xù)生成結(jié)果中保持一致,避免「前后打架」或「視角錯位」。

      換句話說,它編輯的不是一幀圖像,而是一個可控、連貫、具物理約束的三維世界本體

      技術(shù)路線

      維度突破,構(gòu)建原生 3D

      目前,不論是科技巨頭還是創(chuàng)業(yè)公司都在加速發(fā)力世界模型。

      圖靈獎得主 Yann LeCun 曾多次表示,僅靠預測下一個 token 的生成式模型無法真正做到理解現(xiàn)實世界,世界模型將會是 AI 下一次技術(shù)突破的大方向。然而當前絕大多數(shù)主流的世界模型、圖像生成模型(如谷歌的 Genie 3、OpenAI 的 Sora)進行 2D 像素概率預測的本質(zhì),并不符合技術(shù)前進的需要。

      目前絕大多數(shù)的世界模型,如谷歌的 Genie3、英偉達 Cosmos、Runway GWM-1、Lingbo-World、PixVerse R1 等,本質(zhì)上都是基于 2D 的視頻生成模型,其每個時刻的空間狀態(tài)都是由平面的 2D 圖像進行表達。但物理世界是 3D 的空間,AI 要和物理世界交互,空間狀態(tài)的表達也應該是 3D 的。

      影溯所走的技術(shù)路線在于善用「第一性原理」,不再執(zhí)著于逐像素地生成畫面,而是構(gòu)建原生的 3D 世界。

      這意味著需要走一條更具挑戰(zhàn)的路,讓模型學會對真實世界傳感器數(shù)據(jù)進行抽象建模,過濾掉不可預測的噪聲信息,并在更高層次的表征空間中進行預測與推理。

      對此,影溯沒有選擇從零開始學習物理常識,而是將互聯(lián)網(wǎng)海量 2D 存量視頻數(shù)據(jù)中蘊含的 3D 空間知識成功激活。通過精確控制,他們反向抽取出其中蘊含的三維幾何與物理規(guī)律。在其生成的 3D 世界中,人或 AI 也可以自由地行動,不必擔心會出現(xiàn)不可靠的細節(jié)。

      正是基于獨特的 3D 技術(shù)路線,影溯的世界模型可以有效解決目前 AIGC 工具「盲盒抽卡」的痛點,不僅能在實時生成的場景自由漫游,而且支持將視頻中的動態(tài)前景無縫轉(zhuǎn)移到另一個空間環(huán)境中,并且能嚴格保證轉(zhuǎn)移后的前景與新背景在空間幾何、光照、物理規(guī)則上的高度一致性。 一次生成,精準可控,徹底告別反復重試的算力浪費。



      可以看出,影溯的模型在背景變換與運鏡控制上,展現(xiàn)出卓越的像素級前景鎖定能力和精準運鏡控制,其主體一致性與運鏡穩(wěn)定性已超越當前主流的世界模型與視頻生成模型。尤為突出的是,即使背景完全變換、光線隨新環(huán)境自然適配,前景主體的光照依然能與新背景保持高度一致,細節(jié)與結(jié)構(gòu)毫發(fā)無傷、紋絲不動。

      影溯團隊透露,其世界模型的訓練僅僅動用了 100 張卡的算力規(guī)模,遠低于現(xiàn)在視頻模型訓練所需要的算力。當大廠還在用萬張顯卡暴力猜測「下一個 2D 像素是什么」時,影溯直接在底層構(gòu)建了物理引擎的 3D 骨架。計算物理場,遠比窮舉像素更省算力。

      具體來說,影溯這次開源的 InSpatio-WorldFM 具備三大特性:

      突破 2D 限制:賦予空間智能一致性

      在嘗試當前的先進 AI 視頻生成工具時,你一定遇到過這樣的尷尬:鏡頭一轉(zhuǎn),原本的人物變形了,背景里的建筑憑空消失或發(fā)生了扭曲。這種現(xiàn)象的本質(zhì),是因為基于 2D 的 AI 模型只是在進行像素級的二維變化預測,它們并不懂什么是真正的物理世界。

      InSpatio-WorldFM 拋棄了純 2D 的學習路徑,將「三維多視圖一致性」作為內(nèi)容生成的核心約束機制。無論是在預計算階段還是實時推理中,模型都被強制要求理解并保持 3D 空間結(jié)構(gòu)的連貫性。



      多視一致的生成模型

      于是在 InSpatio-WorldFM 生成的世界里,物體不僅具備真實的物理體積,而且不會隨時間發(fā)生漂移或形變。它賦予了空間智能最稀缺的品質(zhì) —— 物理級的持久一致性。

      InSpatio-WorldFM 在構(gòu)建 3D 世界時,可以保持生成的場景在時空上的持久一致性,無論在這個虛擬空間里轉(zhuǎn)多久,場景都不會像其他 AI 生成的視頻那樣崩壞變形,這對影視制作、游戲資產(chǎn)和具身智能來說是殺手級特性,證明了模型不是在「畫畫」,而是在「計算物理場」。由此生成的虛擬世界不再只是炫酷的視頻,而是直接為未來的機器人生準備的數(shù)以萬計的虛擬訓練場。

      這種 3D 機制突破了 2D 視頻模型的極限時空記憶,解決了世界模型一直以來頭疼的「長時序遺忘」和「空間幾何崩塌」問題。

      實現(xiàn)高效率

      InSpatio-WorldFM 構(gòu)建了輕量化與高效率的框架。通過基于幀的架構(gòu),輔以模型蒸餾和推理優(yōu)化技術(shù),影溯成功地壓縮了龐大的空間計算需求。影溯的目標是:在消費級 GPU 上實現(xiàn)實時的空間推理。這不僅能讓實時交互成為可能,更意味著空間智能將徹底走出數(shù)據(jù)中心,真正被部署到從機器人到 XR 眼鏡的各類端側(cè)設備中。



      高效率低延遲的實時生成

      顯式錨點 + 隱式記憶:實現(xiàn)空間記憶

      空間智能的終極考驗在于「記憶」:如果一個機器人在轉(zhuǎn)頭的瞬間,就忘記了身后倉庫的布局和貨架的位置,那么高階規(guī)劃和自主導航就無從談起。為了解決這一痛點,InSpatio-WorldFM 創(chuàng)新地采用了一種「顯式錨點 + 隱式記憶」混合架構(gòu)設計

      在該模型中,團隊利用前沿的前饋式重建技術(shù)生成顯式的物理空間錨點,為模型提供穩(wěn)固的 3D 結(jié)構(gòu)支撐。與此同時,模型會將參考幀作為生成模型內(nèi)部的隱式記憶。



      這就像是讓 AI 擁有了「三維坐標體系」,不論鏡頭怎么轉(zhuǎn),生成場景的內(nèi)容都不會發(fā)生漂移和變化。

      這種設計讓 AI 不僅能像神經(jīng)元一樣靈活思考,還能擁有幾何級別的嚴密記憶,確保了 AI 即使在跨越復雜視點、經(jīng)歷長時間推移后,依然能保持穩(wěn)定、高效且可擴展的空間推理能力。

      在以往,視頻模型由于空間記憶限制,隨著時長延長,復雜度指數(shù)級上升,因此 Genie3 等世界模型能夠生成的時長有限。InSpatio-WorldFM 理論上生成的時長則是無限的。

      除此以外,在訓練數(shù)據(jù)上,影溯團隊利用自身在 SLAM(同步定位與建圖)、NeRF(神經(jīng)輻射場)和 3DGS 等領域的技術(shù)積累,能夠極低成本地合成海量高質(zhì)量的 3D 訓練數(shù)據(jù),從而打破了 3D 訓練數(shù)據(jù)極度匱乏的行業(yè)瓶頸。

      正是得益于這些架構(gòu)的創(chuàng)新與底層數(shù)據(jù)的積累,從目前的一系列 demo 中可以看出,InSpatio-WorldFM 呈現(xiàn)出了很強的「工程可用性」。

      這種創(chuàng)新與實用的并重,讓我們不得不把目光轉(zhuǎn)向影溯的核心團隊。

      頂尖團隊下場創(chuàng)業(yè)

      等了 20 年的「3D 時刻」

      訓練 3D 世界模型是一個極具挑戰(zhàn)的任務,互聯(lián)網(wǎng)上存在海量的 2D 視頻數(shù)據(jù),但 3D 數(shù)據(jù)極其匱乏,另一方面,精通 3D 視覺與圖形學的人才長期以來極為稀缺。

      在通往空間智能的 AI 終極賽道上,影溯選擇硬核的原生 3D 路線,其底氣源自核心團隊在 3D 領域 20 多年的技術(shù)積淀。

      影溯的班底堪稱國內(nèi)空間計算領域「夢之隊」,由浙江大學計算機輔助設計與圖形系統(tǒng)全國重點實驗室(圖形學領域全球排名第三,僅次于斯坦福和 MIT)與原商湯科技 3D 視覺與混合現(xiàn)實團隊的頂尖專家組成:

      其中創(chuàng)始人章國鋒為浙江大學求是特聘教授、國家杰青,前商湯數(shù)字空間事業(yè)群首席科學家。作為國內(nèi)空間計算領域的領軍人物,他在 SLAM(同步定位與建圖)和 3D 重建領域深耕已超過 20 年,是國內(nèi)空間計算領域公認的引領者。

      聯(lián)合創(chuàng)始人兼 CTO 劉浩敏是前商湯研究總監(jiān)、浙大博士。他的一個重要成就是:曾主導實現(xiàn)了業(yè)內(nèi)首個手機端無標志 SLAM 商業(yè)系統(tǒng),比蘋果的 ARKit 和谷歌的 ARCore 早了整整 3 年。

      隨著生成式 AI 的爆發(fā),3D 空間的重建與生成開始合流。影溯團隊敏銳地捕捉到了這個歷史性的「3D 時刻」,于 2025 年 7 月下場創(chuàng)業(yè),致力于打造屬于中國的 3D 世界模型。

      在這場世界模型的狂歡中,影溯的目標是讓 AI 真正理解 3D 物理世界中的空間幾何、物理規(guī)則和因果關(guān)系,利用 3D 視覺和圖形學的底座,來實現(xiàn) AI 的升維,通向真正的世界模型。

      基于團隊 20 多年的空間計算 / 智能的技術(shù)積累,影溯已經(jīng)構(gòu)建了一個三維場景重建與生成平臺,具備大尺度真實場景的快速掃描與重建生成能力,提供了從數(shù)據(jù)采集、場景生成、場景編輯到應用開發(fā)的完整工具鏈,可通過無人機、全景相機甚至手機拍攝實現(xiàn)低成本純視覺三維重建和生成。

      影溯構(gòu)建了一套行業(yè)內(nèi)獨有的「3D 數(shù)據(jù)升維引擎」:不盲目耗費海量算力,而是從現(xiàn)有的海量視頻抽取 3D 知識,用成熟的幾何約束工具鏈打破 3D 數(shù)據(jù)荒。這是大廠短期內(nèi)拿算力也砸不出來的能力,也是影溯的核心商業(yè)壁壘。

      長期 3D 視覺和圖形學算法的積累、成熟的工程化工具鏈,構(gòu)成了影溯難以被輕易復制的技術(shù)護城河。他們用著相對少的資源,撬動了空間智能的未來。

      結(jié)語

      與 World Labs 選擇閉源的商業(yè)路徑不同,影溯從一開始便確立了開源共建的核心戰(zhàn)略,認為空間智能的未來不應由單一企業(yè)定義,而應由全球開發(fā)者共同創(chuàng)造。

      InSpatio-WorldFM 推出之后,為了支持全球 AI 社區(qū)的共建,影溯團隊下一步計劃提供更豐富的技術(shù)細節(jié)。同時,擴展版模型,以及支持與動態(tài)世界實時交互的體驗應用也將在不久后推出。

      隨著 InSpatio-WorldFM 等開源空間智能模型的推出,生成模型、具身智能體和現(xiàn)實世界的機器人現(xiàn)在站在了全新的起跑線上。

      AI 的下一個故事,才剛剛開始。

      文中視頻鏈接:https://mp.weixin.qq.com/s/T3F7-xFx72KmZ9nkhdr2-w

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      美媒終于查出內(nèi)幕,伊朗導彈指哪打哪,原來有人用衛(wèi)星暗中報位置

      美媒終于查出內(nèi)幕,伊朗導彈指哪打哪,原來有人用衛(wèi)星暗中報位置

      阿芒娛樂說
      2026-03-10 18:48:05
      他和繼母之事引發(fā)的血案(二):兩人的關(guān)系如同干柴烈火

      他和繼母之事引發(fā)的血案(二):兩人的關(guān)系如同干柴烈火

      長安一孤客
      2026-03-10 10:44:37
      封神一戰(zhàn)!伊朗導彈把以色列命脈炸成火海,特朗普語無倫次露底牌

      封神一戰(zhàn)!伊朗導彈把以色列命脈炸成火海,特朗普語無倫次露底牌

      現(xiàn)代小青青慕慕
      2026-03-09 22:55:43
      兩極反轉(zhuǎn)!網(wǎng)友被父母的老式旅游折服了!評論區(qū)全部是真香現(xiàn)場

      兩極反轉(zhuǎn)!網(wǎng)友被父母的老式旅游折服了!評論區(qū)全部是真香現(xiàn)場

      另子維愛讀史
      2026-02-26 21:36:17
      戰(zhàn)術(shù)航空旅指揮官在烏克蘭東部陣亡

      戰(zhàn)術(shù)航空旅指揮官在烏克蘭東部陣亡

      桂系007
      2026-03-09 23:49:42
      “新型養(yǎng)老”很好:晚年不孤獨,生活有人照顧,還不麻煩兒女

      “新型養(yǎng)老”很好:晚年不孤獨,生活有人照顧,還不麻煩兒女

      拾代談生活
      2026-03-09 17:59:38
      上海地鐵四期推遲報批,市民等得心焦

      上海地鐵四期推遲報批,市民等得心焦

      趣味萌寵的日常
      2026-03-10 19:14:23
      廣東一波三折抵達新疆 麥考爾隨隊出征 杜鋒將重用他 崔永熙留守

      廣東一波三折抵達新疆 麥考爾隨隊出征 杜鋒將重用他 崔永熙留守

      郝小小看體育
      2026-03-09 21:35:57
      驚天騙局!1106家空殼公司偽造港藥,5年狂賺1.06億,官方出手了

      驚天騙局!1106家空殼公司偽造港藥,5年狂賺1.06億,官方出手了

      壹知眠羊
      2026-03-10 07:37:24
      張凱麗談高價彩禮現(xiàn)象,千萬不要把錯歸咎于女性,希望盡快出臺限制彩禮的硬性規(guī)定

      張凱麗談高價彩禮現(xiàn)象,千萬不要把錯歸咎于女性,希望盡快出臺限制彩禮的硬性規(guī)定

      大象新聞
      2026-03-09 17:58:07
      陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

      陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

      好賢觀史記
      2025-11-09 21:58:39
      70年代丁盛申請去上海療養(yǎng),葉帥打住:別人可以去,唯獨你不行!

      70年代丁盛申請去上海療養(yǎng),葉帥打住:別人可以去,唯獨你不行!

      元哥說歷史
      2026-01-25 07:10:03
      史前文明真的存在嗎?6.5萬年前壁畫曝光后,考古界一度集體沉默

      史前文明真的存在嗎?6.5萬年前壁畫曝光后,考古界一度集體沉默

      銅臭的歷史味
      2026-03-10 05:25:20
      江蘇一網(wǎng)友曬媽媽攢了10年快遞不拆,全都堆放在倉庫!因倉庫房東不租了,近日全家正在拆快遞準備搬走!

      江蘇一網(wǎng)友曬媽媽攢了10年快遞不拆,全都堆放在倉庫!因倉庫房東不租了,近日全家正在拆快遞準備搬走!

      觀威海
      2026-03-10 16:28:05
      崩了!三分53中11+三分13%,鐵出天際,5年1.25億大合同徹底飛了

      崩了!三分53中11+三分13%,鐵出天際,5年1.25億大合同徹底飛了

      球童無忌
      2026-03-10 19:40:23
      iOS 26.4 更新,護眼模式來了

      iOS 26.4 更新,護眼模式來了

      果粉俱樂部
      2026-03-10 13:20:03
      1979年,張國燾凍死在養(yǎng)老院,許世友:除了主席,沒人是他的對手

      1979年,張國燾凍死在養(yǎng)老院,許世友:除了主席,沒人是他的對手

      文史季季紅
      2026-03-05 13:35:03
      特朗普撂挑子不干了,以色列連俄大樓都敢炸,普京把話說得很清楚

      特朗普撂挑子不干了,以色列連俄大樓都敢炸,普京把話說得很清楚

      音樂時光的娛樂
      2026-03-10 19:19:25
      難怪要對中國下封殺令,英媒公布哈梅內(nèi)伊遇刺細節(jié),讓人細思極恐

      難怪要對中國下封殺令,英媒公布哈梅內(nèi)伊遇刺細節(jié),讓人細思極恐

      袁周院長
      2026-03-10 18:58:22
      以色列何去何從,歷史驚人的相似,猶太人在打中國的主意

      以色列何去何從,歷史驚人的相似,猶太人在打中國的主意

      趙枹是個熱血青年
      2026-03-05 21:34:25
      2026-03-10 20:36:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12467文章數(shù) 142580關(guān)注度
      往期回顧 全部

      科技要聞

      全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

      頭條要聞

      專家:打擊伊朗遭3大反噬 特朗普政府或真有點"撐不住"

      頭條要聞

      專家:打擊伊朗遭3大反噬 特朗普政府或真有點"撐不住"

      體育要聞

      加蘭沒那么差,但鱸魚會用嗎?

      娛樂要聞

      肖戰(zhàn)首奪SMG視帝,孫儷四封視后創(chuàng)歷史

      財經(jīng)要聞

      “龍蝦補貼”密集出爐 最高1000萬!

      汽車要聞

      MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

      態(tài)度原創(chuàng)

      藝術(shù)
      本地
      旅游
      數(shù)碼
      公開課

      藝術(shù)要聞

      30000畝杏花開了,新疆的春天這么美!

      本地新聞

      云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

      旅游要聞

      涵蓋120余種賞花植物,濟南9大公園景區(qū)賞花打卡指南來了

      數(shù)碼要聞

      史上最大電池折疊屏旗艦!榮耀Magic V6圖賞

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版