允中 發自 凹非寺
量子位 | 公眾號 QbitAI
最近,AI教母李飛飛發帖宣布“可以在任意設備上流式傳輸超過1億個高斯潑濺”。
![]()
瞬間引爆了技術圈對3DGS(3D Gaussian Splatting)的新一輪關注。
大家突然開始意識到,大規模3D高斯模型,開始可以在移動端運行了。
也正是因為這個,讓大家聯想到2005年,那一年MP4格式的出現,視頻第一次可以被輕松壓縮、分享和播放。
隨之而來的是,視頻從“專業內容”變成“日常語言”,進而催生了整個內容生態的爆發。
這讓人不禁期待,是否3D內容也即將迎來屬于它的“MP4時刻”
但實際上,在真正熟悉3D高斯潑濺技術的圈子里,“大規模3D高斯模型在移動端打開” 的技術早已不是什么新鮮事。
兩年前就有一家深圳創業公司,做出來并推出完整產品,甚至開源至GitHub。
但為什么,3DGS模型至今還未能像視頻一樣,成為內容創作者的主要創作手段和介質?
3D內容的爆發,究竟還缺乏哪些“關鍵要素”?
這,才是今天3D內容的“真問題”。
3DGS最難回答的問題,不是技術問題
其實3D世界的構建,一直都存在兩條不同路徑:
- 一條是建模/AI生成,即創造不存在的世界,服務于游戲與創意表達;
- 另一條是現實捕捉(Reality Capture),即記錄真實世界,服務于空間記錄、測量與仿真。
前面提到的李飛飛的路徑更偏向于前者,結合自然語言模型和三維空間生成,是現在我們熟悉的AI生圖/AI生視頻的升維版本。
雖然也支持照片生模型,但效果對比專業的Reality Capture路徑,其生成的模型在精度/結構和完整性上有較大差距,就不歸為一類而談了。
Reality Capture往往使用攝影重建或激光+視覺結合的方式,完整而真實地還原現實世界。
“大規模3DGS模型在移動端渲染”的故事,兩年前就在現實捕捉這一路徑上發生過了。
其實第一個支持大規模3D高斯模型在多端(含移動端)渲染的產品是——
其域創新XGRIDS的LCC(Lixel CyberColor),全球首個可商用的大場景3D高斯產品。
![]()
是的,他們在2024年,就推出了這樣一套由SLAM空間掃描硬件和3D高斯生成軟件組成的現實捕捉方案。
這套方案,可以將真實世界還原成高精度的3D高斯潑濺模型,并且可以在移動端加載無限大的3D高斯模型,這是行業里第一次有人把這件事做成產品。
![]()
而在他們這條產品發布的視頻底下,當時很多評論都在問:
“這個模型可以用來做什么”“除了好看能做什么”……
技術已經不再是瓶頸,但用戶的困惑恰恰揭示了另一層阻力的存在。
所以真正的問題,從那時起就已經發生了轉移:
不是能不能打開,而是能不能被真正使用。
三維模型不像視頻,無需任何解釋,我們就知道視頻可以帶來什么價值。
但在我們的交互介質大多還是二維屏幕的現狀下,光是“打開”一個三維模型,似乎沒有比看一段視頻給用戶帶來的價值增量有顯著區別。
甚至會有很多用戶詢問“其域發表的‘模型漫游’是不是一段拍攝視頻”,甚至感嘆“可能還不如一段實拍的4K視頻清晰”。
![]()
如果只能“粗略地看”,3DGS只是一個看起來更牛的技術,但卻不直接解決用戶的痛點,很難真正改變用戶的交互方式。
無獨有偶,另一個做手機重建三維模型的產品Kiri engine的創始人Jack,也曾在一次線下分享中提到,3D技術的行業從業者最經常被詢問的問題是——
用戶到底能用3D技術來干什么?
Jack的回答是:“我們一般只能是去描繪一些有關Vision Pro的未來愿景,或去幻想一下未來10年的工作發展。”
連行業內部人士都只能用未來愿景來回答,這說明問題的根源并不在技術本身。
回答“3D高斯能用來做什么”,才是眼下最本質的問題。
而要真正回答這個問題,就必須先面對3DGS技術本身尚未解決的幾道關卡。
過去幾年,雖然3DGS技術的發展速度其實非常快:
從論文到開源,從PC到移動端,從實驗室到產品化,技術路徑已經基本跑通。
但行業始終沒有爆發,原因也很現實:
- 太大,難以傳輸(動輒幾十GB)
- 太重,難以加載(設備性能門檻極高)
- 太新,缺乏生態系統支持(與各類目標場景的原有工具鏈之間幾乎不兼容)
從“能打開”,到“能應用”的跨越
最近在社媒上出現的一些新探索,證明這些問題正在被解決:
有用戶前不久發布了他使用3D高斯技術復刻其所在城市的道路,并使用Vibe coding做了一個賽車游戲,而這一切僅花費了2天時間
三維博主扎克力,用3D高斯復刻了整個云南國家級保護村落,并使用UE做成移動端可玩的游戲體驗。
![]()
以上這些是3DGS開始進入個人創作工作流的信號,更大的變化發生在專業場景里。
大熱的美劇《Fire Country》(烈焰國度)的幕后,揭露了他們使用3D高斯潑濺技術掃描了一條街道,并在攝影棚中使用3D高斯模型在屏幕上完成了虛擬拍攝,完成了本不可能進行的“實景拍攝任務”
包括山東文旅在內,他們也使用了3D高斯潑濺技術完成了濟南著名景點趵突泉的數字孿生,讓游客未來可以線上“云游”趵突泉。
就在不久前的GTC(英偉達GPU技術大會)上,其域創新也發布了新動作。
他們通過3D高斯潑濺模型,成功為英偉達和迪士尼機器人完成了具身智能大腦的模擬仿真訓練。
![]()
數字孿生企業圖撲,也放出了使用3D高斯潑濺模型為底圖搭建的工廠數字孿生系統,過去這種底圖通常是建模師照著現場CAD圖紙和照片手工“搓出來”的。
這些零散但快速涌現的案例,其實指向了同一個變化方向——
3D高斯潑濺,正在從“展示介質”,變成“生產力工具”
這種轉變背后,是因為行業開始意識到:比起“能在手機上跑”,更重要的是有一套能讓3D數據真正進入工作流的基礎設施
在深挖這些硬核應用背后的支撐技術時,我們發現了一個有趣的現象:
雖然場景各異,但它們在底層技術選型上,不約而同地指向了其域創新的3D高斯方案
LCC做的,是3D世界的“MP4底層協議”
其域創新的創始人兼CEO趙開勇博士,是北京理工大學空天學院2001級飛行器設計與工程專業出身。
這個專業訓練的,是在極端精度要求下對三維空間的測量、建模與系統集成——
某種程度上,他后來選擇做3D空間數據基礎設施這件事,并非偶然。
其域創新的LCC方案,以及最新升級的LCC2,本質上就是建立了一整套圍繞3DGS的數據基礎設施
如果用一句話總結,它做了三件關鍵的事:
讓3D高斯變成“可流通的數據”
LCC從一開始,就是針對超大規模場景而設計。
1、LOD渲染
LCC支持城市級、園區級的3D高斯數據組織與流式LOD加載。這是讓3DGS可以在移動端跑起來的根本,LCC2提升為雙軌LOD,讓移動端可以秒級打開一個數億高斯點的數據
2、極致壓縮
新版本LCC2更是將模型數據壓縮做到了極致——
僅為傳統PLY格式的8%大小,這不僅提升了加載速度,對于使用者來說也大大節省流量、降低成本。
3、解耦編解碼格式
LCC2將解碼與存儲分離,獨立模塊管理,在不同的場景應用中,可以接入最合適的編解碼格式,大大便于數據流通。
讓3D高斯變成“可用的工程資產”
在LCC解決方案中,其域提供的獨特優勢是結合其空間掃描硬件的,提供結構化數據的能力——
不僅有“看起來真實”的視覺信息,還有空間結構、尺度、坐標體系等工程屬性。
這件事的意義在于:3DGS從“視覺內容”,變成了“可以進入生產系統的數據”。
它可以被用于以下領域:
- 游戲與沉浸式交互
- 仿真與訓練
- 數字孿生系統底圖
- 虛擬拍攝與實時渲染
而不是僅僅用于“被觀看”。
讓3D高斯進入“應用生態”
LCC不是孤立存在的格式,它從設計之初就考慮了與各類引擎、工具鏈的對接。
這也是LCC作為一個3DGS格式,可以開啟廣泛應用的關鍵。
從發布至今,其域逐步為LCC生態搭建了UE、Unity的plugin(接口),讓LCC數據可以無感進入游戲/影視等行業的應用工具鏈。
其域與英偉達Issac Sim的合作,也完整打通了機器人仿真訓練的工作流,甚至是跟英偉達聯合的具身智能訓練系統。
![]()
![]()
![]()
在其域目前公開展示的應用生態中,全球幾乎所有3D高斯應用生態的頭部企業都接入了LCC,成為其域生態的一部分。
LCC在做一件事:把3DGS嵌入已有生產體系,而不是成為一個孤島工具,3D高斯開始進入真實工作流
“MP4時刻”,還差最后一步
李飛飛這次帶來的,是一個非常重要的信號:
3DGS在“生成與分發”層面的能力,正在快速逼近臨界點。
但歷史已經證明——技術從“可行”走向“爆發”,中間一定還需要一個關鍵層:
標準 + 工具鏈 + 應用閉環。
視頻如此,3D也不會例外。
其域創新在過去兩年里押注的,正是這一層“看不見但決定一切”的基礎能力。
所以回到那句核心判斷:
不是讓3DGS能在移動端打開,而是讓它真正可用。
當3D內容可以像視頻一樣被編輯、分發、嵌入工作流、參與生產時,那一刻,才是屬于3D世界真正的“MP4時刻”。
而現在,我們或許才剛剛走到它的前夜。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.