<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      對話杭州六小龍群核科技:目前視頻生成工具,臨近GPT3.5時刻

      0
      分享至


      群核科技董事長黃曉煌

      2025年,同Agent一樣火的概念是“空間智能”。AI教母李飛飛稱,空間智能是AI的下一個前沿。國內群核科技,一直在空間智能領域有很大投入。

      12月9日群核科技2025酷+大會結束后,CEO陳航和董事長黃曉煌以及負責AI產品的龍天澤三人一起接受媒體群訪。

      因為一直在三維世界深耕底層能力,如渲染引擎、GPU超級計算,基于底層能力上的軟件產品也大多服務B端客戶,以至于讓群核科技不被外界熟知。實際上,群核科技同深度求索(DeepSeek)、宇樹科技等公司并稱為杭州六小龍,成立10余年來已獲得十幾輪融資。

      陳航和黃曉煌是浙大竺可楨學院同寢室的舍友,兩人畢業后均赴美留學,黃曉煌還短暫在英偉達任職過。2011年兩人回國創立群核科技,黃曉煌擔任董事長,陳航出任CEO。

      在這次大會上,陳航提出一個觀念,當AI開始邁向三維世界,需要空間智能的“賣水人”,而群核科技開放底層能力,要成為空間智能的“賣水人”。

      從二維世界進入到三維世界,AI進化的最大問題是缺失高質量、結構化的物理世界數據。我們了解到,過去十余年,群核科技3D空間的數據呈現出指數級的增長,目前已經有超過5億個3D場景。這個龐大數據集,對訓練垂類模型優勢很大,但對通用空間大模型的訓練而言,還只能算是毛毛雨。

      “空間智能,如果以ChatGPT的發展演變比較的話,還相當于GPT2.0 或者2.5的時代,這其中最關鍵的還是數據問題。”群核科技的首席科學家周子寒告訴我們,和大語言模型不同,網絡上現成的數據很多,而空間智能適用的存量數據遠遠不夠。

      從GPT2.0到GPT3.0,大模型參數量從15億漲到上千億,有百倍的增長。而對于更前沿的三維數據,想要實現模型拐點,需要多少數據集完全是未知。

      群核科技的路線演變,朝著一個更有野心的方向。借助Aholo平臺,把更多的底層技術能力開放給生態伙伴,匯集更多的3D數據,反哺給空間大模型,不斷提升性能,從而形成一個閉環或者數據飛輪。

      相比以往,群核科技還有一個新的變化,將業務從面向B端客戶的SAAS軟件,延伸到C端。比如此次發布的LuxReal視頻生成工具,和當前市場上的視頻生成工具不同,它們依托底層物理空間的技術能力,實現3D建模,相當于為視頻里的主體一致性多構建了一道防護墻。

      因此,LuxReal生成視頻里的主體在360度旋轉,或者做一些復雜動作時,肉眼察覺不出主體有任何變形。從最早推出家裝設計類工具酷家樂(海外版COOHOM),到現在的LuxReal,群核已經有4、5個主要產品。黃曉煌說,無論哪個產品增長更快,對平臺和底層能力的需求,都會引發快速增長。

      以下是包括白鯨實驗室在內的多家媒體與群核科技的對話,為了方便閱讀,內容做了精簡處理。

      01

      空間大模型是世界大模型的解法

      問:現在空間智能是大家非常關注的話題,你們如何定義空間大模型?它和世界大模型的區別是什么?

      龍天澤:現在討論比較多的一個是世界模型,一個是空間大模型,兩者有很多的共通之處,像世界模型,大家有各種不同的解法,我覺得空間大模型是世界模型的一種解法。有一種流派的做法是,用前面幾幀的圖片來推測下一幀的圖片,這里面還沒有太多空間的概念,而是靠一個物理世界運作的邏輯。

      這或許有點抽象。人類對于世界的理解,不是基于眼睛看到的東西去做推測,比如說人看到一個水瓶被扔了出去,可以精確預測到它被拋出去后的軌跡,這是依靠大腦直接推理出來的。

      另外一個流派就像我們做的,先把三維重建起來,把各種物理模型模擬出來,恢復水平的物理信息,然后它被扔向空中后,怎么自由落體,都是根據物理規則算出來的。

      這兩個流派的做法不太一樣,但都屬于世界模型的一種。到底人類是怎么理解物理世界的,這也是學術界和工業界都在探索的方向。人類理解世界,肯定不是數學公式算出來的,最終機器人用哪一種方法,其實兩個流派都在摸索。

      :你們一直強調物理世界正確,擔不擔心未來通用大模型,通過暴力學習把物理世界學會了?

      黃曉煌:這是個很好的問題,我不排除這種暴力方法能學會物理的一致性。之前也一直說,我們更多是生態的一份子,大家都在推動解決這個問題,就像我們內部也會調用視頻生成的大模型一起解決問題。

      如果突然有人發現某個方法可以解決一致性問題,同時又能解決生存問題,高效訓練的話,大家都用那個方法做就好了。我們創業挺多年,方法一直迭代,之前認為不可能的事情也逐漸變得可能,其實非常樂于見到類似像Sora(OpenAI)這類公司,用暴力方法解決所有問題,我們直接調用就行。

      龍天澤:之前我們內部一直在討論這個問題,答案是像Sora這樣的視頻模型,一定是會越來越接近物理真實的。但這里面涉及到第一性原理問題,我們不認為這種視頻模型能從二維中學到三維的東西。

      簡單的物理場景下,算法會越來越能夠實現一致性,所以有可能就不需要3D了。但群核的優勢在于,現實世界一定不存在復雜的3D硬件和市場需求,而這些就是我們去滿足的場景。

      數據是有天花板的,文本模型現在已經遇到數據天花板,視圖模型遲早也有這一天。而當全世界所有的視頻都拿來訓練一遍后,會發現它的物理規律很難再往上走一個臺階,這時候就是我們的優勢。

      空間模型和語言模型,有人認為語言才是攻克AGI的重要路徑,有人可能會覺得是空間才是最重要的。你們怎么看?

      龍天澤:李飛飛為什么會提出世界模型才是AI時代的下一個技術前沿?本質上她認為這個世界的建模不是通過語言建模,而是通過三維空間去做的建模。這是第一性原理。

      從技術上看,語言模型和空間大模型的技術并不沖突。大語言模型里的token在空間里變成提速信息,如果把訓練數據換成提速信息,它就是一個新的空間大模型。其實在這里面算法可以遷移,只是訓練數據會有不同。

      02

      未來可能10臺機器人服務一個人

      問:現在群核的客戶里有一些掃地機器人,想問一下具身智能行業客戶情況怎樣?

      黃曉煌:掃地機器人是我們客戶里很小一部分,因為國內掃地機器人公司也就幾家。我們很多的合作,大部分還是服務工業機器人,收入預期現在不能聊,屬于靜默期。但我們這方面的客戶目前非常多。

      :一個中型具身智能的公司,會產生多大的需求?

      黃曉煌:就這么說,機器人要學會在房間里搬椅子,起碼要有10萬個方案的訓練,就干一件事情,你想想日常你要干多少事情?

      :怎么理解這10萬個方案?

      黃曉煌:比如說一個方案1000塊,10萬個方案,光買這個方案就要花一個億。

      :你們很多產品已經在行業里得到了應用,面臨的挑戰是什么?

      黃曉煌:我們仍然處于行業發展的初期,有各種各樣挑戰,有法規問題、技術問題,也有合作問題。

      如果具體一點,機器人行業的挑戰是算法沒有形成共識,中國團隊可能更傾向于真實數據,歐美團隊更傾向于大量的合成數據。我們也沒有辦法改變大家對于正確做法的認知,也不確定誰對誰錯。

      但是我們能做的就是,讓技術更好地去滿足兩者的需求,比如服務中國的客戶,盡可能的采用重建技術,服務國外的客戶就用生成技術。這兩者用不同的方式去實現。

      現在有種比較主流的說法,具身智能的訓練數據來自數字世界和真實世界占比是9:1。

      黃曉煌:我們有的客戶是用9:1的配比,但這里面隨著技術的變化,配比也一直在變化。就像陳航(群核科技CEO)今天講的3D重建產品,不斷在縮短數字世界跟物理世界的信息差距,數字世界里的數據盡可能接近于完全真實的世界。

      這也是我們努力的方向,我相信,數字世界里面的訓練占比還會繼續提升。

      工業智能在全球AI界都非常火熱,在可預見的未來,空間智能會長成什么樣子?它會成為互聯網下一代的水電煤嗎?

      黃曉煌:我前段時間在烏鎮大會上也說了,未來可能會由10臺機器人服務一個人。這時,機器人不僅需要理解物理世界,還要能在復雜的物理世界工作,空間智能會非常關鍵,變成類似水電煤的基礎設施。

      但多長時間能夠完全落地,讓這些機器人能很好地服務一個人,這個時間不好預估。但我覺得未來肯定是往這方面發展的。

      :群核獲得的數據更多是室內的空間數據。相對來說,室外的空間數據獲取相對簡單一點,但是LuxReal生成視頻是全場景數據,這個問題是怎么解決的?

      龍天澤:這里其實有兩個角度,第一個角度是對比一下同行,目前同行的數據集我印象里都是小幾萬,或者是小幾十萬的級別。但我們第一版3D場景是104萬,對外官方口徑是4.41億個3D模型(相當于最小的物體單元),其中可訓練的數據至少能有幾千萬,所以第一版104萬數據集,暫時沒遇到不同行業不同場景的分布問題。

      未來假設我們拓展到千萬級別場景的數據,的確會遇到剛才說的問題,可能我們的數據更偏室內,室外場景怎么解決。

      第二個角度是,3D世界跟其他不同的是材質表現。舉個例子,木紋在室內是地板,在室外就是木頭,這對于3D而言,材質其實是一個更基礎的訓練信息,而模型訓練使用的室內數據,其實已經包含了大量室外所需要具備的材質信息。室外3D資產的材質,我們室內數據也是有的,只是分布會有一些不一樣。

      從以上兩個角度看,我們本身龐大的數據池,可能是一個斷崖式領先的數據量。因為3D和材質的這種屬性化差異,使得這種按行業或者場景劃分,并不一定是最科學的方法,反而不會成為我們的瓶頸。

      03

      當前的視頻生成工具接近GPT3.5時刻

      :跟Sora相比,你們新發布的視頻生成工具LuxReal的獨特競爭優勢是什么?

      龍天澤:我們開拓新產品的起點有兩類,一類是從技術本身考慮,一類是從商業角度考慮。LuxReal是基于技術第一性原理考慮的。舉個簡單的例子,比如現在為什么會有transformer,是因為上一代的循環神經網絡底層有根本缺陷,現在的視頻算法,其實像是在二維像素層面去模擬三維空間。

      我們會認為,如果現實世界有高保全需求還原的場景,3D重建一定是必不可少的一步。所以LuxReal的初心是,如何用三D重建模態提升視頻的一致性,比如像電商營銷、短劇,我們這個技術出來了以后,去找市場上的垂直商業節點。

      跟Sora的區別是,我們完成了真實的3D建模步驟,那意味著可以更好實現空間一致性,因為3D本身就是空間一致性的。而現有的一些產品主要靠視頻模型去控制,視頻模型的原理是在每一幀連續的運行下去猜下一幀,才能保持空間一致性。從技術上看,一定是有了3D建模加持的視頻生成模型,才能在一致性上更具可控性。

      舉個極端例子,Sora如果開源了,我們馬上能把Sora的能力也調過來,基于我們的3D建模做出比Sora更棒的視頻。所以我們跟市場上友商的關系是,若他們愿意把API或者跟底層的一些接口能力開放出來,和我們的3D管線做嵌套對接,完全可以合作生成一致性更好的視頻。

      :現在市面上的視頻生成工具生成時間比較短,從時長上看挑戰是什么?

      龍天澤:目前生成時間其實取決于GPU的顯存,算法參數量的大小。當下因為我們聚焦的場景,比如說是某些短劇和營銷視頻,單分鏡生成時間大概是5~6秒。我們是一個智能體,會基于一個需求先生成故事,然后生成不同的分鏡頭,最后拼在一起。

      整個過程還能加入語音、音樂等,最后時長可以自定義10秒、20秒、30秒,但單分鏡大概上限是6秒左右。

      LuxReal,如果對比現在的語言類模型,它處于一個什么樣的階段?

      龍天澤:LuxReal是多種算法能力疊加在一起,所以如果按商業落地性來說的話,相當于達到GPT3.5,接近商業化可落地的拐點。在我看來,至少在某些垂直營銷領域接近這個時刻,已經可以從所謂的一個創業demo,變成一個真正可以端到端交付的營銷視頻產出。

      :你們已經推出多個產品面向市場,為什么還要做一個Aholo開放平臺?

      黃曉煌:我們其實最核心的是空間智能的能力,包括渲染、空間的理解、生成這類的算法,原來是放在內部,這次把這些能力開放出來,通過Aholo平臺,像酷家樂,或者今天發布的LuxReal等這類產品,都是建立在我們的核心能力上面。


      群核科技Aholo空間智能開放平臺全景圖

      這些產品哪一個成長得更快,我們不確定,但對底層能力的需求以及增長一定會很快。

      :Aholo開放平臺延伸為空間重建、生成、編輯和理解,這幾類產品現在市場需求情況如何,主要壁壘在哪?

      黃曉煌:目前我覺得壁壘體現在幾個方面,一是從技術難度上看,肯定是空間生成和空間理解,技術難度是高的,要說誰最高我也不確定。這兩個技術難度的天花板都非常高。

      空間的重建,目前看需求大,技術壁壘暫時沒那么高。因為我們在宣推重建時,更多的是解決過去大家爭論的,真實世界和數字世界的數據之間有gap。有了重建,這個gap就小了很多。

      它的難點不在于算法本身,而是經營難題。你要能支持市面上各種各樣的硬件。因為各家機器人企業的硬件設備都不一樣,可能有成百上千種,每一種的數據格式和形態都不同。能不能把每一種形態都順利支持,建立一個數據互聯互通,這可能是另外一個難題,我們也在解決。

      問:你們自稱是一個拿著錘子找釘子的商業模式,剛剛開始去做酷家樂,一直到現在推出了一個工業AI孿生平臺,這種看起來成熟的打法,在你們內部是怎么確定的?

      黃曉煌:工業AI孿生平臺SpatialTwin這種產品,我們很多年前就想過要做,但有礙于技術或市場條件,一直沒推出來。很多時候都是外部環境變化了,憋了很多年的技術突然就可以上線了。

      技術變化是可以提前被預見的,而市場變化則是無法預料的。就像去年發布會上,我絕對不知道今年的人形機器人、DeepSeek會這么火,社會變化太快了,至少我們還在牌桌上,也沒有miss時代的機遇。

      我們一直兩條腿走路,一個前沿技術研究的團隊在做技術探索,錘子始終在找釘子到來的機會。當釘子因為技術演變到了這個節點,我們就會快速跟上,這是中小廠的特點。它可以小步快跑,迅速迭代,可以先用市場來驗證,再繼續往前去走。

      撰寫|劉培

      編輯|吳尋

      「白鯨實驗室」原創文章

      轉載、交流、合作請添加微信:liujiaquan2025

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      伊朗多地爆發抗議活動 哈梅內伊告別儀式被推遲

      伊朗多地爆發抗議活動 哈梅內伊告別儀式被推遲

      看看新聞Knews
      2026-03-04 20:42:20
      被爆換武僧心臟、喝小孩血! 李連杰笑噴:怎么不說我換「華為心、小米腎」?

      被爆換武僧心臟、喝小孩血! 李連杰笑噴:怎么不說我換「華為心、小米腎」?

      ETtoday星光云
      2026-03-04 16:42:06
      被問爆了!小龍蝦用什么電腦裝?選哪個模型省錢?這篇“養蝦”保姆級教程請收好

      被問爆了!小龍蝦用什么電腦裝?選哪個模型省錢?這篇“養蝦”保姆級教程請收好

      AI范兒
      2026-03-06 20:54:35
      全款一口價15.99萬起 2026款凱迪拉克XT4正式上市

      全款一口價15.99萬起 2026款凱迪拉克XT4正式上市

      太平洋汽車
      2026-03-06 16:07:18
      44歲范冰冰車內趕場賣面膜!素顏發福變大媽,昔日頂流如今只剩奔波

      44歲范冰冰車內趕場賣面膜!素顏發福變大媽,昔日頂流如今只剩奔波

      八卦王者
      2026-03-06 11:18:36
      豪門悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇馬2-1,利物浦3-1晉級八強

      豪門悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇馬2-1,利物浦3-1晉級八強

      側身凌空斬
      2026-03-07 06:10:33
      德黑蘭的最大漏洞,可能不是內鬼,而是滿街的攝像頭

      德黑蘭的最大漏洞,可能不是內鬼,而是滿街的攝像頭

      碼頭青年
      2026-03-07 14:44:45
      新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

      新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

      千秋歷史
      2026-02-02 20:23:42
      李連杰當面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

      李連杰當面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

      西樓知趣雜談
      2026-02-28 21:36:48
      萬萬沒想到!兩會最火提案不是醫療和就業,而是霍啟剛的這一舉動

      萬萬沒想到!兩會最火提案不是醫療和就業,而是霍啟剛的這一舉動

      查爾菲的筆記
      2026-03-05 20:24:50
      安徽肥西縣一飽受質疑的破產清算“坑”,致投資商千萬借款打水漂

      安徽肥西縣一飽受質疑的破產清算“坑”,致投資商千萬借款打水漂

      兵叔評說
      2026-03-07 11:37:00
      中央強力加杠桿,普通人的財富迎巨變

      中央強力加杠桿,普通人的財富迎巨變

      柏年說政經
      2026-03-06 18:00:03
      世界上最燒錢的十項運動,沒錢你真玩不起!

      世界上最燒錢的十項運動,沒錢你真玩不起!

      馬拉松跑步健身
      2026-02-28 11:37:18
      戲子當道,是央國企管理中的一大痛點

      戲子當道,是央國企管理中的一大痛點

      細說職場
      2026-03-06 20:01:27
      列寧曾派特工來到中國,專門暗殺一個人:腦袋至今保存在俄博物館

      列寧曾派特工來到中國,專門暗殺一個人:腦袋至今保存在俄博物館

      老范談史
      2026-03-06 07:28:20
      無緣世界杯?伊拉克通知國際足聯無法參加附加賽 40%球員無法出行

      無緣世界杯?伊拉克通知國際足聯無法參加附加賽 40%球員無法出行

      念洲
      2026-03-07 06:17:28
      德云社弟子人氣大洗牌!4人上桌,3人邊緣,2人換桌,岳云鵬退場

      德云社弟子人氣大洗牌!4人上桌,3人邊緣,2人換桌,岳云鵬退場

      好賢觀史記
      2026-03-07 09:50:01
      李賀:我爸是李雙江,我弟是李天一,我在沒有父愛的環境中成長

      李賀:我爸是李雙江,我弟是李天一,我在沒有父愛的環境中成長

      談古論今歷史有道
      2026-03-07 10:20:03
      1971年,老太太質問周恩來我啥級別,真相一出令人肅然起敬

      1971年,老太太質問周恩來我啥級別,真相一出令人肅然起敬

      棠棣分享
      2026-03-05 18:11:12
      特朗普夸梅西:你們隊沒一個丑的!話鋒突轉“下一個是古巴”,“梅球王”懵圈

      特朗普夸梅西:你們隊沒一個丑的!話鋒突轉“下一個是古巴”,“梅球王”懵圈

      紅星新聞
      2026-03-07 11:58:25
      2026-03-07 15:08:49
      白鯨實驗室one incentive-icons
      白鯨實驗室one
      記錄 AI改變世界的瞬間
      99文章數 5關注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養蝦人"自述與AI共生

      頭條要聞

      伊朗大使:250年歷史的美國怎能挑釁3000年歷史的伊朗

      頭條要聞

      伊朗大使:250年歷史的美國怎能挑釁3000年歷史的伊朗

      體育要聞

      塔圖姆歸來:凱爾特人的春之綠

      娛樂要聞

      周杰倫田馥甄的“JH戀” 被扒得底朝天

      財經要聞

      針對"不敢休、不讓休"怪圈 國家出手了

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      旅游
      健康
      藝術
      手機
      數碼

      旅游要聞

      重報觀察|掘金“花”經濟!“賞花+”拓展多元文旅消費

      轉頭就暈的耳石癥,能開車上班嗎?

      藝術要聞

      Mark Grantham | 城市街景

      手機要聞

      動動嘴就能改UI!三星Galaxy手機或迎“氛圍編程”時代

      數碼要聞

      蘋果M5 Pro芯片GeekBench跑分曝光:多核破2.8萬

      無障礙瀏覽 進入關懷版