過去,我們經歷和見證了不同模態 APP 在不同階段的發展:從 QQ 和天涯的文本模態,到博客、QQ 空間、微博的圖文模態,往后到土豆、優酷等視頻模態,再到現在以抖音、快手為代表的短視頻。
就在創業者們用 AI 在文本、圖像、視頻生成的領域中“卷生卷死”之際,生境科技(Sengine Technology)的 CEO 劉紫東帶領團隊選擇了另一條路徑——空間。他認為,每個時代真正的機會來自新的模態,而不是在舊模態里做得更精致。空間,正是像視頻一樣可以被大眾創作、交互和變現的下一代模態。
世界模型有多條技術路線:有以時間理解、動作幀預測為核心的視頻大模型(如 DeepMind 的 Gennie 3),有專注隱式空間表達(楊立昆),還有一個主要的類別,就是 3D 場景生成。其中,又細分成基于 3D 高斯潑漸的純視覺表皮還原(李飛飛的 World Labs)和離散實體的組合與布局(如Autodesk、普林斯頓 infinigen)等。
劉紫東認為后者更貼近實際應用,他將空間生成還原為兩個最基本的問題:擺什么,以及擺在哪。這種構建空間的敘事邏輯更多基于人類的實際需求,而非生成一層表皮的純視覺方案。“英偉達、Autodesk 等大廠和 MIT、普林斯頓等高校實驗室都在持續研究這條技術路線,但是我們的算法是最先能達到商業落地的。”他說。
在這條獨特技術路徑背后,是一條同樣不尋常的學術軌跡。劉紫東本科畢業于東南大學建筑學院,后在英國倫敦大學學院獲得計算設計碩士學位,之后赴美國德州大學奧斯汀分校攻讀博士學位,主要研究方向是空間 AI 生成。2023 年,他敏銳地意識到這條賽道正在出現窗口期——在他看來,除了空間,其他模態的“舊戰場”已經結束。
在近期 DeepTech 與劉紫東的深度對話中,我們談到了對空間智能行業的理解、賽道的選擇、技術差異性路徑、商業落地和未來發展趨勢等。他將空間智能創業所處的階段,類比為抖音在 PC 互聯網時代競爭中,率先識別并切入移動互聯網的那個關鍵節點。
基于 AI 生成空間的核心技術,生境科技已在多個方向展開探索。其中最引人關注的是其自研的全球首款空間 AI 游戲——森盒 SenBOX3,它就像是一個空間編輯器,用戶只需要用一句話、一張照片就能自動生成專屬的“夢想家園”。
這款產品被不少玩家理解為 AI 版《我的世界》,在尚未正式上線的情況下,基于獨特的共創和個性化創作,全網相關內容累計吸引百萬級粉絲關注,其中 15 至 25 歲的女性用戶占據相當比例。
![]()
(來源:劉紫東)
與此同時,該公司也發展了面向 B 端的 API 業務,服務客戶包括松下、Ashley、萬華等。盡管這部分業務已帶來千萬元級的營收,但劉紫東更愿意將其視為“順手做”的延展,而非公司的核心重心。
在做出創業決定時,他并不諱言自己的代際焦慮。作為一名 95 后,劉紫東曾悲觀地判斷,與 60 后、70 后和 80 后相比,90 后、95 后這一代人的學歷紅利已經不在。因此當機會來臨時,他幾乎沒有猶豫,選擇放棄博士學位回國創業。
劉紫東將效率視為真正的技術壁壘,因此并不懼怕后來者。除了技術的原創性,他的底氣一部分還來自于身后的“智囊團”:不僅由其博士生導師丹尼爾·庫勒(Daniel Koehler)教授擔任公司首席科學家顧問,還獲得了中國工程院孟建民院士和“大疆教父”李澤湘教授的支持。截至目前,生境科技已完成 Pre-A 與 Pre-A+ 輪近億元融資。
在他的設想中,空間 AI 的終點并不僅是一款游戲或一個內容社區,而是逐步演化為一個室內版的“谷歌地球(Google Earth)”——一個與實體經濟深度耦合、可以承載交易與社交的空間智能平臺。
以下是對話內容,在不改變原意前提下經編輯和整理。
逃離舊戰場:空間是 AI 領域少有的“新大陸”
DeepTech:你是基于怎樣的判斷,認為空間 AI 賽道有潛在的發展機會?
劉紫東:要回答這個問題,我想先談談為什么發展其他的模態不行。從商業角度來看,各大廠在文本、圖像、視頻等模態具有顯著優勢,如果發展這些傳統模態,用戶獲取成本很高。這不是技術問題而是分發和規模的問題,實際上創業公司在結構上已經輸了。
我們是從模態的角度來判斷的。顯然,文字、圖像、視頻格局基本已定,目前都屬于“舊戰場”。其實,每個模態都有自己的代表性 APP,每個時代也有屬于自己的模態,而機會往往來自于新模態的產生。
以創立于 2016 年的抖音為例,它最厲害的是推薦算法,如果它只是做今日頭條的業務,可能只比新浪、搜狐新聞好用一點,但不可能有如此強的用戶感知差異,也就沒有今天的體量。
抖音正是在大家聚集在瀏覽器、殺毒軟件、彈窗、門戶網站等 PC 端“戰場”時,選擇了一條不同的發展路徑——視頻模態。直到今天,它 90% 的體量仍然來自這里。我記得張一鳴當時曾說過:“不要留戀 PC 互聯網舊戰場,抓住移動互聯網機遇。”
我覺得現在同樣是到了這樣一個時機,當領域都還在“卷”圖像、文本、視頻這些舊模態時,我們已經有了一個清晰的判斷:新的空間模態里才是唯一的“新大陸”。
DeepTech:也就是說,你認為空間是繼 AI 生成文本、圖像、視頻之后的下一個前沿。
劉紫東:是的。一種新模態的崛起離不開技術成熟的發展,這從根本上降低了內容生產和消費的門檻。就像過去拍攝視頻需要扛著攝像機,拍攝和剪輯都非常麻煩。直到手機攝影錄像功能普及,內容生產才變得簡單、門檻大幅降低。在消費側,手機屏幕提供了更好的觀看體驗,網速也提升到了 4G、5G 時代。生產和消費兩端的共同作用,讓視頻變得又好看又容易實現,它的火爆也就成了必然。
從文字到圖片、視頻再到空間,每個模態帶來的信息密度不一樣。文字已經存在幾千年了,后面才有圖像。到了視頻,它不僅有聲音還有時間維度,能更好地描述故事。人類是傾向于更多維度的感知以及更豐富的信息層級,所以,能比視頻還更高維、更加貼近現實的就是空間。與視頻相比,空間天然有交互、漫游和自主性。
另一方面,剛好在最近幾年,空間在內容的生產和消費生態方面也在迅速成熟和便捷。內容生產體現在 AI 制造 3D 資產和圖轉 3D 等成本大幅下降。從消費層面來看,虛幻引擎已服務于 3D 場景渲染。隨著其畫質越來越好,已經逐漸支持手機芯片,例如寫實化游戲逐漸搬上移動端。從長遠來看,在 Vision Pro、AR、VR 方面的布局也在迅速加快。
所以綜合來看,我們得出一句“暴論”:從創業公司的視角看,空間模態可能是目前少數仍具備結構性機會的方向之一。
DeepTech:空間與傳統的 3D 單體技術有怎樣的不同?
劉紫東:空間與 3D 單體的技術路徑不太一樣。3D 單體通過一張圖片就能推理還原出物體,而空間需要一系列圖片才能重建。簡單來說,3D 單體解決的是“單個物體長什么樣”,而空間解決的是“物體如何有序擺放構成滿足人類需求的場景”。從城市規劃到室內設計,都無非是把東西擺來擺去的過程。
DeepTech:這個方向應該有很多潛在的商業機會,那各家大廠為何不自己做空間智能這個方向呢?
劉紫東:因為大廠在這方面喪失了兩個既有的優勢:一是場景和用戶優勢,它沒有一款以 3D 空間為主題的 APP;另一方面,在技術、數據和模型算法方面也不占優勢。現在,大家對于“什么是空間”還在爭議中,它的技術路徑不像圖像、文本、算法工程那么好找,還在劇烈的波動中。所以,對大廠來說可能“一會想干,一會又放棄”,因此很難組建團隊。
建筑學底層的創新和革命:另類世界模型,核心是“擺什么、怎么擺”
DeepTech:生境科技在做的事情是否可以理解為通過“空間理解+AI 生成”,來做下一代基礎設施?它和現在大家高度關注的世界模型是一回事嗎?
劉紫東:現在,谷歌、李飛飛、楊立昆(Yann LeCun)都在借助世界模型,來探索對物理世界的理解。谷歌做的是文生視頻大模型;李飛飛的空間智能模型 Marble 致力于 3D 高斯潑漸(Gaussian Splatting);楊立昆則聚焦于更抽象的世界表征。
![]()
(來源:劉紫東)
我們正在做的事情與李飛飛的技術方向比較貼近,但屬于完全不同的范式。她是從純視覺的維度來理解空間,方向是文生圖、圖轉空間。盡管可通過文字方式做修改,但由于鏈路太長,本質上屬于“拿大炮打蚊子”。另外就是,視覺表皮生成的技術路線擅長換風格,但在其它任務是結構性地能力缺失。
這一點在室內空間生成方面更加明顯,Marble 不僅精度較低會導致所生成的空間有些比較模糊的地方,而且無法輸入足夠多的限制條件。雖然其技術可以實現生成用戶提出的“童話世界”等切換風格需求,但無法基于這樣的需求生成空間,例如“基于三室兩廳特定的布局生成空間,我的家庭是三口之家,我喜歡打麻將,爸爸喜歡打游戲”。此外,其很難做二次編輯和交互。
![]()
(來源:劉紫東)
DeepTech:除了技術的路徑,生境科技在做的事情和世界模型還有哪些本質的不同呢?
劉紫東:從構建空間的敘事邏輯來看,我們也有本質的區別。空間可以分成兩類:一類是由自然規律主導的空間,另一類是由人類活動主導的空間。實際上,這兩類空間的形成邏輯并不完全相同。
具體而言,自然空間生成完全依賴自然規律和物理規律,但在人類的人造空間,從城市到人類的棲息地,再從城市到建筑再到室內,其生成邏輯物理定律可能只占 30%,剩下的 70% 與人類的需求密切相關。
所以,要生成從城市到室內的空間不是一個純視覺邏輯,而是包括更多的社會心理學邏輯維度,例如功能、美學、日照采光、隱私和心理學等因素。我們只有把這些維度背后的參數特征提取出來,生成的空間才是能滿足人類需求的。
可以說我們相當于創造了一個新學科,在這一理解空間的路徑和技術范式上,我們目前是非常少見、甚至可以說是獨特的。實際上,我們用了很多建筑學的關于人造空間的思維,然后又把它 AI 化做空間編碼,這是前所未有的。可以說,我們在做的 AI 生成空間是建筑學非常底層的一次創新和革命。
我們解決的是擺放、規劃和布局的問題,這個問題過去從未有人單獨來研究。無論是城市還是室內的空間,所有的空間生成問題都可以拆解成兩個子問題:一個是擺什么,另一個是把建筑/物品擺在哪里。
總結來說,李飛飛的空間智能生成的是一層“皮”,更關注的是整體的視覺風格;而我們認為對于人類所建造的空間,需要更專業的其他信息來補充。
DeepTech:它背后的核心邏輯是什么?
劉紫東:這個邏輯其實和推薦算法有相似之處。推薦算法面對海量內容,并根據用戶此時此刻的個性化的特征——無論是人物標簽、當前行為還是潛在訴求,推薦出用戶最喜歡的視頻或商品。
但推薦算法主要解決的是選擇問題,我們在做的空間生成,不僅需要從海量 3D 資產中選擇合適的物品,還要解決擺放的問題——把這些選中的物品合理地布置在空間里。
推薦算法并非抖音首創,但后者將其產品化并做到極致,從這個意義上來說,抖音推動了一個新學科的發展。我們在做的事情同樣是將一種新技術的邏輯轉化為成熟的產品與應用,相當于空間生成領域的“推薦算法”。
游戲是巨頭爭霸縫隙中的綠洲,年營收千萬的 B 端生意只是“順手做”
DeepTech:我們看到 AI 家園類游戲——森盒 SenBOX3 在全網非常火爆,生境科技目前在主推這款游戲,有哪些因素的考慮?
劉紫東:我們的核心技術是 AI 空間生成,現在 90% 以上的精力都在做這款游戲,這也是全球第一個 AI 版《我的世界》。
![]()
(來源:劉紫東)
這個決定源于我們對創業公司類型的清醒認知:軟件公司的類型涵蓋社交、電商、內容,包括知乎、抖音、小紅書、豆瓣等等。現在的趨勢是,涉及到這三大類的業務都是巨頭壟斷。過去 10 年沒有公司在這方面賺到錢。
軟件公司的成長曲線太陡峭了:要么是無限大,要么是 0,沒有中間地帶,所以這些生意沒得做。我們經常說,豆包都是免費的,AI ToC 軟件怎么賺錢呢?但是我們發現,在軟件公司內有一個例外的領域——游戲。游戲的商業市場交易很好,用戶的付費意識很強。
另一方面,游戲內容與整個產業生態很好,個人游戲工作室也能賺到一點錢,非常適合創業。它不是一家獨大,它的上限也夠高,比如既有像大家都熟悉的王者榮耀、吃雞這些游戲,也有大量的小游戲。它就像個熱帶雨林一樣,有大象、長頸鹿、老虎,還有螞蟻。所以我們盤算下來,要做軟件只能做游戲,做其他的都是死路。
![]()
圖丨由生境科技空間智能技術生成的“夢想臥室”(來源:劉紫東)
DeepTech:那剩下 10% 的精力,公司還在發展哪些業務呢?
劉紫東:我們還在做兩個方向。一是通過具身智能機器人數據合成平臺 SimHub 提供海量的家庭數據,訓練機器人對空間智能的感知能力。目前,我們已經與一些機器人廠商,包括掃地機器人廠商合作。但這個市場規模相對有限,而且我們只是批量造數據,不涉及定制化服務。我覺得造數據就像挖石油一樣,造好了有人愿意買我就賣一點。
二是 Sengine API,我們與一些大型電商平臺合作,通過 API 對接,包括國內外的頭部企業松下、Ashley、萬華等等。
我們提出了一個概念叫“空間購物車”。過去用戶將目標商品放入購物車,并不知道這商品買回家是否合適,下單后可能還要退貨。我們的理念是:將你家的毛坯房模型用 AI 空間生成技術做出來,然后用戶把相關商品添加到空間購物車后,就可以把它們擺到你家。這樣就能一目了然地看到這些東西擺在你家是什么樣子、搭得好不好看。
這兩個方向用的也都是我們 AI 生成空間的能力,但其實這兩件事都是順手做的,我們最核心的、最好玩的仍然是自己開發的這款游戲。
DeepTech:其實相當于公司在 B 端和 C 端雙線作戰,這種路徑是階段性的策略,還是長期的并行路線呢?
劉紫東:我們還是以 C 端為主。實際上,新一代的 AI 公司做 B 端和過去傳統意義上的 B 端已經有所不同。上一代做 SaaS 的更多是定制開發的軟件,大部分能力沒法復用。比如以設計平臺酷家樂為代表的公司,如果它做 B 端生意,就會陷入無止境的定制開發。
而現在的模型公司,尤其是像我們這種有自己獨特模型能力、具有商業變現能力的公司來說,做 B 端和做 C 端可以共享一套模型能力,我們按次數收費,定制化的程度非常低,更多體現在模型能力的復用上。對于我們目前的產品和模型能力來說,B 端業務只是順手做的,盡管服務的是一些頭部的大客戶但我自己不太 care,我主要還是關心這款游戲。
DeepTech:發展數據合成平臺,是因為生境在數據方面具有優勢,還是說在某些方面具有稀缺性呢?
劉紫東:我覺得與其說數據優勢,不如說我們理解數據的維度和別人不一樣。比如,如果在清朝時挖到了油田并不會有太廣泛的影響力,因為那時候還沒有汽車。我們擅長的是,更懂得如何充分利用數據背后的信息以及提取特征的維度。
另外,有些創業公司會覺得擁有 1 萬套自己的獨家數據非常厲害。但我并不這樣認為,獨家數據的量太少了。如果要訓練一個大的空間通用智能,一定是從全球互聯網上的億級、百億級數據里來學習。
所以問題的關鍵在于,如何利用互聯網上海量的公共資源。任何私有數據庫都無法與互聯網的公共數據庫相媲美,關鍵在于如何理解它以及如何對其學習。
我們的創新點一方面是我們理解數據的維度更多,另一方面是我們訓練了一種多模態對齊的方法,通過看圖片學習空間設計,有點類似建筑師:不用走遍全世界,而是通過看圖片在腦海里補出建筑整體的形象。
DeepTech:剛才你提到在提取特征數據的維度上,可能和別人做的不太一樣。你能具體說說這些特征在哪些方面比較不一樣嗎?
劉紫東:我們關注的是一些更具體的內容,比如空間是否走得通順、利用率高不高、使用起來方不方便、感受起來舒不舒服、采光好不好、隱私有沒有得到注意等等。
從范式上來說,我覺得大致可以分成兩類。一類是在研究世界本源的科學研究,比如研究鋰電池、自動駕駛、火箭發射。還有一類以人為中心的研究,比如抖音研究推薦算法,它并沒有標準答案,只要數據好、能把握時尚趨勢和潮流即可。從這個角度看,我們更多做的是抖音這一類的研究。我們的目標是滿足更多用戶,讓他們更開心、更舒服。
DeepTech:具身智能現在是比較火熱的領域,大家也都在討論這個話題。除了我們剛談到的空間智能為具身訓練數據,有沒有可能幫助它做更多的事情?
劉紫東:我覺得這方面可以參考自動駕駛,它可以理解成是道路級的通用空間智能。但應用場景到了室內,有些情況變得不一樣。首先,數據采集變得更難、更復雜。因為道路至少可以開一輛車,裝個攝像頭就能像行車記錄儀一樣把數據錄入下來。
但是,室內場景下沒有這樣的機器人。現在大部分掃地機器人的精度很低,而且它的高度太低,不能對整個空間做全面掃描,而且還涉及到隱私問題。此外,室內的情況比道路更復雜。道路的物體種類較少,例如大車、小車、行人、摩托車、斑馬線等。而室內的復雜性體現在,不僅物品是 3D 的,還可能各角度都有。
另一方面,機器人的任務更復雜。自動駕駛主要是躲避問題,但是對于室內機器人來說,它需要主動操作和理解空間。舉個例子,在家里找 U 盤,這個事情不僅僅是空間掃描的問題。
更多時候它可能是藏在某個抽屜里,需要先推理出來,U 盤大概率會放在哪個房間,然后去臥室或客廳搜索的時候,要知道抽屜可以拉開,如果翻一下沒找到下一步應該去哪里找。所以,這件事情需要對空間本身有很深層次的理解。
從這方面來看,它可能比自動駕駛還難。因此,當把這些事情想通后,我們覺得未來機器人真的要走進家庭是個長期的目標,至少還需要十年時間。對我們來說,它一定是必經之路。剛才提到的三個難點卡在大家面前,所以領域內數據稀缺。而我們剛好是造數據的,所以我們技術的作用就顯得非常重要。
DeepTech:也就是說,相當于可以幫助具身智能領域解決其未完全解決的問題。
劉紫東:是的。現在具身智能領域看起來很熱鬧,其實解決的問題還相對有限。我們把機器人歸納為三大階段:
第一階段是解決小腦的運動問題,比如在后空翻、打拳擊、跑步時,保持機器人自己不摔倒,這個問題其實已經基本解決了。大概十年前美國通過強化學習和物理仿真做了一套系統,之后有了現在的相關技術。
第二個階段解決的是操作問題,比如機器人站在臺面上疊衣服、倒水,或拿蘋果、拿杯子等任務。這也是最近兩年最火的話題,V2A(Voice to Action,語音到行動)對機器人說一段話,通過環境感知后執行任務。但是,這樣的環境感知和執行其實空間智能很弱,它基本上是在固定的、單一的場景執行比較固定的任務。
這與找 U 盤、端茶遞水,或在商場里找廁所這類的任務根本不是一回事。實際上,這些復雜的空間任務就是第三階段要解決的問題——主動理解空間智能,它并不是純視覺理解的問題。
![]()
(來源:劉紫東)
DeepTech:所以,相當于現在還沒有正式地進入到訓練空間智能階段?
劉紫東:可以這么說。現在的機器人訓練一般是在工廠或樣板間、實驗室,可能 100 平米、200 平米。讓一個機器人在里面走來走去,不停地做小的模型訓練。所以它沒有泛化能力,但解決特定場景已經足夠用。所以,現在還是初步的空間智能,整個行業還沒有正式地開展這方面的工作。
研發效率即技術壁壘,不懼“后來者”
DeepTech:剛才我們也談到了,盡管大型公司有資源優勢,但生境形成了和他們差異化的發展方向。那么,公司在這個領域有哪些技術壁壘,或者說在保持技術原創性方面做了哪些努力或嘗試呢?
劉紫東:我并不認為世界上有什么堅不可摧的技術壁壘。我們過去的敘事邏輯是,什么東西是別人永遠都實現不了,只有我能實現的。但現在,我們對技術的理解和認知也在不斷加深。我認為所謂的技術壁壘,本質上就是你的研發效率。
如果你的研發效率比別人高 10 倍,那客觀上就形成了技術壁壘,這是一個永無止境的賽跑。這種效率體現在成本和時間兩個方面:如果用更少的資源、更短的時間走得更前,那就會保持領先。
所以,技術壁壘的本質還是企業的研發效率。這取決于整個研發架構的設計、系統的優化以及團隊的文化、人才的選拔機制、招聘機制和晉升機制,它是由綜合的因素決定的。我們的技術端是絕對原創的,所以也不懼怕后來者借鑒,當別人借鑒的速度還沒有我們原創的速度快的時候,壁壘就形成了。
從結果上來看,我們并不是世界上第一家做空間生成的公司。實際上在我們之前早幾年,像酷家樂、三維家、居然設計家(Homestyler)、Autodesk、英偉達都曾想過做空間擺放。另一方面,學界對這個方向的研究已有幾十年了,最近幾年也非常火。我們是用最短的時間,用最低的成本走在了最前面,證明了自己的執行力。
DeepTech:生境在做的事情其實是一個全新的角度,包括我們剛才提到的創造了一個新 的學科。這和你在本科期間從事建筑方面的研究學習是不是也有非常密切的關系?
劉紫東:對,其中最重要的是把人類的空間理解成功能,這并不是常識。其實在過去幾千年,建筑學也不是這么來看待空間的,甚至我在剛開始學習建筑學的時候也沒有空間的概念。但是在 100 年前,建筑學有一次革命,現代主義建筑號召要“以人為本”。也就是說,從城市規劃到室內設計,再到家庭設計都是按照人的需求進行設計。
現在主流的處理空間的方法,還是傳統的自然語言處理(NLP)和計算機視覺(CV)方式的延伸。基于 CV 的 3D 建模更擅長的是單體生成,這方面并沒有太多的技術稀缺性。我們公司也有很好的圖轉 3D 單體的模型,現在倉庫里面已經有 100 萬個單體了。
但是問題的關鍵在于,如何針對用戶特定的需求,從這個倉庫中選擇出來合適的商品,綜合各種因素,擺放到合適的位置。本科期間,我們做了大量關于這方面能力的建筑學訓練和認知升維。這也是為什么我們現在這么稀缺和獨特,能把這個事情落地的原因。
DeepTech:決定成立公司做創業這件事,是你在德州大學奧斯汀分校讀博期間發生的。是怎樣的契機讓你覺得時機非常成熟了,已經不能再等而是必須立刻休學去做這件事?
劉紫東:我覺得是兩方面。一方面是從宏觀層面來說,與 60 后、70 后、80 后相比,我們 90 后、95 后這一代人是被時代拋棄掉的一代。學歷紅利已不再,時代沒有給我們太多機會,所以我是很絕望地活著的。對我來說走創業這條路是“沒得選”,我非常珍惜技術創新的機會,當機會來了一定要抓住。
從微觀上來說,當時我在國外通過一些創新項目和比賽已經小有名氣。2022 年底,隨著 ChatGPT 的火爆,有些國內外的投資人認為我們做 AI 生成空間挺好玩,就聯系到我。所以,我幾乎沒有什么遲疑就休學了,然后于 2023 年 4 月在深圳成立了這家公司。
DeepTech:你本身是 95 后,團隊也是一支年輕的團隊,你是如何管理團隊的呢?
劉紫東:作為公司的 CEO,我和整個團隊的相處模式會隨著公司的情況的發展而有所變化。公司剛開始成立時只有幾個人、十幾個人,去年發展到 30 多人,現在已經有 70 多人了。我更傾向于直接管理,我覺得減少中間層級,可以降低溝通成本和提升效率。但是這需要對管理者和執行者都有更高的綜合素質。這確實是一段挺奇妙的人生經歷。我很難描述現在的狀態,它有點來得太快了,有點像拔苗助長的感覺。我其實也經常陷入一種反思,感覺一切都挺不可思議的。
DeepTech:空間生成是一個新的領域,它又涉及到很多學科交叉,你是如何管理和建設這支團隊的呢?
劉紫東:主要以培養為主,因為 AI 領域變化很快。我們的團隊成員不一定非得是對口的,可能只是大方向相近,然后我們再精準培養、逐步上手。尤其是比較前沿的方向或沒有標準答案的領域,我們更加傾向于招學生,然后通過校企合作來進行培養。整體上來說,公司在 3D 空間內容生成的核心技術壁壘都是我們自己創造出來的。在這方面,我們覺得智商和意愿比直接經驗高很多倍。
DeepTech:那目前公司的發展狀態和你最初預設的相比,是按照原來預設的來發展的嗎?
劉紫東:一部分比預想的更慢,一部分則更快。我們的產品研發和賺錢進度比我們想象中要慢,因為我們越做越發現事情的復雜性。但另一方面,我們也更有信心,因為我們踩過的坑,后面進入到這個領域的人還得再踩一遍。所以,研發和賺錢的進度比我們預期的更慢,但融資的進度、團隊規模的擴張速度比我們預期中更快。
DeepTech:那在進展慢的方面會有壓力嗎?
劉紫東:那倒沒有,和想象中的進度不太一樣是一件很正常的事情。雖然我們有些地方慢一點,但整體上還是一個非常能打的、欣欣向榮的團隊。我們剛開始覺得一年能做出來的事情,現在做了兩年多,但別人做了 10 年也沒做出來。并不是有一家競品公司做出來了產品,我們沒做出來,現在的情況是,我們進行了世界上目前非常少見的、產品化程度最高的嘗試,所以我還是比較驕傲的。
空間 AI 的終極外延:不僅是工具,更是元宇宙的商業生態
DeepTech:最后請幫我們暢想一下,隨著技術的發展和團隊逐漸走上軌道,在與用戶的交互方式方面可能會出現哪些顛覆性的改變?
劉紫東:我覺得這個會千差萬別。首先,游戲領域會在全球范圍內出現的第一個類似現在抖音地位的、基于空間模態的娛樂內容社交平臺。它既有娛樂屬性,也有社交屬性。最終可能是一個平臺,也可能是兩個平臺。
人們會在這個平臺上做幾件事情:
第一,成為一個風靡全球的、時尚和有活力的游戲內容社區,以青少年群體為主,然后向二三十歲的中青年群體蔓延。
第二,演化為包含實體經濟的元宇宙電商平臺,類似于室內版的“谷歌地球(Google Earth)”,人們可以在該平臺社交、購物,甚至直播等各種活動。用戶可以通過這個平臺,足不出戶地去全球各地的家庭做客。既有個體戶在這個元宇宙平臺上開店售賣商品,也有大連鎖店在上面開 Shopping Mall。
當然,我們還有一個更近期的目標,所有與設計和空間改造相關的都可以通過我們的平臺作為流量入口。比如買畫、地毯、床單、窗簾、擺件、花草……甚至布置兒童房等。
它們很可能是同步進行的。首先它是款游戲,然后會進行現實的鏡像。之后會有實際的需求在平臺產生,接下來就會有買賣、有交易,再往后就會有商家在上面開店。
![]()
(來源:劉紫東)
DeepTech:所以,也可以說它是虛擬現實之間真正的元宇宙平臺?
劉紫東:元宇宙這個詞在五年前已經被用濫了,它之所以沒發展起來原因還是卡在了技術問題。過去的元宇宙其實都是用雇傭大量場景地編手工建模搭建出來的場景,那不是真正的元宇宙。隨著空間模態技術的成熟,每個人可以便捷地把自己家復制到網上、創造 3D 資產以及做渲染,所以現在我們覺得真正的元宇宙時機到來了。
DeepTech:總結來說,AI 生成空間相當于改變了生產關系,也就是把之前特別高的門檻或者難以做到的事情,現在做成普通用戶人人都能參與、能實現的一種工具。
劉紫東:對,這是其中的一個方面。我們通過 AI 讓更多用戶能夠體驗到個性化設計的樂趣,相當于幫他們跨越了一個維度,顯著降低了技術的實現門檻。
但其實我們做的事情并不只是提供了一個工具那么簡單,而是提供了一種可以激發大規模創意以及互動的基礎能力。一種已經被驗證的生態型公司的經典路徑是:商業來自于流量,流量來自于內容,內容來自于工具。所以,當我們有了一個好工具之后,它會產生好的內容,好的內容又會吸引更多用戶,而當平臺聚集了海量用戶后,各種商業機會就都來了。
如果說過去十年,工具型平臺的終點是內容社區,那么空間 AI 的終點,很可能是一個涵蓋內容社區、電商和社交的、真實世界的數字鏡像與商業生態。
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.