每經記者:可楊 每經編輯:陳星
過去一年,具身智能持續處于資本與產業關注的交匯點。一方面,融資規模不斷擴大,技術演示頻繁刷新行業想象;另一方面,穩定落地、規模復制以及成本控制仍是行業繞不開的現實挑戰。
2月10日晚間,星海圖合伙人、CFO(首席財務官)羅天奇在接受包括《每日經濟新聞》在內的媒體記者采訪時表示,具身智能最終依然是一個由Scaling Law(規模定律)驅動的AI(人工智能)行業,勝負手不在于短期的融資額,而在于每一元錢能換回多少智能。
2月11日,星海圖完成10億元B輪融資。截至本輪,星海圖累計融資額近30億元,估值百億元,成為繼宇樹、智元、銀河通用之后具身智能行業又一只百億元“獨角獸”。
行業正經歷結構性轉折
羅天奇將當下具身智能賽道比作當年的“百團大戰”。他認為,美團當年之所以能贏,并不是靠“一招鮮”的技術,而在于其對生意本質有很深的認知。而2025年開始瘋狂燒錢的友商很像當年“百團大戰”及早期行業發展不夠充分時,把融資款全用來投流獲客的那些公司。
在具身智能產業中,星海圖是一家在融資節奏和支出上顯得相對審慎的公司,面對“花錢慢”的質疑,羅天奇則表示:“具身智能本質上還是AI行業,技術核心驅動力是Scaling Law。”他指出,具身智能目前仍處于Scaling Law初期,數據還在準備階段且數據量不夠大。他判斷,隨著Scaling Law進一步發揮作用,行業將出現明顯的格局收斂。
羅天奇透露,目前頭部具身智能企業在算力和數據投入規模上,大致為頭部大語言模型創業公司的十分之一,但這一差距可能迅速縮小。他強調,Scaling Law的擴展本身具有指數特征,“可能在2026年規模上升一個數量級,未來兩三年再繼續放大”。
羅天奇進一步強調,當前具身智能仍處于技術競賽早期階段。“我們今天是在跑一場馬拉松,而不是百米賽跑,行業整體可能才跑出一公里。”
因此,他認為,企業需要保留足夠資金,以應對未來數據增長帶來的算力與模型訓練成本激增。他直言,行業競爭的本質是誰能把一元錢換回最高程度的智能。“在中國具身智能公司里,誰花錢效率最高,誰就最值得獲得資本投資。”
當前具身智能行業正經歷一次重要的結構性轉折,資本邏輯正在從“廣撒網”轉向“押頭部”,行業也從早期技術探索階段逐步邁向資源密集型競爭階段。
硬件成本不是比拼關鍵
關于具身智能的“ChatGPT時刻”何時到來,業內爭議頗多。羅天奇認為,“ChatGPT時刻”不一定是一兩年內很快到來的,但這并不妨礙商業化的率先開啟。
羅天奇將具身智能的商業化拆分為技術驅動與商務驅動,后者包括機器人表演等場景。
從技術驅動的角度,羅天奇認為,目前能夠跑通的三個硬性邊界包括厘米級的精度要求、接近人類80%的作業速度以及99%準確率水平的應用環境。他介紹,這類場景在當前產業中具有較大數量基礎。
在他看來,部分場景的料箱搬運、物流分揀以及末端配送的“最后一公里”操作,是率先符合這些邊界的場景。與自動駕駛不同,具身智能對容錯率更友好,不需要等到99.99%的成功率才能落地。具身智能會“潤物細無聲”地進入千行百業,“甚至若干年后大家回顧這個過程,好像記不得哪一年是具身智能的‘ChatGPT時刻’,但是具身智能已經真的走進千行百業了”。
在商業化選擇上,羅天奇強調要避免將資源過早投入由商務驅動的商業化。他認為,如果技術基礎尚未穩定就大規模推進市場擴張,容易導致頭重腳輕。
羅天奇認為,從財務視角看,具身智能的ToB(面向企業端)生意在營收規模上極具潛力。大模型廠商賣一套私有化模型可能只有幾十萬元收入,但這可能只是一臺具身機器人的價格。當給一個大客戶賣出數十甚至上百臺機器時,實現數億元的營收并不困難。但他強調,相比營收的絕對數量,更應關注營收的質量,如開機使用比例和毛利率等指標。
對于規模訂單能夠帶來的供應鏈議價能力變化,羅天奇的判斷是,具身智能行業同樣存在一定的規模效應,但硬件成本最終不會是大家比拼的關鍵。
“這個行業中長期的商業模式是賣‘物理世界的Token’,就跟大語言模型賣虛擬世界Token 一樣。”羅天奇分析稱,當供應鏈成熟到一定程度,即以年產10萬臺以上為標志,硬件成本將不再有實質性差別。屆時,真正的壁壘在于兩點:一是智能水平,二是由智能水平反向定義的硬件設計和生產制造能力。
全球競爭靠數據供應鏈
在全球競爭視角下,馬斯克曾預言未來全球前十大機器人公司,除了特斯拉剩下的可能都在中國。羅天奇對此深表認同,但他指出,外界往往只看到了中國的硬件供應鏈優勢,卻忽視了數據供應鏈優勢。
“這個(數據供應鏈優勢)是比硬件供應鏈更夸張的優勢。”羅天奇直言,中國最高質量的數據采集成本可能只有美國公司的十分之一。這意味著花相同的錢,可以采集到10倍數量的數據,這一成本差距遠高于硬件BOM成本(物料清單)的差異。在他看來,這一優勢將成為中國具身智能長期競爭的重要基礎。
在技術架構層面,對于世界模型的發展是否會反向推動具身智能的問題,他認為,世界模型本身是一個更宏大的命題,短期內更適合擁有算力與多模態積累優勢的大廠持續推進。從現實路徑來看,多模態視覺語言模型(VLM)的突破確實在持續發生。但他同時強調,很多具身智能公司對技術架構分拆不夠細,在推理能力、理解能力等方面,如果已經有更好的模型,創業公司沒必要重復“造輪子”。
羅天奇認為,具身智能公司真正獨特、必須從零開始研發的部分,是具身基礎模型,也就是負責物理世界執行能力的VLA端到端模型(視覺語言動作模型,VisionLanguage-Action)。
在他看來,VLM與VLA是互補關系:前者負責理解與推理,后者負責行動與執行。理解能力已經由大廠持續突破,“我們真正獨特的部分,一定是從頭開始去做自己的VLA模型。”他表示,具身智能企業需要站在巨人肩膀上,但必須把資源集中在物理世界智能的構建上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.