通信世界網消息(CWW)當前具身智能的發展正經歷從“淺層執行”到“深度賦能”的關鍵轉型,而空間智能、世界模型與5G、6G技術的協同,將重塑萬物互聯的底層邏輯,推動智能體互聯邁向新階段。
工信智媒體(通信世界)記者采訪了北京郵電大學教授呂廷杰,他強調:“我國具身智能的發展仍處于‘嬰幼兒時代’,核心表現為‘小腦智能’的成熟與‘大腦智能’的缺失,而具身智能要實現質的飛躍,必須突破‘大腦智能’的瓶頸,而其核心技術基礎正是空間智能與世界模型”。
具身智能的發展仍處于“嬰幼兒時期”
“我國具身智能的發展已呈現出鮮明的實用化轉向。以往具身智能相關應用多集中在個人娛樂、才藝展示等領域,而如今,越來越多的設備開始滲透到生產制造、物流運輸等核心工業場景,成為高端制造業升級的重要支撐。”呂廷杰認為,這一變化并非偶然,2025年是“十四五”收官之年,我國高端制造業已取得矚目成就,2025年前11個月出口貿易順差突破1萬億美元,其中80%來自高端工業制品,這一數據背后,是具身智能設備在提升生產效率、保障生產安全等方面的持續賦能,也印證了其工業滲透率的不斷提升。在他看來,這一趨勢既是對過往技術積累的成果檢驗,更是未來產業升級的重要開端。
呂廷杰坦言,當前全球具身智能的發展仍處于“嬰幼兒時期”,核心表現為“小腦智能”的成熟與“大腦智能”的缺失。他舉例說明,如今的機器人能靈活跳舞、快速攀爬、負重前行,甚至被踹翻后能迅速起身繼續運行,這些平衡與執行能力在國際上屢獲佳績,但本質上只是基于預設程序的自動化或由人遙控,而非智能化,原因就在于尚缺乏對復雜物理世界的自主感知與決策能力。“就像孩子學步,小腦平衡能力和關節的柔韌性不斷提高,但卻不懂判斷環境、靈活應變”,他這樣比喻。
“具身智能要實現質的飛躍,必須突破‘大腦智能’的瓶頸,而這一核心的關鍵正是空間智能與世界模型。”在他看來,語言模型基于人類已知的主觀世界,模擬的是文字邏輯、心智表達等能力,能寫出漂亮的文章、畫出抽象派的畫作,卻無法理解“被風吹起的空塑料袋或報紙等并不會砸壞汽車”等物理世界規律——因為客觀世界要遠遠大于人類的主觀世界。
世界模型與5G、6G協同共建“萬物智聯”
世界模型聚焦的是物理世界的客觀規律,是多模態的感知與決策系統。呂廷杰解釋,人類通過“眼耳鼻舌身意”六根來感知世界,世界模型正是要模擬這種多維度感知能力,整合視覺、聽覺、觸覺等信息,讓機器理解空間關系、因果邏輯。他舉例,自動駕駛走到L3級便止步不前,核心問題就是缺乏世界模型的賦能。很多人說,特斯拉的自動駕駛FSD做得比較好,主要因為其一直強調“看得懂”,而不只基于是語言模型的“讀得懂”。
“5G、6G的核心價值是‘物與物的通信’,但當前5G應用場景不足的關鍵在于‘物尚未智能化’”。當世界模型賦能具身智能,機器人、自動駕駛設備等成為具備感知、自主決策能力的“智能體”,它們就需要通過低時延、高可靠的5G、6G網絡獲取數據、協同工作,這正是通信技術的核心應用場景。
他特別提到,華為等深耕通信設備的的企業,無需過度卷入大語言模型的內卷,其優勢更契合聚焦世界模型研發。當“物”具備智能,5G、6G的通信價值才能真正釋放,萬物互聯才能從“簡單連接”走向“智能協同”。比如物流機器人通過6G網絡與倉庫系統實時聯動,自主規劃路線、規避障礙;家庭護理機器人感知老人身體狀態后,通過網絡對接醫療資源,這些場景的實現,都離不開世界模型與5G、6G的雙向賦能,也就是正在浮現中的“智能體互聯網”。有機構預測,到2030年,全球智能體的數量將達到90億,這是一個潛在的巨大通信市場。
對于產業發展方向,呂廷杰建議,國內企業應跳出大語言模型的內卷,聚焦空間智能與世界模型的底層技術突破。他判斷,未來國內能站穩腳跟的大語言模型企業不會超過5家。而世界模型與語言模型的基礎數據、算法架構完全不同,前者需要多模態數據與CNN卷積算法等技術,是全新的賽道。我國在具身智能的“小腦能力”上已有扎實基礎,物流、醫療、家庭護理等領域應用場景豐富,接下來更應鼓勵龍頭企業搭建開源的世界模型底座,讓中小企業能在此基礎上開發垂直場景應用,形成“底座+應用”的產業生態。
他預測,基于世界模型的文創產業將成為新的就業藍海。根據谷歌DeepMind團隊負責人哈撒比斯的觀點,當前大語言模型只能生成1~2分鐘符合物理規律的視頻,而世界模型成熟后,將至少能生成1~2小時的數字孿生物理世界,這將徹底顛覆動漫、游戲、電影等產業的運作模式。為此,谷歌在剛剛發布的“2026年行動計劃”中,明確提出要打造既有語言模型、又有強大世界模型的全能模型。
總之,“人工智能的終極目標是幫助人類探索未知的物理世界規律,走向超人工智能(ASI),而空間智能、世界模型與5G、6G的協同發展,正是這條道路上的關鍵一步。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.