![]()
人工智能革命最根本的特征,是歷史上第一次出現了“輸出大于輸入”的系統。這就是涌現、頓悟,這就是創造。
文|朱耘
ID | BMR2004
“具身智能需要海量的數據,但現在數據成為了瓶頸。”2025年歲末,年近七旬的熊焰,回到了自己曾學習、工作了10多年的地方——哈爾濱工業大學,圍繞具身智能做了一場演講。
熊焰說,這是一次特殊的“續寫”。
1988年,熊焰在哈爾濱工業大學完成了碩士論文答辯,題目是《中國工業機器人產業化研究》。那時,多數人對機器人尚缺乏基本認知,甚至絕大多數人的第一反應是:“‘肉人’還用不完呢,還用‘鐵人’?”
37年后,機器人早已從概念走向現實,人們關注的問題從“為什么要用機器人”變成了“如何讓機器人更智能化”。然而,要實現更高水平的智能,其中的瓶頸是海量數據的獲取、處理和有效利用。
如今,熊焰的身份是國富資本董事長、算力自由創始人。時間倒回2015年3月,時任北京金融資產交易所董事長、中國銀行間交易商協會副秘書長的熊焰,做了人生中一次重大抉擇——58歲,從體制內辭職正式創業。“我認為人生應該跨越百歲,退休后40年無事可做,我不能接受,為了高質量地多活10年,我要自己干事。”熊焰向《商學院》記者坦言了他的創業初衷。
10年來,國富資本的投資和研究方向始終圍繞前沿技術,如信息技術、碳中和、商業航天、人工智能……從大學開始研究機器人,到如今機器人在多個領域開始應用,熊焰見證了曾經的想象一步步變成現實,而原來一些未曾預料到的事也逐漸出現了。熊焰認為,當年在哈工大讀碩士、寫論文的過程,那些訓練方法對他一生都有重要影響,“它讓我養成了一種習慣,關注新事物,研究前人沒有見過的難題,尋找處女地。”
01
數據瓶頸
2022年11月30日,ChatGPT橫空出世,熊焰把這一天定義為“人工智能的黎明時刻”。站在2026年年初的時間點,熊焰說:“太陽升起來了!黎明時刻就像哥倫布發現新大陸,大家隱約覺得那是一片大陸,什么方向、什么路徑都得摸索。ChatGPT就是那臨門一腳,告訴大家這條路是通的。”
熊焰認為,ChatGPT這一輪突破,最重要的是算力的當量。OpenAI CEO山姆·奧特曼和首席技術官蘇茨克維,這兩個人有點偏執,“認為只要規模上去了,就能突破。這里邊有很大的偶然性和運氣成分,但最寶貴的就是這種偏執與堅持。”
ChatGPT之后,大語言模型如雨后春筍般涌現,DeepSeek、文心一言、豆包、通義千問與Gemini、Claude等國外大模型“百模大戰”。為什么人工智能會先從語言突破?熊焰認為,一方面語言文字是人類獨有的能力,人類的多數復雜行業是用語言組織的,語言的邊界就是思想的邊界,另一方面是語言文字形成的“數據紅利”,這是更重要的原因。“五千年文明積累,近50年的互聯網革命,使得語言文字的數據量達到了空前的EB量級(1018),正是這些海量的數據滋養了大模型。”
在熊焰看來,今天的大語言模型可以標定為大模型的1.0版本,接下來是2.0版本,即多模態,不僅能理解文字,還能理解圖像、聲音、視頻。
但真正能解決問題、觸達生產、實現自主行動的具身智能,是世界模型,它是大模型的3.0版本,不過其正面臨著嚴峻的“數據荒”問題。“具身智能與目前的1.0、2.0版本最大的差異,在于它要求理解的不僅僅是光影、文字、圖像這些表層信息,還要理解內在的、看不見、聽不見的物理規律。”這就是各種“場”,如重力場、磁力場、引力場,甚至包括暗物質,對各種物理規律的理解,而且這種理解要特定到一個具象的個體,難度非常大。
此時一個最棘手的問題出現了:具身智能需要的數據量,跟語言模型的EB量級相比,差了至少105。有人測算,按照今天的數據采集方法,一臺具身智能本體、一個采集員、一個錄入員,三個主體一天能采集幾十條數據,而模型需要的訓練數據是萬億條級別。如果要滿足真正意義的具身智能的小腦、大腦的訓練數據,需要幾百年的數據采集工作量。“這顯然是不可能,等不及的。” 熊焰坦言。
為此,熊焰和團隊正在做一個大模型,以高質量的真實數據做支點,在強大算力的支持下,打造一個數據合成大模型,合成出來之后在算力的支撐下進行校驗,從而產生高質量的合成數據。
“具身智能的數據合成,目前業界希望的路徑是發揮真實數據的支點作用,利用大模型和算力來加強其杠桿效應,通過低成本、可擴展的合成數據,放大有限真實數據的價值。”熊焰詳細解釋,如果用1份真實的數據與9份合成數據混合,就能把目前機采的真實數據放大一個數量級,從而大幅度靠近目標。合成數據天生帶有全標注特性,再結合地域隨機化等技術,可有效縮小與真實數據的差距。
而在數據內容上,不僅要重視視頻數據,更要重視內在的物理規律,如上述多種“場”的因素要充分考慮進來,力爭使合成數據在視頻維度與物理維度上實現協同增強,產生累積效應。
據了解,目前國內數據合成已經有若干個團隊做了一些小規模的商業試點,但是如何真正做到規模化、經濟性的實踐還有難度。核心困難,就是數據的可行性、可用性,要讓用戶幾乎感覺不出來與真實數據有什么本質的差異。再就是商業模式,要有人買單,形成持續的商業循環。
熊焰目前的解決方案是,“頭部的企業+頂尖的高校+技術團隊”搭建合成數據的規模化生產中心。國富資本投資孵化的算力自由平臺,是做算力交易與調度的,愿景是“讓算力更加容易、更加便宜”,已經與鵬城實驗室、中國移動、英偉達中國進行了合作。
從1988年研究工業機器人,到2025年研究具身智能的數據困境,熊焰在技術的最前沿又找到了新的人生方向。
02
4塊2毛錢的警示
短短3年,人工智能的發展速度之快,遠超想象。在哈工大的演講中,熊焰提出了“人類當量”的概念。“正常人每周工作5天,每天工作8小時,輸出的Token量約為100萬個。百萬Token今天的價值約1塊錢,這意味著,1個月4周,一個普通的知識工作者產生的Token只有4塊2毛錢。”熊焰用這個極端的對比,揭開了一個殘酷的現實:“人就別跟大模型比了,完全是不對等的競爭,而且人家的能力還能在3個月翻一番!”
熊焰并非技術的悲觀主義者,在他看來,人工智能革命最根本的特征,是歷史上第一次出現了“輸出大于輸入”的系統。“以往所有的人造系統,輸出都小于等于輸入。這是常識,甚至被寫進物理定律。”熊焰解釋道,“曾經永動機的故事一直被當作笑柄,輸出等于輸入都不成立。但這一輪人工智能大模型出現了‘你教給它的東西它會,你沒教給它的東西它也會了’的現象。這就是涌現、頓悟,這就是創造。”
大模型的出現,會催生更多“一人公司”,即一個人發起并主導一件事,全鏈條都想清楚了,其中操作性強、大量的基礎工作全由智能體來完成。熊焰說,這不是用AI替代人,而是使用AI的人替代那些不使用AI的人。現在每個人都可以使用AI來幫助我們實現“智商倍增”。
這種革命性的變化,讓知識生產的邏輯發生了根本性改變,“今后,人在知識生產中起出題和判斷的作用。生產的過程,你根本整不過人工智能。”
那么,人類該如何自處?熊焰給出了他的“生存三寶”:一是健全的身心,這是最基礎的。“你得有價值地活著,有存在感、有成就感、有快樂感。”二是人的核心能力,即以思維能力為核心,包括創新能力、判斷能力、情感能力。“大模型可以說得頭頭是道,但它是不會負責任的,決策的甜蜜與痛苦由人來擔負。”三是人文底蘊,“要是個人本身沒有被文化浸淫過,大模型寫出王勃《滕王閣序》那樣的句子,你都無法產生內心交流。”這種審美能力,是“碳基生命”的護城河,“硅基生命”暫時無法觸及。
在AI時代,當知識生產的主體從人腦轉向“人腦+智腦”甚至“純智腦”時,整個知識產權體系的底層邏輯都在發生改變。
過去幾百年建立在工業文明基礎上的專利和版權制度,其核心邏輯是“保護稀缺”。熊焰說:“知識產權的設計,是為了保護發明人。知識是稀缺的,只有少數人掌握。為了讓它擴散出去,又要讓少數人獲得收益,才設計了這么一整套知識產權保護體系。”而在AI時代,整個知識一經生產出來,價值就迅速貶值。在未來的創作與知識生產中,人類的貢獻可能只占2%,即那一瞬間的“靈光一現”和最終的“審美判斷”,剩下的98%都由AI完成 。由此,熊焰建議,知識產權的邏輯必須向“人工智能化”大幅度傾斜,利用大模型的方法論來重新管理和確認人的貢獻。在這個“知識付費”的新階段,雖然單次知識的保鮮期縮短了,但應用的頻率和總量將呈幾何倍數增長。
而這更帶來一個深層問題:當AI參與甚至主導知識生產時,產權歸屬該如何界定。“理論上應該歸人。”熊焰說,“現在機器、大模型已經變成普惠式、無處不在的工具。一首歌,盡管是大模型寫的,但出主意的是人,‘火遍全網’也能找到最初發布該歌曲的ID,人出題,人做判斷,人承擔責任。”
熊焰認為,未來的權力和重心將從“做”轉向“斷”。人要做的,是提升判斷的權重,而非操作的頻率。按照這種思考延伸到教育領域,就是對整個教育體系的根本性重構。教育不能再是老師講、學生聽,一遍遍地刷題,需要從以教師為中心轉變成以學生為中心,從以教為主要任務轉變成以學為主要任務,教材要轉成學材,考試要從知識點變成解決實際問題、探究得出結論過程的能力。熊焰坦言,全球的教育都沒有形成一整套應對AI時代的體系,大家都在摸著石頭過河。
03
元宇宙可實現碳中和?
在很多人眼中,熊焰似乎總在追逐最“時髦”的概念。但熊焰認為,“其實,我這一輩子研究的事情,邏輯是一脈相承的。無論是信息技術還是碳中和,它們都是人類走向更高文明的必經之路。”
提起“雙碳”目標,人們會首先想到電力、鋼鐵、水泥等碳排放大戶,隨著碳減排的知識普及,很多人也意識到,現在這些大模型背后的算力中心、數據中心等,更是耗電與耗能大戶,碳排放并不低。熊焰提出了“元宇宙是最大的碳中和工程”的觀點。
但元宇宙需要高性能計算,數據中心、GPU集群都是耗電大戶,怎么能碳中和呢?熊焰用“單位能耗”的概念解釋打通了該邏輯。他指出,信息,技術產生的社會價值增量,對比耗能所產生的單位價值,要遠遠高于其他行業。
舉個例子,用1億度電煉鋼,和用1億度電用于人工智能的投入,單位能耗下的社會價值貢獻,人工智能顯然更高,對整個社會全鏈條產業鏈的進化貢獻也更大。而這只是表面現象,更重要的是,未來的碳中和技術的突破,恰恰要依靠AI,例如做碳捕集、碳封存,所有突破性技術都離不開大模型的加持。熊焰描繪道,未來生產生活將大量用虛擬世界的活動來解決真實世界的問題,以此來大規模降低真實世界的成本。“以前真刀真槍真物質的‘濕實驗’,今后可能只占10%,90%都是‘干實驗’,即在計算機上模擬。”
采訪臨近結束,記者問了熊焰一個“終極問題”:大部分工作大模型都干了,那人類創造力的最后防線在哪兒?
熊焰沉默了幾秒說:“有些終極問題,想不明白就先放放,后人總比我們聰明。”他說,他屬于理性樂觀派,并不認為人類開發出的大模型,最后會反噬人類,只要善良正義的人占絕大多數,占有主導的力量,就不會出現被恐怖主義組織利用,AI反過來統治人類的情況。熊焰說,宇宙中充斥的絕大多數暗物質,人類還沒有發現,對于許多規律的探索,如暗物質的發現等,還有需要人類來研究,“相較于無限的宇宙,人類、包括AI,還只是毛毛蟲,太渺小了。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.