網易首頁 > 網易號 > 正文申請入駐

哈工大熊焰：在AI的黎明中續寫37年前的預言

2026-04-03 13:09:59　來源: 商學院雜志

北京舉報

分享至

人工智能革命最根本的特征，是歷史上第一次出現了“輸出大于輸入”的系統。這就是涌現、頓悟，這就是創造。

文｜朱耘

ID | BMR2004

“具身智能需要海量的數據，但現在數據成為了瓶頸。”2025年歲末，年近七旬的熊焰，回到了自己曾學習、工作了10多年的地方——哈爾濱工業大學，圍繞具身智能做了一場演講。

熊焰說，這是一次特殊的“續寫”。

1988年，熊焰在哈爾濱工業大學完成了碩士論文答辯，題目是《中國工業機器人產業化研究》。那時，多數人對機器人尚缺乏基本認知，甚至絕大多數人的第一反應是：“‘肉人’還用不完呢，還用‘鐵人’？”

37年后，機器人早已從概念走向現實，人們關注的問題從“為什么要用機器人”變成了“如何讓機器人更智能化”。然而，要實現更高水平的智能，其中的瓶頸是海量數據的獲取、處理和有效利用。

如今，熊焰的身份是國富資本董事長、算力自由創始人。時間倒回2015年3月，時任北京金融資產交易所董事長、中國銀行間交易商協會副秘書長的熊焰，做了人生中一次重大抉擇——58歲，從體制內辭職正式創業。“我認為人生應該跨越百歲，退休后40年無事可做，我不能接受，為了高質量地多活10年，我要自己干事。”熊焰向《商學院》記者坦言了他的創業初衷。

10年來，國富資本的投資和研究方向始終圍繞前沿技術，如信息技術、碳中和、商業航天、人工智能……從大學開始研究機器人，到如今機器人在多個領域開始應用，熊焰見證了曾經的想象一步步變成現實，而原來一些未曾預料到的事也逐漸出現了。熊焰認為，當年在哈工大讀碩士、寫論文的過程，那些訓練方法對他一生都有重要影響，“它讓我養成了一種習慣，關注新事物，研究前人沒有見過的難題，尋找處女地。”

數據瓶頸

2022年11月30日，ChatGPT橫空出世，熊焰把這一天定義為“人工智能的黎明時刻”。站在2026年年初的時間點，熊焰說：“太陽升起來了！黎明時刻就像哥倫布發現新大陸，大家隱約覺得那是一片大陸，什么方向、什么路徑都得摸索。ChatGPT就是那臨門一腳，告訴大家這條路是通的。”

熊焰認為，ChatGPT這一輪突破，最重要的是算力的當量。OpenAI CEO山姆·奧特曼和首席技術官蘇茨克維，這兩個人有點偏執，“認為只要規模上去了，就能突破。這里邊有很大的偶然性和運氣成分，但最寶貴的就是這種偏執與堅持。”

ChatGPT之后，大語言模型如雨后春筍般涌現，DeepSeek、文心一言、豆包、通義千問與Gemini、Claude等國外大模型“百模大戰”。為什么人工智能會先從語言突破？熊焰認為，一方面語言文字是人類獨有的能力，人類的多數復雜行業是用語言組織的，語言的邊界就是思想的邊界，另一方面是語言文字形成的“數據紅利”，這是更重要的原因。“五千年文明積累，近50年的互聯網革命，使得語言文字的數據量達到了空前的EB量級（1018），正是這些海量的數據滋養了大模型。”

在熊焰看來，今天的大語言模型可以標定為大模型的1.0版本，接下來是2.0版本，即多模態，不僅能理解文字，還能理解圖像、聲音、視頻。

但真正能解決問題、觸達生產、實現自主行動的具身智能，是世界模型，它是大模型的3.0版本，不過其正面臨著嚴峻的“數據荒”問題。“具身智能與目前的1.0、2.0版本最大的差異，在于它要求理解的不僅僅是光影、文字、圖像這些表層信息，還要理解內在的、看不見、聽不見的物理規律。”這就是各種“場”，如重力場、磁力場、引力場，甚至包括暗物質，對各種物理規律的理解，而且這種理解要特定到一個具象的個體，難度非常大。

此時一個最棘手的問題出現了：具身智能需要的數據量，跟語言模型的EB量級相比，差了至少105。有人測算，按照今天的數據采集方法，一臺具身智能本體、一個采集員、一個錄入員，三個主體一天能采集幾十條數據，而模型需要的訓練數據是萬億條級別。如果要滿足真正意義的具身智能的小腦、大腦的訓練數據，需要幾百年的數據采集工作量。“這顯然是不可能，等不及的。” 熊焰坦言。

為此，熊焰和團隊正在做一個大模型，以高質量的真實數據做支點，在強大算力的支持下，打造一個數據合成大模型，合成出來之后在算力的支撐下進行校驗，從而產生高質量的合成數據。

“具身智能的數據合成，目前業界希望的路徑是發揮真實數據的支點作用，利用大模型和算力來加強其杠桿效應，通過低成本、可擴展的合成數據，放大有限真實數據的價值。”熊焰詳細解釋，如果用1份真實的數據與9份合成數據混合，就能把目前機采的真實數據放大一個數量級，從而大幅度靠近目標。合成數據天生帶有全標注特性，再結合地域隨機化等技術，可有效縮小與真實數據的差距。

而在數據內容上，不僅要重視視頻數據，更要重視內在的物理規律，如上述多種“場”的因素要充分考慮進來，力爭使合成數據在視頻維度與物理維度上實現協同增強，產生累積效應。

據了解，目前國內數據合成已經有若干個團隊做了一些小規模的商業試點，但是如何真正做到規模化、經濟性的實踐還有難度。核心困難，就是數據的可行性、可用性，要讓用戶幾乎感覺不出來與真實數據有什么本質的差異。再就是商業模式，要有人買單，形成持續的商業循環。

熊焰目前的解決方案是，“頭部的企業+頂尖的高校+技術團隊”搭建合成數據的規模化生產中心。國富資本投資孵化的算力自由平臺，是做算力交易與調度的，愿景是“讓算力更加容易、更加便宜”，已經與鵬城實驗室、中國移動、英偉達中國進行了合作。

從1988年研究工業機器人，到2025年研究具身智能的數據困境，熊焰在技術的最前沿又找到了新的人生方向。

4塊2毛錢的警示

短短3年，人工智能的發展速度之快，遠超想象。在哈工大的演講中，熊焰提出了“人類當量”的概念。“正常人每周工作5天，每天工作8小時，輸出的Token量約為100萬個。百萬Token今天的價值約1塊錢，這意味著，1個月4周，一個普通的知識工作者產生的Token只有4塊2毛錢。”熊焰用這個極端的對比，揭開了一個殘酷的現實：“人就別跟大模型比了，完全是不對等的競爭，而且人家的能力還能在3個月翻一番！”

熊焰并非技術的悲觀主義者，在他看來，人工智能革命最根本的特征，是歷史上第一次出現了“輸出大于輸入”的系統。“以往所有的人造系統，輸出都小于等于輸入。這是常識，甚至被寫進物理定律。”熊焰解釋道，“曾經永動機的故事一直被當作笑柄，輸出等于輸入都不成立。但這一輪人工智能大模型出現了‘你教給它的東西它會，你沒教給它的東西它也會了’的現象。這就是涌現、頓悟，這就是創造。”

大模型的出現，會催生更多“一人公司”，即一個人發起并主導一件事，全鏈條都想清楚了，其中操作性強、大量的基礎工作全由智能體來完成。熊焰說，這不是用AI替代人，而是使用AI的人替代那些不使用AI的人。現在每個人都可以使用AI來幫助我們實現“智商倍增”。

這種革命性的變化，讓知識生產的邏輯發生了根本性改變，“今后，人在知識生產中起出題和判斷的作用。生產的過程，你根本整不過人工智能。”

那么，人類該如何自處？熊焰給出了他的“生存三寶”：一是健全的身心，這是最基礎的。“你得有價值地活著，有存在感、有成就感、有快樂感。”二是人的核心能力，即以思維能力為核心，包括創新能力、判斷能力、情感能力。“大模型可以說得頭頭是道，但它是不會負責任的，決策的甜蜜與痛苦由人來擔負。”三是人文底蘊，“要是個人本身沒有被文化浸淫過，大模型寫出王勃《滕王閣序》那樣的句子，你都無法產生內心交流。”這種審美能力，是“碳基生命”的護城河，“硅基生命”暫時無法觸及。

在AI時代，當知識生產的主體從人腦轉向“人腦+智腦”甚至“純智腦”時，整個知識產權體系的底層邏輯都在發生改變。

過去幾百年建立在工業文明基礎上的專利和版權制度，其核心邏輯是“保護稀缺”。熊焰說：“知識產權的設計，是為了保護發明人。知識是稀缺的，只有少數人掌握。為了讓它擴散出去，又要讓少數人獲得收益，才設計了這么一整套知識產權保護體系。”而在AI時代，整個知識一經生產出來，價值就迅速貶值。在未來的創作與知識生產中，人類的貢獻可能只占2%，即那一瞬間的“靈光一現”和最終的“審美判斷”，剩下的98%都由AI完成。由此，熊焰建議，知識產權的邏輯必須向“人工智能化”大幅度傾斜，利用大模型的方法論來重新管理和確認人的貢獻。在這個“知識付費”的新階段，雖然單次知識的保鮮期縮短了，但應用的頻率和總量將呈幾何倍數增長。

而這更帶來一個深層問題：當AI參與甚至主導知識生產時，產權歸屬該如何界定。“理論上應該歸人。”熊焰說，“現在機器、大模型已經變成普惠式、無處不在的工具。一首歌，盡管是大模型寫的，但出主意的是人，‘火遍全網’也能找到最初發布該歌曲的ID，人出題，人做判斷，人承擔責任。”

熊焰認為，未來的權力和重心將從“做”轉向“斷”。人要做的，是提升判斷的權重，而非操作的頻率。按照這種思考延伸到教育領域，就是對整個教育體系的根本性重構。教育不能再是老師講、學生聽，一遍遍地刷題，需要從以教師為中心轉變成以學生為中心，從以教為主要任務轉變成以學為主要任務，教材要轉成學材，考試要從知識點變成解決實際問題、探究得出結論過程的能力。熊焰坦言，全球的教育都沒有形成一整套應對AI時代的體系，大家都在摸著石頭過河。

元宇宙可實現碳中和？

在很多人眼中，熊焰似乎總在追逐最“時髦”的概念。但熊焰認為，“其實，我這一輩子研究的事情，邏輯是一脈相承的。無論是信息技術還是碳中和，它們都是人類走向更高文明的必經之路。”

提起“雙碳”目標，人們會首先想到電力、鋼鐵、水泥等碳排放大戶，隨著碳減排的知識普及，很多人也意識到，現在這些大模型背后的算力中心、數據中心等，更是耗電與耗能大戶，碳排放并不低。熊焰提出了“元宇宙是最大的碳中和工程”的觀點。

但元宇宙需要高性能計算，數據中心、GPU集群都是耗電大戶，怎么能碳中和呢？熊焰用“單位能耗”的概念解釋打通了該邏輯。他指出，信息，技術產生的社會價值增量，對比耗能所產生的單位價值，要遠遠高于其他行業。

舉個例子，用1億度電煉鋼，和用1億度電用于人工智能的投入，單位能耗下的社會價值貢獻，人工智能顯然更高，對整個社會全鏈條產業鏈的進化貢獻也更大。而這只是表面現象，更重要的是，未來的碳中和技術的突破，恰恰要依靠AI，例如做碳捕集、碳封存，所有突破性技術都離不開大模型的加持。熊焰描繪道，未來生產生活將大量用虛擬世界的活動來解決真實世界的問題，以此來大規模降低真實世界的成本。“以前真刀真槍真物質的‘濕實驗’，今后可能只占10%，90%都是‘干實驗’，即在計算機上模擬。”

采訪臨近結束，記者問了熊焰一個“終極問題”：大部分工作大模型都干了，那人類創造力的最后防線在哪兒？

熊焰沉默了幾秒說：“有些終極問題，想不明白就先放放，后人總比我們聰明。”他說，他屬于理性樂觀派，并不認為人類開發出的大模型，最后會反噬人類，只要善良正義的人占絕大多數，占有主導的力量，就不會出現被恐怖主義組織利用，AI反過來統治人類的情況。熊焰說，宇宙中充斥的絕大多數暗物質，人類還沒有發現，對于許多規律的探索，如暗物質的發現等，還有需要人類來研究，“相較于無限的宇宙，人類、包括AI，還只是毛毛蟲，太渺小了。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.