![]()
隨著人工智能的飛速發(fā)展,各種大模型的能力獲得了極大的提升,應(yīng)用日益廣泛。但是,從自然演化的角度來看,人工智能的方向走對了嗎?
文|張軍平
復(fù)旦大學(xué)計(jì)算與智能創(chuàng)新學(xué)院教授、博士生導(dǎo)師,中國自動化學(xué)會普及工作委員會主任,《科學(xué)畫報(bào)》編委會人工智能專委會委員。研究方向包括人工智能、圖像處理、生物認(rèn)證、智能交通等。連續(xù)5年(2021—2025年)入選全球前2%頂尖科學(xué)家榜單和終身科學(xué)影響力排行榜。
2023年年初,美國人工智能研究公司OpenAI的chatGPT快速出圈,隨后引發(fā)了人工智能模型的“百團(tuán)大戰(zhàn)”。
兩三年過去了,人工智能領(lǐng)域出現(xiàn)了大量新的突破。例如,OpenAI的新一代視頻生成模型Sora-2的短視頻制作水平提升,谷歌公司推出包括大語言模型Gemini-3、人工智能筆記本電腦NotebookLM和圖像編輯模型Nano Banana Pro的人工智能套餐。2025年12月,Meta公司宣布收購智能體公司Manus,引發(fā)爭議。這些都意味著人工智能又向前邁進(jìn)了一個(gè)臺階。
但是,我們還是需要思考一下:人工智能的方向是否走對了?
01.
大模型的能力
關(guān)于這個(gè)疑問,我與我的研究生孫睿進(jìn)行了一段有趣的討論。我們先討論了Transformer模型架構(gòu)到底能不能像人一樣做長思考。孫睿說,Transformer這樣的架構(gòu)已經(jīng)可以對足夠長的Token(字符或字符序列,是大型語言模型的輸入輸出基本單位)進(jìn)行回溯和關(guān)聯(lián),如25萬字的長篇小說。因此,大模型可以擁有比人更強(qiáng)的長思考能力。
我的觀點(diǎn)是這種能力需要付出代價(jià)。因?yàn)樗枰罅康臄?shù)據(jù)來學(xué)習(xí)和訓(xùn)練,模型的參數(shù)調(diào)整又需要好的并行能力,所以現(xiàn)在的大模型方案基本上都是高耗能的。
這在自然界幾乎是不可想象的。試想:在一個(gè)能源需要自給的自然環(huán)境中,高耗能的動物有沒有可能生存下來?自然界能生存下來的動物往往都是比較節(jié)能的,像七星瓢蟲,也許幾只蚜蟲的能量就能夠支撐它飛一天。這可能是自然界長期隨機(jī)演化的結(jié)果。雖然這種演化不一定時(shí)時(shí)刻刻都朝著最優(yōu)的方向,有的時(shí)候還會倒退,但總體來看,它獲得了一種平衡。
如果用人工智能對大模型的調(diào)參來比擬,這種平衡是自然界通過上億年的調(diào)參獲得的。只不過,它在結(jié)構(gòu)上與目前人工智能的做法可能是完全不同的。
大模型是建立在巨量參數(shù)基礎(chǔ)上的,但受限于人類所能提供的算力影響,輸入的特征卻不多。例如,面向圖像的深度網(wǎng)絡(luò)的輸入特征一般是256像素×256像素、1024像素×1024像素等,而特征層則會將需要學(xué)習(xí)的參數(shù)變得異常巨大。類似的,受自然語言處理和注意力啟發(fā)的Transformer、大語言模型也是如此,中間層的參數(shù)非常大。從某種角度來看,這兩種網(wǎng)絡(luò)更多地關(guān)注對“抽象層”的統(tǒng)計(jì)特征學(xué)習(xí)。要學(xué)習(xí)好這些參數(shù),巨量數(shù)據(jù)是必不可少的。為了獲得高計(jì)算效率,我們不得不依賴顯卡或圖像處理器(GPU)集群來加速。
與之相反,人類或其他生命的輸入層要復(fù)雜得多,有著極其豐富的傳感器。這也導(dǎo)致了一個(gè)無法攻克的莫拉維克悖論的出現(xiàn):人類覺得簡單的,機(jī)器覺得復(fù)雜;人類覺得復(fù)雜的,機(jī)器覺得簡單。機(jī)器所認(rèn)為的復(fù)雜主要表現(xiàn)在學(xué)習(xí)上,一旦學(xué)習(xí)可以程序化、流程化、規(guī)范化,機(jī)器必然會覺得簡單。這一點(diǎn)在圍棋上已經(jīng)得到印證,所有與學(xué)習(xí)相關(guān)的任務(wù)也逐漸驗(yàn)證了人工智能的強(qiáng)大。
人類覺得簡單的,卻是自然演化出來的豐富傳感器導(dǎo)致的。這些傳感器的設(shè)計(jì)大多數(shù)遠(yuǎn)比人類設(shè)計(jì)得要精妙且難以模仿。例如,蚊子的刺吸式口器、蝎子的尾刺,相較于人類的注射針頭要復(fù)雜得多。與學(xué)習(xí)相比,這些傳感器可能會導(dǎo)致與身體技能相關(guān)的一些工作很難被人工智能取代。
02.
自然界與人工智能
由此推開來,我和孫睿同學(xué)似乎有了一個(gè)更有意思的觀點(diǎn):如果把自然界的演化看成是一種神經(jīng)網(wǎng)絡(luò)或深度網(wǎng)絡(luò),那這個(gè)網(wǎng)絡(luò)的輸入層會是巨量的參數(shù),如10的22次方或更高數(shù)量級的,而網(wǎng)絡(luò)也許很淺,模型的優(yōu)化也并不一定聰明,甚至還會有極強(qiáng)的隨機(jī)性摻雜其中。
但是,和人類相比,自然界的優(yōu)化最不缺乏的不是能源,而是時(shí)間。它可以用上億年來優(yōu)化這個(gè)模型。相反,單個(gè)人類能夠貢獻(xiàn)出來的工作或投身人工智能研究的時(shí)間就少得可憐,只有自然界認(rèn)為可以忽略不計(jì)的一瞬間。
因此,我們不得不退而求其次,只針對智能的某一個(gè)方面來窮極一生進(jìn)行優(yōu)化。現(xiàn)在能找到的并能獲得成就感的優(yōu)化點(diǎn)都是與預(yù)測相關(guān)的,或任何能轉(zhuǎn)成預(yù)測問題的,如人臉識別、大語言模型等。為了能讓它們的性能變好,人類會通過消耗大量的能源來換取時(shí)間上的加速。
事實(shí)上,這種用能源換時(shí)間的做法不僅在人工智能方面是如此,在氣候變化方面,人類也有類似的行為。例如,自汽車發(fā)明以來,人類短時(shí)間內(nèi)消耗的能源總和可能相當(dāng)于自然界千萬年的積累,于是它不可避免地影響了全球氣候。
也許,從自然界的角度來看,人類就是一種極其貪婪的動物,即使現(xiàn)在有了人工智能的加持和賦能。從短期來看,人類通過這種做法可以獲得巨大的收益。但是,如果放到自然界的時(shí)間尺度來看,人類的這種加速就不一定是對的,甚至目前人工智能的做法也不一定是對的。
*本文刊登于《科學(xué)畫報(bào)》2026年第3期人工智能專欄,更多相關(guān)內(nèi)容歡迎訂閱。
全年訂閱
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.