人工智能的方向走對了嗎？

2026-02-13 13:22:45　來源: 科學(xué)畫報(bào)

上海舉報(bào)

分享至

隨著人工智能的飛速發(fā)展，各種大模型的能力獲得了極大的提升，應(yīng)用日益廣泛。但是，從自然演化的角度來看，人工智能的方向走對了嗎？

文|張軍平

復(fù)旦大學(xué)計(jì)算與智能創(chuàng)新學(xué)院教授、博士生導(dǎo)師，中國自動化學(xué)會普及工作委員會主任，《科學(xué)畫報(bào)》編委會人工智能專委會委員。研究方向包括人工智能、圖像處理、生物認(rèn)證、智能交通等。連續(xù)5年（2021—2025年）入選全球前2%頂尖科學(xué)家榜單和終身科學(xué)影響力排行榜。

2023年年初，美國人工智能研究公司OpenAI的chatGPT快速出圈，隨后引發(fā)了人工智能模型的“百團(tuán)大戰(zhàn)”。

兩三年過去了，人工智能領(lǐng)域出現(xiàn)了大量新的突破。例如，OpenAI的新一代視頻生成模型Sora-2的短視頻制作水平提升，谷歌公司推出包括大語言模型Gemini-3、人工智能筆記本電腦NotebookLM和圖像編輯模型Nano Banana Pro的人工智能套餐。2025年12月，Meta公司宣布收購智能體公司Manus，引發(fā)爭議。這些都意味著人工智能又向前邁進(jìn)了一個(gè)臺階。

但是，我們還是需要思考一下：人工智能的方向是否走對了？

01.

大模型的能力

關(guān)于這個(gè)疑問，我與我的研究生孫睿進(jìn)行了一段有趣的討論。我們先討論了Transformer模型架構(gòu)到底能不能像人一樣做長思考。孫睿說，Transformer這樣的架構(gòu)已經(jīng)可以對足夠長的Token（字符或字符序列，是大型語言模型的輸入輸出基本單位）進(jìn)行回溯和關(guān)聯(lián)，如25萬字的長篇小說。因此，大模型可以擁有比人更強(qiáng)的長思考能力。

我的觀點(diǎn)是這種能力需要付出代價(jià)。因?yàn)樗枰罅康臄?shù)據(jù)來學(xué)習(xí)和訓(xùn)練，模型的參數(shù)調(diào)整又需要好的并行能力，所以現(xiàn)在的大模型方案基本上都是高耗能的。

這在自然界幾乎是不可想象的。試想：在一個(gè)能源需要自給的自然環(huán)境中，高耗能的動物有沒有可能生存下來？自然界能生存下來的動物往往都是比較節(jié)能的，像七星瓢蟲，也許幾只蚜蟲的能量就能夠支撐它飛一天。這可能是自然界長期隨機(jī)演化的結(jié)果。雖然這種演化不一定時(shí)時(shí)刻刻都朝著最優(yōu)的方向，有的時(shí)候還會倒退，但總體來看，它獲得了一種平衡。

如果用人工智能對大模型的調(diào)參來比擬，這種平衡是自然界通過上億年的調(diào)參獲得的。只不過，它在結(jié)構(gòu)上與目前人工智能的做法可能是完全不同的。

大模型是建立在巨量參數(shù)基礎(chǔ)上的，但受限于人類所能提供的算力影響，輸入的特征卻不多。例如，面向圖像的深度網(wǎng)絡(luò)的輸入特征一般是256像素×256像素、1024像素×1024像素等，而特征層則會將需要學(xué)習(xí)的參數(shù)變得異常巨大。類似的，受自然語言處理和注意力啟發(fā)的Transformer、大語言模型也是如此，中間層的參數(shù)非常大。從某種角度來看，這兩種網(wǎng)絡(luò)更多地關(guān)注對“抽象層”的統(tǒng)計(jì)特征學(xué)習(xí)。要學(xué)習(xí)好這些參數(shù)，巨量數(shù)據(jù)是必不可少的。為了獲得高計(jì)算效率，我們不得不依賴顯卡或圖像處理器（GPU）集群來加速。

與之相反，人類或其他生命的輸入層要復(fù)雜得多，有著極其豐富的傳感器。這也導(dǎo)致了一個(gè)無法攻克的莫拉維克悖論的出現(xiàn)：人類覺得簡單的，機(jī)器覺得復(fù)雜；人類覺得復(fù)雜的，機(jī)器覺得簡單。機(jī)器所認(rèn)為的復(fù)雜主要表現(xiàn)在學(xué)習(xí)上，一旦學(xué)習(xí)可以程序化、流程化、規(guī)范化，機(jī)器必然會覺得簡單。這一點(diǎn)在圍棋上已經(jīng)得到印證，所有與學(xué)習(xí)相關(guān)的任務(wù)也逐漸驗(yàn)證了人工智能的強(qiáng)大。

人類覺得簡單的，卻是自然演化出來的豐富傳感器導(dǎo)致的。這些傳感器的設(shè)計(jì)大多數(shù)遠(yuǎn)比人類設(shè)計(jì)得要精妙且難以模仿。例如，蚊子的刺吸式口器、蝎子的尾刺，相較于人類的注射針頭要復(fù)雜得多。與學(xué)習(xí)相比，這些傳感器可能會導(dǎo)致與身體技能相關(guān)的一些工作很難被人工智能取代。

02.

自然界與人工智能

由此推開來，我和孫睿同學(xué)似乎有了一個(gè)更有意思的觀點(diǎn)：如果把自然界的演化看成是一種神經(jīng)網(wǎng)絡(luò)或深度網(wǎng)絡(luò)，那這個(gè)網(wǎng)絡(luò)的輸入層會是巨量的參數(shù)，如10的22次方或更高數(shù)量級的，而網(wǎng)絡(luò)也許很淺，模型的優(yōu)化也并不一定聰明，甚至還會有極強(qiáng)的隨機(jī)性摻雜其中。

但是，和人類相比，自然界的優(yōu)化最不缺乏的不是能源，而是時(shí)間。它可以用上億年來優(yōu)化這個(gè)模型。相反，單個(gè)人類能夠貢獻(xiàn)出來的工作或投身人工智能研究的時(shí)間就少得可憐，只有自然界認(rèn)為可以忽略不計(jì)的一瞬間。

因此，我們不得不退而求其次，只針對智能的某一個(gè)方面來窮極一生進(jìn)行優(yōu)化。現(xiàn)在能找到的并能獲得成就感的優(yōu)化點(diǎn)都是與預(yù)測相關(guān)的，或任何能轉(zhuǎn)成預(yù)測問題的，如人臉識別、大語言模型等。為了能讓它們的性能變好，人類會通過消耗大量的能源來換取時(shí)間上的加速。

事實(shí)上，這種用能源換時(shí)間的做法不僅在人工智能方面是如此，在氣候變化方面，人類也有類似的行為。例如，自汽車發(fā)明以來，人類短時(shí)間內(nèi)消耗的能源總和可能相當(dāng)于自然界千萬年的積累，于是它不可避免地影響了全球氣候。

也許，從自然界的角度來看，人類就是一種極其貪婪的動物，即使現(xiàn)在有了人工智能的加持和賦能。從短期來看，人類通過這種做法可以獲得巨大的收益。但是，如果放到自然界的時(shí)間尺度來看，人類的這種加速就不一定是對的，甚至目前人工智能的做法也不一定是對的。

*本文刊登于《科學(xué)畫報(bào)》2026年第3期人工智能專欄，更多相關(guān)內(nèi)容歡迎訂閱。

全年訂閱

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.