前幾天在群里看到一句話:人活著就是為了預(yù)測(cè)未來。 這話乍一聽有道理,但老馮的看法正好相反。預(yù)測(cè)從來不是目的,活著才是。準(zhǔn)確的說法應(yīng)該是:人是通過預(yù)測(cè)未來來活著的。
![]()
這不是什么心靈雞湯,而是一個(gè)嚴(yán)肅的科學(xué)理論——自由能原理(Free Energy Principle),由神經(jīng)科學(xué)家 Karl Friston 提出。 這個(gè)理論野心極大:它試圖用一個(gè)統(tǒng)一的數(shù)學(xué)框架,解釋感知、學(xué)習(xí)、決策、行動(dòng)、情緒、意識(shí)……乃至智能本身。
正好今天另一位朋友也寫了篇文章來剖析 “智能”,讓老馮想到了這個(gè)理論。 所以今天就來聊聊最小自由能原理,它對(duì)理解 AI、理解 Agent、理解我們正在構(gòu)建的整個(gè)智能系統(tǒng)生態(tài),都有非常深刻的指導(dǎo)意義。
一、它說了什么 你為什么沒死?
這不是罵人,這是一個(gè)嚴(yán)肅的物理學(xué)問題。
熱力學(xué)第二定律告訴我們:封閉系統(tǒng)的熵只會(huì)增加,一切趨向無序。一杯熱水會(huì)變涼,一棟房子沒人打理會(huì)坍塌,一個(gè)系統(tǒng)如果不做任何事情,最終走向熱寂。
但你,一個(gè)由幾十萬億個(gè)細(xì)胞組成的精密系統(tǒng),在幾十年的時(shí)間里維持著極其穩(wěn)定的有序結(jié)構(gòu)。體溫 37°C,血糖濃度在窄帶里波動(dòng),心跳、呼吸、激素分泌井然有序。你是一個(gè)遠(yuǎn)離熱力學(xué)平衡的耗散結(jié)構(gòu),你的存在本身就是一個(gè)需要解釋的現(xiàn)象。
那問題來了:什么樣的系統(tǒng)能在熱力學(xué)上持續(xù)存在而不解體?
Friston 的回答是:這個(gè)系統(tǒng)必須擁有一個(gè)關(guān)于外部世界的內(nèi)部模型,并且持續(xù)地最小化自身的變分自由能。
什么是自由能?
先不上公式(形式化定義放在最后面),用人話來解釋自由能這個(gè)概念。
想象你走在一條熟悉的路上,突然前方竄出一個(gè)黑影。你嚇了一跳,這就是"驚訝"(surprise)。然后你定睛一看,是一只貓。你的大腦迅速把"未知黑影"更新為"一只貓",驚訝消失了,你繼續(xù)走路。
這個(gè)過程就是自由能最小化的一個(gè)微縮版。
自由能衡量的是"你以為的世界"和"世界實(shí)際給你的信號(hào)"之間的不匹配程度。自由能高,說明你不斷被打臉,世界一直在給你驚訝;自由能低,說明你對(duì)世界的理解很到位,預(yù)期和現(xiàn)實(shí)高度吻合。
而 Friston 的核心論點(diǎn)是:任何一個(gè)能長期存在的自組織系統(tǒng),其行為在數(shù)學(xué)上必然等價(jià)于在最小化自由能。 這不是一個(gè)可選的策略,不是進(jìn)化"選擇"了這條路,而是一個(gè)數(shù)學(xué)必然。如果你還存在著,你就一定在做這件事,否則你早就解體了。
一條魚必須待在水里,人的體溫必須穩(wěn)定在 37°C 左右。偏離這些狀態(tài)就意味著解體和死亡。用自由能的語言來說:生命體必須把自己維持在一個(gè)"低驚訝"的狀態(tài)空間里。
最小化自由能的兩條路
要降低自由能,你有且只有兩個(gè)方向可以走。
第一條路:更新信念,感知與學(xué)習(xí)
世界給了你一個(gè)意外,你修改自己的內(nèi)部模型去適應(yīng)它。"哦,原來那個(gè)黑影是一只貓。" 你更新了信念,驚訝消失了。
短時(shí)間尺度上,這叫感知;長時(shí)間尺度上,這叫學(xué)習(xí)。不只是更新一個(gè)判斷,而是更新你對(duì)整個(gè)世界運(yùn)作方式的理解。
第二條路:改變世界,行動(dòng)與控制
你不改變信念,而是改變世界。你預(yù)期自己應(yīng)該是吃飽的,但當(dāng)前是餓的,這產(chǎn)生了高自由能。于是你去找飯吃,通過行動(dòng)讓現(xiàn)實(shí)變成你預(yù)期的樣子。Friston 管這叫主動(dòng)推斷(Active Inference)。
這兩條路合在一起,就統(tǒng)一了感知和行動(dòng)。傳統(tǒng)的認(rèn)知科學(xué)把感知和運(yùn)動(dòng)控制當(dāng)成兩套獨(dú)立系統(tǒng)來研究,但自由能原理說:它們是同一個(gè)優(yōu)化問題的兩種解法。你的大腦不區(qū)分"理解世界"和"改變世界",它只是在持續(xù)地最小化自由能。
一句話總結(jié):生命是一個(gè)通過不斷預(yù)測(cè)并消減意外來維持自身存在的過程。 預(yù)測(cè)是手段,消減驚訝是機(jī)制,活著是結(jié)果。
預(yù)測(cè)編碼:大腦的具體實(shí)現(xiàn)
自由能原理是抽象原理,預(yù)測(cè)編碼(Predictive Coding)是它在大腦中的具體實(shí)現(xiàn)方式。
大腦皮層是一個(gè)層級(jí)結(jié)構(gòu)。每一層都在做同樣的事:高層向低層發(fā)送預(yù)測(cè)信號(hào)。"我認(rèn)為你接下來應(yīng)該看到這個(gè)。" 低層拿實(shí)際感官輸入和預(yù)測(cè)做比較,計(jì)算出預(yù)測(cè)誤差;誤差往上傳,驅(qū)動(dòng)高層更新信念;更新后的信念產(chǎn)生新的預(yù)測(cè),再向下傳。循環(huán)往復(fù),永不停止。
這個(gè)架構(gòu)有一個(gè)非常優(yōu)雅的性質(zhì):信息傳遞是高度壓縮的。只有預(yù)測(cè)誤差(意外的部分)需要往上傳,符合預(yù)期的部分被"解釋掉"了。大腦不是在傳輸原始數(shù)據(jù),而是在傳輸"新聞",只有出乎意料的才值得傳。
所以你的大腦不是一個(gè)被動(dòng)的接收器,而是一臺(tái)主動(dòng)的預(yù)測(cè)生成器。你看到的、聽到的、感受到的,大部分是大腦自己"腦補(bǔ)"出來的,感官輸入只是用來糾錯(cuò)的。
二、它能解釋什么
一個(gè)好理論的標(biāo)志是:它能用一套機(jī)制解釋大量看似不相關(guān)的現(xiàn)象。自由能原理在這方面非常強(qiáng)大。
解釋感知:你的世界是大腦的一場(chǎng)可控幻覺
既然大腦在不斷"腦補(bǔ)",感官只是負(fù)責(zé)糾錯(cuò),那很多知覺現(xiàn)象就說得通了:
雞尾酒會(huì)效應(yīng) —— 在嘈雜環(huán)境中你依然能聽清朋友說話。因?yàn)榇竽X用語境在不斷預(yù)測(cè)下一個(gè)詞,只需要從聲波里提取少量誤差信號(hào)來修正就夠了。大腦替你"腦補(bǔ)"了 80% 的內(nèi)容。
視覺錯(cuò)覺 —— 你的大腦過度依賴了先驗(yàn)預(yù)測(cè),把"腦補(bǔ)"當(dāng)成了現(xiàn)實(shí)。模型太強(qiáng)勢(shì),感官輸入被壓制了。
![]()
變化盲視 —— 一張照片里換掉一個(gè)大物件你可能根本注意不到。因?yàn)槟愕念A(yù)測(cè)沒有覆蓋到那個(gè)區(qū)域,沒有預(yù)測(cè)自然不會(huì)有預(yù)測(cè)誤差,沒有誤差信號(hào)就等于"什么都沒發(fā)生"。
恐怖谷效應(yīng) —— 高仿真機(jī)器人看著比卡通機(jī)器人更讓人不安。因?yàn)樗咏?人類"的預(yù)測(cè)模板了,但又有微小的偏差,在你的預(yù)測(cè)系統(tǒng)里引發(fā)了強(qiáng)烈的、難以被消減的誤差信號(hào)。
![]()
解釋情緒:你的儀表盤在報(bào)什么數(shù)
在自由能框架下,情緒不是什么附加模塊,而是預(yù)測(cè)系統(tǒng)的內(nèi)置儀表盤。它告訴你當(dāng)前自由能的狀況。
焦慮 —— 模型預(yù)測(cè)到了前方有大量不確定性:"我不知道會(huì)發(fā)生什么,但我覺得不會(huì)好。" 這是高期望自由能的警報(bào)。
好奇心 —— 模型發(fā)現(xiàn)了一塊"可以被消除的不確定性":"這個(gè)東西我不懂,但我覺得我能搞懂。" 這是認(rèn)知價(jià)值在驅(qū)動(dòng)你。
愉悅 —— 預(yù)測(cè)誤差被成功消減:"我猜對(duì)了",或者"事情按預(yù)期發(fā)展了"。
無聊 —— 預(yù)測(cè)誤差長時(shí)間接近于零。沒什么新東西可學(xué),模型沒有在進(jìn)步。
驚喜 —— 一個(gè)正向的預(yù)測(cè)誤差:世界比你預(yù)期的更好。
這個(gè)框架甚至可以解釋為什么好的音樂讓人愉悅。音樂在不斷建立預(yù)期,然后在恰到好處的時(shí)候打破預(yù)期,制造一個(gè)可控的驚訝。完全符合預(yù)期的音樂令人無聊,完全出乎預(yù)期的噪音令人不適。最好的音樂在預(yù)測(cè)和驚訝之間精確起舞,持續(xù)地給你的預(yù)測(cè)系統(tǒng)喂恰到好處的誤差信號(hào)。
解釋好奇心與探索:為什么你不會(huì)躲在黑屋子里
這是自由能原理最精彩的推論。
如果一個(gè)系統(tǒng)只是在最小化當(dāng)下的驚訝,那最優(yōu)策略顯然是找個(gè)黑屋子躲起來不動(dòng),那里永遠(yuǎn)不會(huì)有意外。但生物不是這樣的。生物會(huì)探索、會(huì)冒險(xiǎn)、會(huì)好奇。為什么?
因?yàn)樽杂赡茏钚』恢豢串?dāng)下,還看期望的未來。
你主動(dòng)探索一個(gè)未知環(huán)境,短期內(nèi)驚訝確實(shí)增加了,但你的模型因此變得更準(zhǔn)確了,意味著你未來所有時(shí)刻的期望自由能都降低了。這在信息論上叫做信息增益(Information Gain)。
好奇心、探索、科學(xué)研究,甚至小孩子不知疲倦的玩耍,這些行為看起來像是在"自找麻煩",但在自由能框架下完全合理:它們?cè)谧鲩L期自由能最小化,用短期的驚訝換取長期的確定性。
這也解釋了為什么學(xué)習(xí)新東西的過程是痛苦的(短期自由能飆升),但學(xué)會(huì)之后是愉悅的(模型升級(jí)了,長期自由能大幅下降)。
一個(gè)智能系統(tǒng)的核心標(biāo)志:愿意為了長期的模型精度而承受短期的驚訝。
解釋心理病理:預(yù)測(cè)系統(tǒng)出了 bug
這個(gè)框架對(duì)精神疾病也有很強(qiáng)的解釋力。它把不同的心理疾病解釋為預(yù)測(cè)系統(tǒng)中不同參數(shù)的失調(diào)。
自閉癥譜系 —— 先驗(yàn)(預(yù)測(cè))的權(quán)重過低,預(yù)測(cè)誤差的權(quán)重過高。不是不能感知,而是感知到了太多。每個(gè)細(xì)節(jié)都是"新聞",大腦被預(yù)測(cè)誤差信號(hào)淹沒,無法形成穩(wěn)定的高層預(yù)測(cè)。這就解釋了感官過載、對(duì)變化的極端敏感、以及對(duì)重復(fù)性和規(guī)律性的強(qiáng)烈偏好,因?yàn)橹挥性诟叨瓤深A(yù)測(cè)的環(huán)境里,預(yù)測(cè)誤差才不會(huì)淹沒系統(tǒng)。
精神分裂癥(部分癥狀) —— 先驗(yàn)權(quán)重過高,預(yù)測(cè)誤差被忽略。大腦過度相信自己的內(nèi)部模型,感官輸入的糾錯(cuò)信號(hào)傳不上去,模型開始"自嗨",產(chǎn)生幻覺和妄想。
抑郁癥 —— 生成模型被悲觀信念鎖死:"一切都不會(huì)好的。" 這個(gè)先驗(yàn)太強(qiáng)了,即使正面的感官輸入進(jìn)來,也會(huì)被高權(quán)重的悲觀預(yù)測(cè)壓掉。負(fù)面預(yù)測(cè)變成了自我實(shí)現(xiàn)的預(yù)言。
上癮 —— 短期自由能最小化劫持了長期最小化。物質(zhì)或行為提供了一條極其可靠的短期驚訝消減路徑,以至于系統(tǒng)放棄了更健康的長期策略。
這不只是用新術(shù)語包裝舊常識(shí)。它為臨床現(xiàn)象提供了一個(gè)可計(jì)算、可建模的理論框架。你可以在模型的參數(shù)空間里精確地刻畫"哪里出了問題",這就打開了精確干預(yù)的可能性。
三、它能指導(dǎo)什么
一個(gè)理論如果只能解釋已知現(xiàn)象,那它只是事后諸葛亮。自由能原理真正厲害的地方,是它的指導(dǎo)性。它直接告訴你,智能是什么,以及要在哪些維度上提升。
![]()
智能的四個(gè)維度
在自由能框架下,智能不是一種特殊的、神秘的能力,而是自由能最小化做得特別好時(shí)涌現(xiàn)出來的性質(zhì)。一個(gè)系統(tǒng)越"智能",它在以下四個(gè)維度上就做得越好:
① 時(shí)間深度:你的預(yù)測(cè)能看多遠(yuǎn)
一個(gè)恒溫器只看當(dāng)下,溫度偏了就開暖氣。一只老鼠能為冬天儲(chǔ)糧,它在為幾個(gè)月后做準(zhǔn)備。一個(gè)人能為二十年后的退休攢錢,能為百年后的氣候變化制定政策。
生成模型覆蓋的時(shí)間跨度越長,系統(tǒng)就越能消減遠(yuǎn)期的不確定性,系統(tǒng)就越智能。
② 抽象深度:你的模型有多壓縮
一只青蛙的視覺系統(tǒng)只有"小黑點(diǎn)在動(dòng) → 吐舌頭"這一層。人類的認(rèn)知系統(tǒng)從像素到邊緣到物體到場(chǎng)景到敘事到因果理論到數(shù)學(xué)公理,層層抽象,每一層都在壓縮下一層的預(yù)測(cè)誤差,抽取更高階的規(guī)律。
牛頓用 (F=ma) 和一個(gè)萬有引力公式,消減了關(guān)于所有宏觀物體運(yùn)動(dòng)的海量不確定性。這是極致的模型壓縮。科學(xué)本身就是人類文明級(jí)別的自由能最小化,用最簡的模型解釋最多的現(xiàn)象。
而自由能公式里天然包含了對(duì)模型復(fù)雜度的懲罰,這就是奧卡姆剃刀的數(shù)學(xué)形式。最小化自由能的系統(tǒng),自然傾向于用最簡的模型解釋數(shù)據(jù)。
③ 主動(dòng)探索:你有多愿意承受短期驚訝
前面說過了,一個(gè)只優(yōu)化當(dāng)下的系統(tǒng)會(huì)躲起來。真正智能的系統(tǒng)會(huì)主動(dòng)出擊,承受短期驚訝以換取長期的模型精度。
好奇心不是智能的副產(chǎn)品,而是智能的核心驅(qū)動(dòng)力。一個(gè)不好奇的系統(tǒng),就是一個(gè)放棄了長期自由能最小化的系統(tǒng)。
④ 模型切換:你能不能換一套理解方式
最高階的智能不是在一個(gè)固定模型里調(diào)參數(shù),而是能識(shí)別出"當(dāng)前模型不夠用了",然后創(chuàng)造或切換到一個(gè)全新的模型。
當(dāng)牛頓力學(xué)解釋不了水星近日點(diǎn)進(jìn)動(dòng)時(shí),愛因斯坦沒有在舊框架里硬調(diào),而是創(chuàng)建了廣義相對(duì)論。這種能力對(duì)應(yīng)的就是在模型空間上的搜索和跳躍,"頓悟"和"范式轉(zhuǎn)換"的數(shù)學(xué)本質(zhì)。
大多數(shù)時(shí)候,你在一個(gè)模型內(nèi)部做推斷。偶爾,你需要跳出模型本身。后者才是真正稀缺的智能。
對(duì) AI 的指導(dǎo)
這套理論對(duì)理解和構(gòu)建 AI 系統(tǒng)有直接的指導(dǎo)意義。
大語言模型在做什么? 預(yù)測(cè)下一個(gè) token。訓(xùn)練過程最小化的是交叉熵,而交叉熵就是驚訝度的期望值。所以 LLM 的訓(xùn)練在數(shù)學(xué)上等價(jià)于自由能最小化的第一條路,更新內(nèi)部模型。這也解釋了為什么 LLM 能涌現(xiàn)出某種"理解力":它在壓縮預(yù)測(cè)誤差的過程中,不得不學(xué)會(huì)語言背后的世界模型。
LLM 缺什么? 兩個(gè)關(guān)鍵缺口。第一,沒有第二條路,主動(dòng)推斷。它不能采取行動(dòng)去改變世界,只是一個(gè)被動(dòng)的預(yù)測(cè)器。第二,沒有持續(xù)的自由能最小化循環(huán)。每一次推理都是一個(gè)無狀態(tài)的函數(shù)調(diào)用,不是一個(gè)在時(shí)間中持續(xù)存在、需要維持自身的系統(tǒng)。
Agent 補(bǔ)的是什么? 第二條路。一個(gè) Agent 有了感知(獲取信息)、有了行動(dòng)(調(diào)用工具、改變環(huán)境)、有了持久狀態(tài)(記憶),它就從一個(gè)"被動(dòng)預(yù)測(cè)器"變成了一個(gè)"主動(dòng)推斷系統(tǒng)"。這在自由能框架下是一個(gè)本質(zhì)的躍遷,從半個(gè)閉環(huán)變成了完整閉環(huán)。
什么才是真正的通用智能? 四個(gè)維度全拉滿:能做長時(shí)間尺度的預(yù)測(cè)(時(shí)間深度),能形成高度抽象的模型(抽象深度),能主動(dòng)探索未知(好奇心),能在模型不夠用時(shí)跳出來換一套(創(chuàng)造力)。目前的 AI 系統(tǒng)在每個(gè)維度上都有明顯的天花板,認(rèn)清這些天花板在哪里,本身就是很有價(jià)值的。
對(duì)個(gè)人認(rèn)知的指導(dǎo)
這套理論不只是學(xué)術(shù)話題,它對(duì)日常的自我管理也有非常實(shí)用的指導(dǎo)。
學(xué)習(xí)的本質(zhì)是什么? 更新你的生成模型。當(dāng)你覺得"學(xué)不進(jìn)去"的時(shí)候,本質(zhì)上是預(yù)測(cè)誤差超出了你的處理能力。要么誤差太大(材料太難,你完全預(yù)測(cè)不了),要么誤差太小(太簡單,沒有新信息)。最高效的學(xué)習(xí)發(fā)生在預(yù)測(cè)誤差存在但可控的區(qū)間,這就是心理學(xué)里說的"最近發(fā)展區(qū)",也是"心流"狀態(tài)的本質(zhì)。
焦慮怎么處理? 兩條路:要么提升你模型的精度(多學(xué)、多了解,降低不確定性),要么改變環(huán)境(主動(dòng)行動(dòng),消除焦慮的來源)。無效的方式是什么?既不更新模型也不采取行動(dòng),而是反復(fù)在同一個(gè)不完善的模型里做推斷,這就是"overthinking",即內(nèi)耗。
為什么"走出舒適區(qū)"有效? 因?yàn)榇谑孢m區(qū)等于待在"黑屋子"里。預(yù)測(cè)誤差為零,模型不再更新。但世界在變,你的模型沒跟上,長期自由能其實(shí)在悄悄積累。主動(dòng)走出去,短期自由能飆升,但模型升級(jí)了,長期收益巨大。
附錄:自由能的形式化定義
前面我們一直用直覺來理解自由能。如果你對(duì)數(shù)學(xué)感興趣,這里給出嚴(yán)格定義。不感興趣可以跳過,不影響對(duì)全文的理解。
變分自由能的定義:
![]()
第一項(xiàng)衡量模型解釋數(shù)據(jù)的能力,第二項(xiàng)衡量信念偏離先驗(yàn)的程度。最小化自由能 = 在準(zhǔn)確度和簡潔性之間取最優(yōu)平衡。這就是奧卡姆剃刀的數(shù)學(xué)形式。
熟悉機(jī)器學(xué)習(xí)的讀者應(yīng)該已經(jīng)認(rèn)出來了:這和變分推斷中的 ELBO(Evidence Lower Bound)完全等價(jià),取個(gè)負(fù)號(hào)就是自由能。VAE、變分貝葉斯、EM 算法,底層都是這套數(shù)學(xué)。Friston 的洞見在于:這不只是一個(gè)計(jì)算技巧,而是生命本身的運(yùn)作原理。
尾聲
回到開頭那句話:"人活著就是為了預(yù)測(cè)未來。"
改一個(gè)字就對(duì)了,人活著不是"為了"預(yù)測(cè)未來,而是"通過"預(yù)測(cè)未來來活著。
把它再推廣一步:
生命是一個(gè)通過不斷預(yù)測(cè)并消減意外來維持自身存在的過程。 智能是這個(gè)過程在時(shí)間深度、抽象深度、探索主動(dòng)性和模型靈活性上的延伸。
這不是一個(gè)比喻。這是一個(gè)有數(shù)學(xué)基礎(chǔ)、有神經(jīng)科學(xué)證據(jù)、有工程映射的統(tǒng)一理論。它用一個(gè)原理,最小化自由能,把生命、智能、感知、行動(dòng)、情緒、好奇心、學(xué)習(xí)、創(chuàng)造力,全部串聯(lián)在了一起。
當(dāng)你真正理解了這個(gè)框架,你會(huì)發(fā)現(xiàn):我們正在構(gòu)建的這些 AI 系統(tǒng),不是在"發(fā)明"智能,而是在用另一種介質(zhì),重新實(shí)現(xiàn)生命已經(jīng)運(yùn)行了幾十億年的那套算法。
只不過這次,載體從碳基換成了硅基。
![]()
數(shù)據(jù)庫老司機(jī)
點(diǎn)一個(gè)關(guān)注 ??,精彩不迷路
對(duì) PostgreSQL, Pigsty,下云 感興趣的朋友
歡迎加入 PGSQL x Pigsty 交流群 QQ 619377403
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.