網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

智能的本質(zhì)：最小自由能原理

2026-03-28 14:55:32　來源: 老馮云數(shù)

北京舉報(bào)

分享至

前幾天在群里看到一句話：人活著就是為了預(yù)測(cè)未來。這話乍一聽有道理，但老馮的看法正好相反。預(yù)測(cè)從來不是目的，活著才是。準(zhǔn)確的說法應(yīng)該是：人是通過預(yù)測(cè)未來來活著的。

這不是什么心靈雞湯，而是一個(gè)嚴(yán)肅的科學(xué)理論——自由能原理（Free Energy Principle），由神經(jīng)科學(xué)家 Karl Friston 提出。這個(gè)理論野心極大：它試圖用一個(gè)統(tǒng)一的數(shù)學(xué)框架，解釋感知、學(xué)習(xí)、決策、行動(dòng)、情緒、意識(shí)……乃至智能本身。

正好今天另一位朋友也寫了篇文章來剖析 “智能”，讓老馮想到了這個(gè)理論。所以今天就來聊聊最小自由能原理，它對(duì)理解 AI、理解 Agent、理解我們正在構(gòu)建的整個(gè)智能系統(tǒng)生態(tài)，都有非常深刻的指導(dǎo)意義。

一、它說了什么你為什么沒死？

這不是罵人，這是一個(gè)嚴(yán)肅的物理學(xué)問題。

熱力學(xué)第二定律告訴我們：封閉系統(tǒng)的熵只會(huì)增加，一切趨向無序。一杯熱水會(huì)變涼，一棟房子沒人打理會(huì)坍塌，一個(gè)系統(tǒng)如果不做任何事情，最終走向熱寂。

但你，一個(gè)由幾十萬億個(gè)細(xì)胞組成的精密系統(tǒng)，在幾十年的時(shí)間里維持著極其穩(wěn)定的有序結(jié)構(gòu)。體溫 37°C，血糖濃度在窄帶里波動(dòng)，心跳、呼吸、激素分泌井然有序。你是一個(gè)遠(yuǎn)離熱力學(xué)平衡的耗散結(jié)構(gòu)，你的存在本身就是一個(gè)需要解釋的現(xiàn)象。

那問題來了：什么樣的系統(tǒng)能在熱力學(xué)上持續(xù)存在而不解體？

Friston 的回答是：這個(gè)系統(tǒng)必須擁有一個(gè)關(guān)于外部世界的內(nèi)部模型，并且持續(xù)地最小化自身的變分自由能。

什么是自由能？

先不上公式（形式化定義放在最后面），用人話來解釋自由能這個(gè)概念。

想象你走在一條熟悉的路上，突然前方竄出一個(gè)黑影。你嚇了一跳，這就是"驚訝"（surprise）。然后你定睛一看，是一只貓。你的大腦迅速把"未知黑影"更新為"一只貓"，驚訝消失了，你繼續(xù)走路。

這個(gè)過程就是自由能最小化的一個(gè)微縮版。

自由能衡量的是"你以為的世界"和"世界實(shí)際給你的信號(hào)"之間的不匹配程度。自由能高，說明你不斷被打臉，世界一直在給你驚訝；自由能低，說明你對(duì)世界的理解很到位，預(yù)期和現(xiàn)實(shí)高度吻合。

而 Friston 的核心論點(diǎn)是：任何一個(gè)能長期存在的自組織系統(tǒng)，其行為在數(shù)學(xué)上必然等價(jià)于在最小化自由能。 這不是一個(gè)可選的策略，不是進(jìn)化"選擇"了這條路，而是一個(gè)數(shù)學(xué)必然。如果你還存在著，你就一定在做這件事，否則你早就解體了。

一條魚必須待在水里，人的體溫必須穩(wěn)定在 37°C 左右。偏離這些狀態(tài)就意味著解體和死亡。用自由能的語言來說：生命體必須把自己維持在一個(gè)"低驚訝"的狀態(tài)空間里。

最小化自由能的兩條路

要降低自由能，你有且只有兩個(gè)方向可以走。

第一條路：更新信念，感知與學(xué)習(xí)

世界給了你一個(gè)意外，你修改自己的內(nèi)部模型去適應(yīng)它。"哦，原來那個(gè)黑影是一只貓。" 你更新了信念，驚訝消失了。

短時(shí)間尺度上，這叫感知；長時(shí)間尺度上，這叫學(xué)習(xí)。不只是更新一個(gè)判斷，而是更新你對(duì)整個(gè)世界運(yùn)作方式的理解。

第二條路：改變世界，行動(dòng)與控制

你不改變信念，而是改變世界。你預(yù)期自己應(yīng)該是吃飽的，但當(dāng)前是餓的，這產(chǎn)生了高自由能。于是你去找飯吃，通過行動(dòng)讓現(xiàn)實(shí)變成你預(yù)期的樣子。Friston 管這叫主動(dòng)推斷（Active Inference）。

這兩條路合在一起，就統(tǒng)一了感知和行動(dòng)。傳統(tǒng)的認(rèn)知科學(xué)把感知和運(yùn)動(dòng)控制當(dāng)成兩套獨(dú)立系統(tǒng)來研究，但自由能原理說：它們是同一個(gè)優(yōu)化問題的兩種解法。你的大腦不區(qū)分"理解世界"和"改變世界"，它只是在持續(xù)地最小化自由能。

一句話總結(jié)：生命是一個(gè)通過不斷預(yù)測(cè)并消減意外來維持自身存在的過程。 預(yù)測(cè)是手段，消減驚訝是機(jī)制，活著是結(jié)果。

預(yù)測(cè)編碼：大腦的具體實(shí)現(xiàn)

自由能原理是抽象原理，預(yù)測(cè)編碼（Predictive Coding）是它在大腦中的具體實(shí)現(xiàn)方式。

大腦皮層是一個(gè)層級(jí)結(jié)構(gòu)。每一層都在做同樣的事：高層向低層發(fā)送預(yù)測(cè)信號(hào)。"我認(rèn)為你接下來應(yīng)該看到這個(gè)。" 低層拿實(shí)際感官輸入和預(yù)測(cè)做比較，計(jì)算出預(yù)測(cè)誤差；誤差往上傳，驅(qū)動(dòng)高層更新信念；更新后的信念產(chǎn)生新的預(yù)測(cè)，再向下傳。循環(huán)往復(fù)，永不停止。

這個(gè)架構(gòu)有一個(gè)非常優(yōu)雅的性質(zhì)：信息傳遞是高度壓縮的。只有預(yù)測(cè)誤差（意外的部分）需要往上傳，符合預(yù)期的部分被"解釋掉"了。大腦不是在傳輸原始數(shù)據(jù)，而是在傳輸"新聞"，只有出乎意料的才值得傳。

所以你的大腦不是一個(gè)被動(dòng)的接收器，而是一臺(tái)主動(dòng)的預(yù)測(cè)生成器。你看到的、聽到的、感受到的，大部分是大腦自己"腦補(bǔ)"出來的，感官輸入只是用來糾錯(cuò)的。

二、它能解釋什么

一個(gè)好理論的標(biāo)志是：它能用一套機(jī)制解釋大量看似不相關(guān)的現(xiàn)象。自由能原理在這方面非常強(qiáng)大。

解釋感知：你的世界是大腦的一場(chǎng)可控幻覺

既然大腦在不斷"腦補(bǔ)"，感官只是負(fù)責(zé)糾錯(cuò)，那很多知覺現(xiàn)象就說得通了：

雞尾酒會(huì)效應(yīng) —— 在嘈雜環(huán)境中你依然能聽清朋友說話。因?yàn)榇竽X用語境在不斷預(yù)測(cè)下一個(gè)詞，只需要從聲波里提取少量誤差信號(hào)來修正就夠了。大腦替你"腦補(bǔ)"了 80% 的內(nèi)容。

視覺錯(cuò)覺 —— 你的大腦過度依賴了先驗(yàn)預(yù)測(cè)，把"腦補(bǔ)"當(dāng)成了現(xiàn)實(shí)。模型太強(qiáng)勢(shì)，感官輸入被壓制了。

變化盲視 —— 一張照片里換掉一個(gè)大物件你可能根本注意不到。因?yàn)槟愕念A(yù)測(cè)沒有覆蓋到那個(gè)區(qū)域，沒有預(yù)測(cè)自然不會(huì)有預(yù)測(cè)誤差，沒有誤差信號(hào)就等于"什么都沒發(fā)生"。

恐怖谷效應(yīng) —— 高仿真機(jī)器人看著比卡通機(jī)器人更讓人不安。因?yàn)樗咏?人類"的預(yù)測(cè)模板了，但又有微小的偏差，在你的預(yù)測(cè)系統(tǒng)里引發(fā)了強(qiáng)烈的、難以被消減的誤差信號(hào)。

解釋情緒：你的儀表盤在報(bào)什么數(shù)

在自由能框架下，情緒不是什么附加模塊，而是預(yù)測(cè)系統(tǒng)的內(nèi)置儀表盤。它告訴你當(dāng)前自由能的狀況。

焦慮 —— 模型預(yù)測(cè)到了前方有大量不確定性："我不知道會(huì)發(fā)生什么，但我覺得不會(huì)好。" 這是高期望自由能的警報(bào)。

好奇心 —— 模型發(fā)現(xiàn)了一塊"可以被消除的不確定性"："這個(gè)東西我不懂，但我覺得我能搞懂。" 這是認(rèn)知價(jià)值在驅(qū)動(dòng)你。

愉悅 —— 預(yù)測(cè)誤差被成功消減："我猜對(duì)了"，或者"事情按預(yù)期發(fā)展了"。

無聊 —— 預(yù)測(cè)誤差長時(shí)間接近于零。沒什么新東西可學(xué)，模型沒有在進(jìn)步。

驚喜 —— 一個(gè)正向的預(yù)測(cè)誤差：世界比你預(yù)期的更好。

這個(gè)框架甚至可以解釋為什么好的音樂讓人愉悅。音樂在不斷建立預(yù)期，然后在恰到好處的時(shí)候打破預(yù)期，制造一個(gè)可控的驚訝。完全符合預(yù)期的音樂令人無聊，完全出乎預(yù)期的噪音令人不適。最好的音樂在預(yù)測(cè)和驚訝之間精確起舞，持續(xù)地給你的預(yù)測(cè)系統(tǒng)喂恰到好處的誤差信號(hào)。

解釋好奇心與探索：為什么你不會(huì)躲在黑屋子里

這是自由能原理最精彩的推論。

如果一個(gè)系統(tǒng)只是在最小化當(dāng)下的驚訝，那最優(yōu)策略顯然是找個(gè)黑屋子躲起來不動(dòng)，那里永遠(yuǎn)不會(huì)有意外。但生物不是這樣的。生物會(huì)探索、會(huì)冒險(xiǎn)、會(huì)好奇。為什么？

因?yàn)樽杂赡茏钚』恢豢串?dāng)下，還看期望的未來。

你主動(dòng)探索一個(gè)未知環(huán)境，短期內(nèi)驚訝確實(shí)增加了，但你的模型因此變得更準(zhǔn)確了，意味著你未來所有時(shí)刻的期望自由能都降低了。這在信息論上叫做信息增益（Information Gain）。

好奇心、探索、科學(xué)研究，甚至小孩子不知疲倦的玩耍，這些行為看起來像是在"自找麻煩"，但在自由能框架下完全合理：它們?cè)谧鲩L期自由能最小化，用短期的驚訝換取長期的確定性。

這也解釋了為什么學(xué)習(xí)新東西的過程是痛苦的（短期自由能飆升），但學(xué)會(huì)之后是愉悅的（模型升級(jí)了，長期自由能大幅下降）。

一個(gè)智能系統(tǒng)的核心標(biāo)志：愿意為了長期的模型精度而承受短期的驚訝。

解釋心理病理：預(yù)測(cè)系統(tǒng)出了 bug

這個(gè)框架對(duì)精神疾病也有很強(qiáng)的解釋力。它把不同的心理疾病解釋為預(yù)測(cè)系統(tǒng)中不同參數(shù)的失調(diào)。

自閉癥譜系 —— 先驗(yàn)（預(yù)測(cè)）的權(quán)重過低，預(yù)測(cè)誤差的權(quán)重過高。不是不能感知，而是感知到了太多。每個(gè)細(xì)節(jié)都是"新聞"，大腦被預(yù)測(cè)誤差信號(hào)淹沒，無法形成穩(wěn)定的高層預(yù)測(cè)。這就解釋了感官過載、對(duì)變化的極端敏感、以及對(duì)重復(fù)性和規(guī)律性的強(qiáng)烈偏好，因?yàn)橹挥性诟叨瓤深A(yù)測(cè)的環(huán)境里，預(yù)測(cè)誤差才不會(huì)淹沒系統(tǒng)。

精神分裂癥（部分癥狀） —— 先驗(yàn)權(quán)重過高，預(yù)測(cè)誤差被忽略。大腦過度相信自己的內(nèi)部模型，感官輸入的糾錯(cuò)信號(hào)傳不上去，模型開始"自嗨"，產(chǎn)生幻覺和妄想。

抑郁癥 —— 生成模型被悲觀信念鎖死："一切都不會(huì)好的。" 這個(gè)先驗(yàn)太強(qiáng)了，即使正面的感官輸入進(jìn)來，也會(huì)被高權(quán)重的悲觀預(yù)測(cè)壓掉。負(fù)面預(yù)測(cè)變成了自我實(shí)現(xiàn)的預(yù)言。

上癮 —— 短期自由能最小化劫持了長期最小化。物質(zhì)或行為提供了一條極其可靠的短期驚訝消減路徑，以至于系統(tǒng)放棄了更健康的長期策略。

這不只是用新術(shù)語包裝舊常識(shí)。它為臨床現(xiàn)象提供了一個(gè)可計(jì)算、可建模的理論框架。你可以在模型的參數(shù)空間里精確地刻畫"哪里出了問題"，這就打開了精確干預(yù)的可能性。

三、它能指導(dǎo)什么

一個(gè)理論如果只能解釋已知現(xiàn)象，那它只是事后諸葛亮。自由能原理真正厲害的地方，是它的指導(dǎo)性。它直接告訴你，智能是什么，以及要在哪些維度上提升。

智能的四個(gè)維度

在自由能框架下，智能不是一種特殊的、神秘的能力，而是自由能最小化做得特別好時(shí)涌現(xiàn)出來的性質(zhì)。一個(gè)系統(tǒng)越"智能"，它在以下四個(gè)維度上就做得越好：

① 時(shí)間深度：你的預(yù)測(cè)能看多遠(yuǎn)

一個(gè)恒溫器只看當(dāng)下，溫度偏了就開暖氣。一只老鼠能為冬天儲(chǔ)糧，它在為幾個(gè)月后做準(zhǔn)備。一個(gè)人能為二十年后的退休攢錢，能為百年后的氣候變化制定政策。

生成模型覆蓋的時(shí)間跨度越長，系統(tǒng)就越能消減遠(yuǎn)期的不確定性，系統(tǒng)就越智能。

② 抽象深度：你的模型有多壓縮

一只青蛙的視覺系統(tǒng)只有"小黑點(diǎn)在動(dòng) → 吐舌頭"這一層。人類的認(rèn)知系統(tǒng)從像素到邊緣到物體到場(chǎng)景到敘事到因果理論到數(shù)學(xué)公理，層層抽象，每一層都在壓縮下一層的預(yù)測(cè)誤差，抽取更高階的規(guī)律。

牛頓用 (F=ma) 和一個(gè)萬有引力公式，消減了關(guān)于所有宏觀物體運(yùn)動(dòng)的海量不確定性。這是極致的模型壓縮。科學(xué)本身就是人類文明級(jí)別的自由能最小化，用最簡的模型解釋最多的現(xiàn)象。

而自由能公式里天然包含了對(duì)模型復(fù)雜度的懲罰，這就是奧卡姆剃刀的數(shù)學(xué)形式。最小化自由能的系統(tǒng)，自然傾向于用最簡的模型解釋數(shù)據(jù)。

③ 主動(dòng)探索：你有多愿意承受短期驚訝

前面說過了，一個(gè)只優(yōu)化當(dāng)下的系統(tǒng)會(huì)躲起來。真正智能的系統(tǒng)會(huì)主動(dòng)出擊，承受短期驚訝以換取長期的模型精度。

好奇心不是智能的副產(chǎn)品，而是智能的核心驅(qū)動(dòng)力。一個(gè)不好奇的系統(tǒng)，就是一個(gè)放棄了長期自由能最小化的系統(tǒng)。

④ 模型切換：你能不能換一套理解方式

最高階的智能不是在一個(gè)固定模型里調(diào)參數(shù)，而是能識(shí)別出"當(dāng)前模型不夠用了"，然后創(chuàng)造或切換到一個(gè)全新的模型。

當(dāng)牛頓力學(xué)解釋不了水星近日點(diǎn)進(jìn)動(dòng)時(shí)，愛因斯坦沒有在舊框架里硬調(diào)，而是創(chuàng)建了廣義相對(duì)論。這種能力對(duì)應(yīng)的就是在模型空間上的搜索和跳躍，"頓悟"和"范式轉(zhuǎn)換"的數(shù)學(xué)本質(zhì)。

大多數(shù)時(shí)候，你在一個(gè)模型內(nèi)部做推斷。偶爾，你需要跳出模型本身。后者才是真正稀缺的智能。

對(duì) AI 的指導(dǎo)

這套理論對(duì)理解和構(gòu)建 AI 系統(tǒng)有直接的指導(dǎo)意義。

大語言模型在做什么？ 預(yù)測(cè)下一個(gè) token。訓(xùn)練過程最小化的是交叉熵，而交叉熵就是驚訝度的期望值。所以 LLM 的訓(xùn)練在數(shù)學(xué)上等價(jià)于自由能最小化的第一條路，更新內(nèi)部模型。這也解釋了為什么 LLM 能涌現(xiàn)出某種"理解力"：它在壓縮預(yù)測(cè)誤差的過程中，不得不學(xué)會(huì)語言背后的世界模型。

LLM 缺什么？ 兩個(gè)關(guān)鍵缺口。第一，沒有第二條路，主動(dòng)推斷。它不能采取行動(dòng)去改變世界，只是一個(gè)被動(dòng)的預(yù)測(cè)器。第二，沒有持續(xù)的自由能最小化循環(huán)。每一次推理都是一個(gè)無狀態(tài)的函數(shù)調(diào)用，不是一個(gè)在時(shí)間中持續(xù)存在、需要維持自身的系統(tǒng)。

Agent 補(bǔ)的是什么？ 第二條路。一個(gè) Agent 有了感知（獲取信息）、有了行動(dòng)（調(diào)用工具、改變環(huán)境）、有了持久狀態(tài)（記憶），它就從一個(gè)"被動(dòng)預(yù)測(cè)器"變成了一個(gè)"主動(dòng)推斷系統(tǒng)"。這在自由能框架下是一個(gè)本質(zhì)的躍遷，從半個(gè)閉環(huán)變成了完整閉環(huán)。

什么才是真正的通用智能？ 四個(gè)維度全拉滿：能做長時(shí)間尺度的預(yù)測(cè)（時(shí)間深度），能形成高度抽象的模型（抽象深度），能主動(dòng)探索未知（好奇心），能在模型不夠用時(shí)跳出來換一套（創(chuàng)造力）。目前的 AI 系統(tǒng)在每個(gè)維度上都有明顯的天花板，認(rèn)清這些天花板在哪里，本身就是很有價(jià)值的。

對(duì)個(gè)人認(rèn)知的指導(dǎo)

這套理論不只是學(xué)術(shù)話題，它對(duì)日常的自我管理也有非常實(shí)用的指導(dǎo)。

學(xué)習(xí)的本質(zhì)是什么？ 更新你的生成模型。當(dāng)你覺得"學(xué)不進(jìn)去"的時(shí)候，本質(zhì)上是預(yù)測(cè)誤差超出了你的處理能力。要么誤差太大（材料太難，你完全預(yù)測(cè)不了），要么誤差太小（太簡單，沒有新信息）。最高效的學(xué)習(xí)發(fā)生在預(yù)測(cè)誤差存在但可控的區(qū)間，這就是心理學(xué)里說的"最近發(fā)展區(qū)"，也是"心流"狀態(tài)的本質(zhì)。

焦慮怎么處理？ 兩條路：要么提升你模型的精度（多學(xué)、多了解，降低不確定性），要么改變環(huán)境（主動(dòng)行動(dòng)，消除焦慮的來源）。無效的方式是什么？既不更新模型也不采取行動(dòng)，而是反復(fù)在同一個(gè)不完善的模型里做推斷，這就是"overthinking"，即內(nèi)耗。

為什么"走出舒適區(qū)"有效？ 因?yàn)榇谑孢m區(qū)等于待在"黑屋子"里。預(yù)測(cè)誤差為零，模型不再更新。但世界在變，你的模型沒跟上，長期自由能其實(shí)在悄悄積累。主動(dòng)走出去，短期自由能飆升，但模型升級(jí)了，長期收益巨大。

附錄：自由能的形式化定義

前面我們一直用直覺來理解自由能。如果你對(duì)數(shù)學(xué)感興趣，這里給出嚴(yán)格定義。不感興趣可以跳過，不影響對(duì)全文的理解。

變分自由能的定義：

第一項(xiàng)衡量模型解釋數(shù)據(jù)的能力，第二項(xiàng)衡量信念偏離先驗(yàn)的程度。最小化自由能 = 在準(zhǔn)確度和簡潔性之間取最優(yōu)平衡。這就是奧卡姆剃刀的數(shù)學(xué)形式。

熟悉機(jī)器學(xué)習(xí)的讀者應(yīng)該已經(jīng)認(rèn)出來了：這和變分推斷中的 ELBO（Evidence Lower Bound）完全等價(jià)，取個(gè)負(fù)號(hào)就是自由能。VAE、變分貝葉斯、EM 算法，底層都是這套數(shù)學(xué)。Friston 的洞見在于：這不只是一個(gè)計(jì)算技巧，而是生命本身的運(yùn)作原理。

尾聲

回到開頭那句話："人活著就是為了預(yù)測(cè)未來。"

改一個(gè)字就對(duì)了，人活著不是"為了"預(yù)測(cè)未來，而是"通過"預(yù)測(cè)未來來活著。

把它再推廣一步：

生命是一個(gè)通過不斷預(yù)測(cè)并消減意外來維持自身存在的過程。智能是這個(gè)過程在時(shí)間深度、抽象深度、探索主動(dòng)性和模型靈活性上的延伸。

這不是一個(gè)比喻。這是一個(gè)有數(shù)學(xué)基礎(chǔ)、有神經(jīng)科學(xué)證據(jù)、有工程映射的統(tǒng)一理論。它用一個(gè)原理，最小化自由能，把生命、智能、感知、行動(dòng)、情緒、好奇心、學(xué)習(xí)、創(chuàng)造力，全部串聯(lián)在了一起。

當(dāng)你真正理解了這個(gè)框架，你會(huì)發(fā)現(xiàn)：我們正在構(gòu)建的這些 AI 系統(tǒng)，不是在"發(fā)明"智能，而是在用另一種介質(zhì)，重新實(shí)現(xiàn)生命已經(jīng)運(yùn)行了幾十億年的那套算法。

只不過這次，載體從碳基換成了硅基。

數(shù)據(jù)庫老司機(jī)

點(diǎn)一個(gè)關(guān)注 ??，精彩不迷路

對(duì) PostgreSQL， Pigsty，下云感興趣的朋友

歡迎加入 PGSQL x Pigsty 交流群 QQ 619377403

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.