全文 3,000字 | 閱讀約 8 分鐘
![]()
(前DeepMind神經科學家訪談精彩片段)
企業部署 AI ,普遍的感覺是:會說,但不會干。
最近,著名科技播客主持人 Dwarkesh Patel 發布了他與 Adam Marblestone 的長談。
Marblestone 曾在 Google DeepMind 的神經科學團隊做研究科學家,如今是 Convergent Research 的 CEO。
他從神經科學的視角,重新審視了企業 AI 落地難的這件事。
AI 學得快不快,關鍵不在模型有多大、技術有多新,而在你給它設定了什么樣的學習目標。
就像團隊管理,KPI 設錯了,再努力也是白費。AI 也一樣,損失函數、獎勵信號這些“AI 的 KPI”,決定了它最終往哪個方向優化。
這背后的邏輯是什么?
AI 現在喂的數據已經夠多了,但它不知道什么數據值得學。就像一個學生拼命刷題,卻不知道哪些題型重要。
第一節|數據喂了十倍,能力沒漲一倍,問題在哪?
過去幾年,企業在 AI 上的投入越來越大。模型越來越強,算力越來越貴,訓練數據越堆越多。
但落地的時候,很多人還是那個感覺:AI 會說,但不會干。
事實上,我們給大語言模型投喂的數據量,已經遠超任何一個人類一輩子能接觸到的信息總量。但它的能力,還遠不如一個普通人。
問題出在哪?
Marblestone 把 AI 系統分成三個部分:
架構(Architecture):有多少層,怎么連接
學習算法(Learning Algorithm):反向傳播還是別的什么
代價函數(Cost Functions):訓練它去做什么,獎勵什么
他的判斷是,前兩個被過度關注,第三個反而被忽視了。
大家都在優化模型結構和訓練方法,但最該優化的反而被忽視了:你到底在獎勵什么。
為什么會這樣?
因為機器學習喜歡數學上簡單的損失函數。預測下一個詞,算個交叉熵,這些都是計算機科學家喜歡的簡單目標。
但大腦不是這樣工作的。
自然進化給大腦設計了成千上萬個不同的學習目標:這個腦區學什么,那個腦區學什么;三歲學什么,十歲學什么;什么情況該興奮,什么情況該警惕。
Marblestone 形容它像一套預裝的操作指南,精確規定了大腦的每個部分在每個階段該關注什么。
第二節|大腦怎么做到的?靠的是雙系統協作
為了解釋這個大腦機制,Adam Marblestone 引用了前物理學家、現 AI 安全研究員Steve Byrnes 的一套理論。
這個理論把大腦分成兩個系統:
學習子系統:主要是皮層,負責學習世界模型,結構相對簡單重復
引導子系統:下丘腦、腦干、杏仁核等,負責提供先天的獎勵信號
就像一對搭檔:一個專注積累經驗,另一個負責告訴它什么值得學。
“引導子系統”不只是發信號那么簡單,它有自己的感覺系統。
比如視覺,我們以為只有皮層在處理。但大腦深處還有一個更原始的視覺系統,叫上丘,天生就能檢測面孔和威脅。當有小黑影快速靠近你的身體,上丘會直接觸發退縮反射。這個反應比你意識到發生了什么還快。
這就是引導子系統在工作:小的、深色的、高對比度的、快速移動的=昆蟲=危險。
但泛化是怎么發生的?
秘密在于:負責學習的部分會去預測那些天生反應。
還是剛才退縮的例子。當你退縮時,杏仁核會訓練一個預測器:我快要退縮了嗎?這個預測器接收的信息來自皮層。蜘蛛這個詞、蜘蛛的圖片、關于蜘蛛的書,甚至這段對話,都會輸入給它。
所以你聽到“你背上有蜘蛛”,即使沒有真蜘蛛,也會觸發預測器,進而激活類似的不適感。
泛化機制包括三個部分:
引導子系統提供簡單標簽(危險/安全、喜歡/討厭)
學習子系統把標簽連接到復雜的世界特征上
預測器讓這種連接可以泛化到新情境
人能從極少例子中學習,靠的就是這套泛化機制。
對此,Marblestone 還提供了一個生物學證據:引導子系統的細胞種類,比學習子系統多得多。
皮層的細胞類型相對統一,就像重復的 Transformer 層。但下丘腦、腦干這些引導子系統,有成千上萬種不同的細胞,每一種對應一個特定的先天反應。檢測鹽味的,檢測社交地位的,區分朋友和敵人的,都是不同的細胞在負責。
這么多種細胞,人類基因的信息量其實很少,不像大模型有海量訓練數據,怎么能造出這么復雜的大腦?
答案是,人類進化不需要預先編碼整個世界模型。
它只需要編碼三樣東西:一個可以學習的架構(皮層) 、一套豐富的獎勵信號(引導子系統)、 一個連接機制(預測器)。
剩下的,交給學習。
因此,大腦的秘密不是結構有多復雜,而是知道該學什么。
第三節|企業 AI 的KPI,該怎么重新設計
那企業 AI 怎么辦?
Adam Marblestone 指出了當前 AI 訓練的現狀:
“我們在大模型中根本沒有價值函數。這種訓練方式非常原始,比 10 年前的 AI用的方法還要簡單。”
什么是價值函數?
簡單說,就是讓 AI 不只看眼前這一步對不對,而是評估這一步對長期目標有什么影響。
現在的訓練方式是:整個對話軌跡解決了問題,就把這個軌跡里的每個詞都加權。但 AI 不知道哪個詞是關鍵轉折,哪個詞只是過渡,哪個決策會在 5 步后引發好結果。
它只知道這次成功了,不知道為什么成功。
而大腦有多層次的評估機制。有負責簡單動作選擇的部分,有負責建立獎勵模型的部分,還有專門評估當前狀態對長期目標價值的價值函數。
更關鍵的是,大腦不只是單向預測下一個詞。
它可以全向推理。看到畫面能預測聲音,聽到聲音也能預測畫面;知道目標,能反推路徑;看到結果,能倒推原因。
Marblestone 說,大腦可以在任意方向上做預測。
大模型擅長從原因推結果,比如“他遲到了,所以___”,它能接“被批評了”。但如果反過來,告訴它“他被批評了’,讓它推斷前面可能發生了什么,就要弱很多。
因為大模型的訓練方向是固定的:從左往右預測下一個詞。
人卻能靈活選擇推理方向。看到結果能倒推原因,知道目標能反推路徑。
所以 AI 缺的是兩樣東西:價值函數告訴它什么值得做,全向推理讓它靈活達成目標。
那企業 AI 的 KPI 該怎么設計?
基于原文的思路,可能的方向包括:
1、引入價值函數
不只是這個任務做對了,不只評估這一步對不對,還要評估它對后續 5 步、10步的影響。在業務場景下,什么樣的中間狀態是有價值的?哪些信息值得記住,哪些可以忽略?
2、設計分層的獎勵信號
借鑒大腦的雙系統:基礎層判斷對錯(客服回復是否解決問題),中間層關注業務目標(滿意度、轉化率、風險控制),高層對準戰略目標(品牌形象、長期留存)。不同層次的獎勵權重不同,在不同階段啟用。
3、訓練全向推理能力
不只是從輸入預測輸出,還要能從目標倒推路徑、從部分信息補全上下文、從約束條件生成方案。這可能需要在訓練中移除固定的掩碼,讓模型學會從任意變量預測任意變量。
4、探索行為克隆
除了給 AI 標簽(這個回復好或壞),更重要的是給它專家的思考路徑:在哪個時刻關注什么信息,在哪些點放慢速度,決策邊界在哪里。
說到底,訓練 AI 理解什么值得做對,為什么值得做對,以及這個“對”在整個業務流程里處于什么位置。
企業 AI 提效,模型能力重要,但你給它設定什么樣的評分體系,可能更重要。
你獎勵什么,它就會往什么方向優化。
就像企業管理:KPI 設錯了,團隊再努力也會在把事做偏。
獎勵準確率,它可能變得保守;
獎勵效率,它可能犧牲質量;
獎勵用戶滿意度,它可能過度迎合。
真正的挑戰是設計一套像大腦那樣豐富、分層、動態調整的獎勵體系。這不是換個模型就能解決的。
在你的業務場景里,什么才是真正值得 AI 去學、去記、去優化的,得想清楚。
模型會變強,但方向得你給。
結語|KPI 設對了,AI 才能學得快
AI 現在的問題很清楚:數據喂得越來越多,能力漲得越來越慢。
原因也很清楚:它不知道什么值得學。
人腦的數據效率來自自然進化預裝的復雜獎勵體系。不同腦區、不同階段、不同情境,有不同的學習目標。
AI 只有一個簡單目標:預測下一個詞。
這就是差距。
Marblestone 的觀點是:調模型、堆參數,不如重新設計評分標準。
企業 AI 提效也一樣。
與其追求更大的模型,不如先想清楚:你在獎勵 AI 什么?這套評分體系,能引導它做對的事嗎?
答案可能不在算力,在 KPI設得對不對。
識自AI
本文由AI深度研究院出品,內容翻譯整理自Adam Marblestone在Dwarkesh Patel播客的訪談等網上公開素材,屬翻譯分析性質。內容為觀點提煉與合理引述,未逐字復制原訪談材料。未經授權,不得轉載。
星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標
https://www.youtube.com/watch?v=_9V_Hbe-N1A
https://www.dwarkesh.com/p/adam-marblestone
https://www.dwarkesh.com/feed?utm_source=chatgpt.com
https://coefficientgiving.org/files/Research/Moral_Patienthood/Marblestone_et_al_%282016%29.pdf?utm_source=chatgpt.com
來源:官方媒體/網絡新聞,
排版:Atlas
編輯:深思
主編:圖靈
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.