<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      他用一根橡皮筋,講透了AI的底層邏輯

      0
      分享至


      序幕:神經網絡

      老喻:辛頓教授,深度學習對大多數人來說就是一個"黑盒",幾百億參數在里面像魔法一樣運作。您能不能用打比方加一點初級數學,把"前向傳播"和"反向傳播"徹底揉碎了講講?

      辛頓:沒問題。但在講機制之前,我想先讓大家理解一件事:大腦里正在發生的事情,離我們平時的"有意識邏輯思考"非常遙遠。它們更像是在做"感知"或"類比",你沒法用傳統的符號處理去解釋。


      我舉個最自然的例子:給你一張灰度照片,一堆像素點,請你告訴我——里面有沒有鳥?

      過去半個世紀,人們一直試圖寫程序解決這個問題,基本全部失敗。為什么?因為"鳥"根本無法用一組固定的數學值來定義。它可以是懟到你臉上的一只鴕鳥,也可以是天邊的一只海鷗;黑的、白的、飛著的、蹲著的。

      那大腦是怎么做的?我們來手工搭一個神經網絡看看。

      第一層,我們放一批神經元,專門檢測圖片里最微小的邊緣——比如取三個像素點,如果左邊亮、右邊暗,這個神經元就興奮:"這里有一條邊!"

      第二層,神經元不再看像素,而是看第一層傳來的信號——幾條短邊緣向下傾斜、幾條向上傾斜、前端交匯成一個尖角——它就喊:"我可能發現了一個鳥嘴!"


      第三層,有個神經元同時收到"鳥嘴"和"鳥眼"的信號,并且空間位置對得上,它就說:"這是一個鳥頭!"

      最頂層,當"鳥頭""鳥腳""翅膀尖"的信號同時涌入,它大喊:"這絕對是一只鳥!"


      老喻:邏輯很清晰!但如果手工搭建,這個網絡得多大?


      辛頓:至少10億個連接。我絕不可能讓我的研究生去手動設置10億個權重——所以我們需要一種機制,讓網絡自己學會怎么設置這些權重。這就是我接下來要講的核心:前向傳播和反向傳播。

      第一幕:前向傳播

      辛頓:我們把正在學習“如何認出一只鳥”的神經網絡,想象成一家擁有 10 億名員工的“看圖識物大公司”。


      這家公司等級森嚴,分為四個層級:

      1、基層業務員(底層神經元):只負責盯圖片上最基礎的像素亮暗,只有當像素亮到一定程度,業務員才會“興奮”地往上喊(這就是激活函數)。

      2、小組長(第二層神經元):聽業務員匯報,負責尋找“邊緣”和“線條”。

      3、部門經理(第三層神經元):聽小組長匯報,負責拼湊“鳥嘴”或“狗耳朵”這樣的局部特征。

      4、CEO(頂層神經元/輸出層):聽取所有經理的匯報,向客戶拍板出最終結論:“這是一只鳥,還是一只狗!”

      老喻好家伙,10 億人的大廠!那平時遞進去一張圖片,他們是怎么協同工作的?

      辛頓:這就叫“前向傳播”,也就是自下而上的情報匯報。

      假設客戶遞來一張“麻雀”的照片。底層業務員看到像素就開始往上喊。但在職場里,上級對下屬絕不會一視同仁。這里有我們第一個極其關鍵的數學概念: 在學術上,下屬喊話的音量叫“激活值”,上級對下屬的信任程度叫“權重(Weight)”。

      下屬匯報的音量(激活值) × 上級對他的信任度(權重) = 對上級的實際影響力


      假設公司開業第一天,這 10 億人的“信任度(權重)”全都是隨機瞎填的(這叫隨機初始化)。碰巧,負責找“狗耳朵”的經理 A 今天瞎激動,喊得特大聲,而 CEO 給他的初始信任度又極高;相反,“鳥嘴部門”的經理 B 明明嘀咕了正確答案,卻因信任度太低被徹底無視。


      信號就這樣一層一層做著乘法往上傳遞。CEO 綜合了所有匯報后一拍腦門,給出了最終預測:“客戶您好,根據我司嚴密計算,這張圖有 80% 的概率是狗,只有 10% 的概率是鳥!”


      老喻:對著麻雀喊狗,這是一場災難性的業務事故!由于初始信任度是隨機的,前向傳播等于是在盲人摸象、瞎猜一氣??蛻艨隙ㄒ谱雷恿恕?/p>

      第二幕:誤差與梯度

      辛頓:沒錯!客戶(也就是訓練數據里的標準答案/標簽 Label)勃然大怒:“瞎了嗎?這是鳥!鳥的概率必須是 100%(1.0),狗的概率必須是 0%(0.0)!”


      這個時候,全公司就要開始計算這次業務事故錯得有多離譜了。為了讓你有直觀的物理感受,老喻,我在 CEO 的辦公桌上放一個極其具象的“橡皮筋與滑軌”道具,來給你演示什么叫“誤差/損失(Loss)”“梯度(Gradient)”。

      想象桌上豎著兩排帶刻度的滑軌,分別寫著“鳥”和“狗”。滑軌的最底部是 0.0,最頂部是 1.0。 每條滑軌上都有兩個東西:

      1、客戶手里拿的“真理鐵釘”(代表標準答案),砰的一聲死死釘在滑軌的正確刻度上,絕對不許動。

      2、CEO 手里推的“預測滑塊”(代表他瞎猜的概率輸出),停在他剛才匯報的刻度上。 最要命的是:在“真理鐵釘”和“預測滑塊”之間,死死套著一根極其強韌的橡皮筋!


      老喻:畫面感太強了!那這桌上現在的戰況如何?CEO 豈不是被勒得很慘?

      辛頓:極其痛苦!我們先看“鳥”的滑軌: 這是一張真麻雀,所以客戶把“真理鐵釘”釘在了最頂端的1.0。但 CEO 瞎猜,把“預測滑塊”留在了最底部的0.1。 老喻你看,鐵釘在天上,滑塊在地下。這根原本短短的橡皮筋,被強行跨越 0.9 的巨大物理距離,死死繃緊了!因為鐵釘(錨點)在上方,這根緊繃的橡皮筋產生了一個巨大的拉力,拼命想把底下的滑塊往上拽


      我們再看“狗”的滑軌: 照片里根本沒狗,客戶把“真理鐵釘”死死釘在了最底部的0.0。但 CEO 聽信讒言,把“預測滑塊”推到了0.8的高空! 仔細看這根橡皮筋——鐵釘在地下(0.0),滑塊在天上(0.8)。兩點之間同樣隔著 0.8 的巨大距離!所以這根橡皮筋同樣被極度拉長、死死繃緊了、勒得生疼!只不過這一次,鐵釘在下方,橡皮筋的收縮本能拼命想把天上的滑塊往下拽。


      老喻:(恍然大悟)噢!我徹底明白了!很多初學者覺得往下按應該是“壓縮彈簧”,但其實橡皮筋根本沒法被壓縮,它只在乎你和真理之間的“絕對距離”!只要偏離真理,無論偏高還是偏低,橡皮筋都會被無情地拉長、繃緊!這根橡皮筋被拉得有多長、勒得有多疼,就是“誤差大小(Loss)”;而它拼命往上拽還是往下拽的“方向和力道”,就是微積分里大名鼎鼎的“梯度(Gradient)”!所以算法本質上是在做“負梯度下降”,即違背讓痛苦增加的趨勢。


      辛頓:Bingo!你完美推導出了深度學習最核心的數學直覺:偏離即拉伸,拉伸即痛苦。梯度精確地告訴 CEO:你下一步該去提拔誰、打壓誰,才能逃避這種痛苦。

      第三幕:反向傳播

      老喻:現在 CEO 頭頂著這兩根繃到極致、隨時要把頭皮扯掉的橡皮筋,被勒得痛不欲生。他現在的唯一本能,就是想盡辦法讓所有橡皮筋都“縮回原點、徹底松弛”!但他總不能把 10 億人全開除吧?他該怎么善后?


      辛頓:為了讓頂層的橡皮筋放松,他必須把拉扯的痛感順著公司的層級向下分攤。這就需要“反向傳播”(Backpropagation)登場了!在微積分里它叫“鏈式法則(Chain Rule)”,但我更愿意稱之為“企業級精準連坐分鍋機制”!


      CEO 順著那根拽著他往下死里勒的“狗皮筋”去查賬:“這股痛感(負向梯度)是誰造成的?哦!是因為經理 A 剛才喊得最大聲,我又極度信任他。他坑慘我了!”

      CEO 掏出小本本開始懲罰,這是我們的第二個核心公式:

      修改對下屬的信任度(更新權重) = 橡皮筋傳導給我的痛感(梯度) × 該下屬剛才匯報的音量(激活值)

      這個公式無比殘酷:如果橡皮筋繃得極緊(錯得離譜),而你作為下屬剛才又喊得最起勁,你挨的板子就最重!CEO 狠狠扣減了經理 A 的信任度:“為了緩解往下拽的拉力,下次你再喊,我就當耳旁風?!蓖瑫r,順著“鳥皮筋”向上的正向梯度拉力,CEO 給受了委屈的鳥嘴經理 B大幅增加了信任度


      老喻:絕妙的連坐乘法!但這只是高管層的分鍋,底下那 9 億多人怎么辦?

      辛頓:繼續用“鏈式法則”反向往下套公式啊!經理 A 挨了罵,信任度被降級,他也感受到了被橡皮筋拉扯的痛感(梯度的向下傳遞)。他憋著火回到辦公室叫來手下:“剛才到底是哪個混蛋給我亂報‘狗耳朵’的?”


      經理 A 用同樣的乘法公式,把緊繃的拉力按比例向下分攤,揪出那個瞎報“毛茸茸邊緣”的小組長,狠狠扣減對他的信任度。而剛才沒作聲的人,因為音量乘積為 0,完美隱身。


      接著,小組長感受到拉力,轉身再去罵基層業務員……你看,這股“為了讓頂層橡皮筋徹底放松”的求生欲,就這樣順著公司的層級做著連環乘法,一路反向(Backwards)傳導(Propagate)到了最底層。 全公司 10 億人瞬間收到了一份極其精確的微調通知:“為了緩解上面的緊繃感,你該把對某下屬的信任度調高 0.01,還是調低 0.05?!?/p>


      尾聲:梯度下降與智能涌現


      老喻:太透徹了!等于說每一次輸入一張圖片,全公司就經歷一次完整的循環:“前向瞎猜匯報(Forward) → 橡皮筋拉緊勒疼(計算誤差 Loss 和梯度 Gradient) → 反向精準連坐分鍋以求放松(Backpropagation 更新權重)”。

      辛頓:完全正確!全公司努力順著梯度的拉力,通過微調信任度讓橡皮筋越來越松的這個過程,在數學上就叫做“梯度下降”(Gradient Descent)。


      看一張圖,10 億個“信任度”旋鈕只在橡皮筋的拉扯下微調一絲絲。但當你給這家公司看 1000 萬張照片,把拉緊、分鍋、放松的循環重復幾千萬次后,奇跡就發生了:

      只會制造噪音的員工,信任通道被徹底切斷;而真正能準確識圖的骨干,他們之間的信任通道被一點點拓寬成了極其順暢的高速公路。


      此時,當下一張全新的鳥圖出現時,正確的像素瞬間完美激活正確的業務員、正確的主管,信號順著高速公路直達頂層。CEO 連腦子都不用動就能脫口而出:“100% 是鳥,0% 是狗!”


      那一刻,真理鐵釘和預測滑塊完美重合,他頭頂所有代表誤差的橡皮筋,全都處于完美、舒適的徹底放松狀態(模型收斂)。


      老喻:極其震撼!系統沒有所謂的人類自我意識,只有“橡皮筋追求放松”的物理本能,以及極其優雅的微積分乘法連坐。幾百億參數的大模型,其智能就這樣從冰冷的誤差和梯度公式里涌現了出來。


      謝謝辛頓教授,這是我聽過最精彩的一堂深度學習降維課!

      本文部分文字來自辛頓近期在播客中的講話。

      想了解如何生成本文的圖文表達?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      全球首款2nm旗艦賣爆!三星Galaxy S26系列銷量突破150萬臺

      全球首款2nm旗艦賣爆!三星Galaxy S26系列銷量突破150萬臺

      快科技
      2026-03-04 20:37:10
      中國警告日本政府,一旦戰爭爆發,日本將會有4個方面的下場

      中國警告日本政府,一旦戰爭爆發,日本將會有4個方面的下場

      興史興談
      2026-01-13 01:18:53
      沈夢辰和維嘉在長沙街道上被偶遇,沈夢辰身材好好,維嘉打扮年輕

      沈夢辰和維嘉在長沙街道上被偶遇,沈夢辰身材好好,維嘉打扮年輕

      草莓解說體育
      2026-03-05 17:58:17
      德國那位軍事專家說得夠直白:美國不是怕中國,是怕打了也白打

      德國那位軍事專家說得夠直白:美國不是怕中國,是怕打了也白打

      扶蘇聊歷史
      2026-01-28 18:04:09
      他們把困在迪拜的飛行員被接回去了?。。?>
    </a>
        <h3>
      <a href=他們把困在迪拜的飛行員被接回去了!!! 中國民航人
      2026-03-05 15:42:52
      不查不知道一查嚇一跳,掌管少林寺38年的釋永信,私下到底多享受

      不查不知道一查嚇一跳,掌管少林寺38年的釋永信,私下到底多享受

      芳芳歷史燴
      2026-03-04 22:59:51
      艾哈邁德·瓦希迪將擔任伊朗伊斯蘭革命衛隊總司令

      艾哈邁德·瓦希迪將擔任伊朗伊斯蘭革命衛隊總司令

      財聯社
      2026-03-01 15:42:18
      美國威脅切斷與西班牙貿易關系 西班牙首相回應:西班牙拒絕戰爭

      美國威脅切斷與西班牙貿易關系 西班牙首相回應:西班牙拒絕戰爭

      國際在線
      2026-03-05 15:25:59
      體制內有以下副業,紀委不會查!

      體制內有以下副業,紀委不會查!

      微法官
      2026-02-23 08:24:43
      伊朗大局已定

      伊朗大局已定

      可讀一二
      2026-03-03 23:23:17
      謝娜撕薛之謙,張杰前女友參戰,一場瓜見三位選秀歌手的人生差距

      謝娜撕薛之謙,張杰前女友參戰,一場瓜見三位選秀歌手的人生差距

      日不西沉
      2026-03-05 07:43:56
      小姑子把一碗湯潑我頭上,全家都在笑,一周后她的飯店全關門停業

      小姑子把一碗湯潑我頭上,全家都在笑,一周后她的飯店全關門停業

      千秋文化
      2026-03-02 20:56:45
      給人養了7年閑人,廣汽終于要關閉洛杉磯的研發中心

      給人養了7年閑人,廣汽終于要關閉洛杉磯的研發中心

      與車同樂
      2025-12-04 10:05:02
      剛剛官宣!醫保加24、養老金加20,全國統一兌現

      剛剛官宣!醫保加24、養老金加20,全國統一兌現

      李博世財經
      2026-03-05 13:58:17
      政府工作報告明確支持推廣春秋假!多地中小學生將在4月1日首批“喜提”春假,成都出發飛麗江、三亞機票量已激增5倍

      政府工作報告明確支持推廣春秋假!多地中小學生將在4月1日首批“喜提”春假,成都出發飛麗江、三亞機票量已激增5倍

      每日經濟新聞
      2026-03-05 12:06:44
      體制內公示期有多恐怖?過來人說出實情:能捅你一刀的,都是熟人

      體制內公示期有多恐怖?過來人說出實情:能捅你一刀的,都是熟人

      妍妍教育日記
      2026-01-10 12:48:21
      擁抱時,女人若肯讓你碰這5處“禁地”,便是把心交給你了

      擁抱時,女人若肯讓你碰這5處“禁地”,便是把心交給你了

      小影的娛樂
      2026-03-03 05:16:00
      1979年,張國燾凍死在養老院,許世友:除了主席,沒人是他的對手

      1979年,張國燾凍死在養老院,許世友:除了主席,沒人是他的對手

      文史季季紅
      2026-03-05 13:35:03
      極端女權是如何毀掉一個國家的?

      極端女權是如何毀掉一個國家的?

      激情與榮耀并存
      2026-02-22 16:32:06
      終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

      終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

      福建平子
      2026-01-28 10:52:25
      2026-03-06 04:31:00
      孤獨大腦 incentive-icons
      孤獨大腦
      關于思考的思考
      312文章數 2241關注度
      往期回顧 全部

      科技要聞

      獨家|林俊旸辭職 我們和認識他的人聊了聊

      頭條要聞

      伊朗:已作好準備應對美國地面行動

      頭條要聞

      伊朗:已作好準備應對美國地面行動

      體育要聞

      不開玩笑,沒人想在季后賽碰上黃蜂

      娛樂要聞

      謝娜下場撕薛之謙,張杰前女友爆猛料

      財經要聞

      “十五五”開局之年,這么干!

      汽車要聞

      15.98萬元起 第三代領克03大尾翼版上市

      態度原創

      家居
      手機
      教育
      時尚
      軍事航空

      家居要聞

      奶白柔境 閑臥享時光

      手機要聞

      不到200g的小屏旗艦塞進7500mAh電池!一加15T手感穩了

      教育要聞

      華南理工大學公開招聘專職輔導員!

      顯白的奶茶色,穿出春日味道

      軍事要聞

      2026年中國國防預算增長7%

      無障礙瀏覽 進入關懷版