<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      《自然》發(fā)表“AI教父”辛頓的FF算法在卷積神經(jīng)網(wǎng)絡(luò)中的最新系統(tǒng)擴(kuò)展,這是類腦學(xué)習(xí)的重大進(jìn)步

      0
      分享至

      深度學(xué)習(xí)的崛起幾乎完全依賴于反向傳播(Backpropagation, BP)算法。BP通過鏈?zhǔn)椒▌t逐層計(jì)算梯度,使得數(shù)以百萬計(jì)的參數(shù)能夠在訓(xùn)練過程中不斷調(diào)整。

      然而,這一方法在實(shí)際應(yīng)用中存在顯著局限,BP需要存儲(chǔ)大量中間激活值,導(dǎo)致顯存消耗極高,BP依賴的計(jì)算模式在類腦硬件或非傳統(tǒng)計(jì)算架構(gòu)上難以實(shí)現(xiàn),從生物學(xué)角度看,人腦的學(xué)習(xí)機(jī)制與BP存在根本差異,這使得BP在“類腦學(xué)習(xí)”的探索中顯得不夠自然。

      在這樣的背景下,Geoffrey Hinton 在 2022 年提出了Forward–Forward (FF) 算法。這一方法完全摒棄了反向傳播,而是通過兩次前向傳播來完成學(xué)習(xí):一次輸入正樣本(圖像與正確標(biāo)簽),一次輸入負(fù)樣本(圖像與錯(cuò)誤標(biāo)簽),并利用局部定義的“goodness函數(shù)”來更新權(quán)重。FF算法的提出不僅是對(duì)深度學(xué)習(xí)訓(xùn)練方式的挑戰(zhàn),更是對(duì)生物學(xué)啟發(fā)式學(xué)習(xí)的一次探索。

      FF算法最初僅在全連接網(wǎng)絡(luò)中得到驗(yàn)證,如何將其擴(kuò)展到卷積神經(jīng)網(wǎng)絡(luò)(CNN)這一圖像處理的核心架構(gòu),成為亟待解決的問題。

      11 月 5 日,《自然》發(fā)表研究團(tuán)隊(duì)首次系統(tǒng)性地將FF算法應(yīng)用于CNN 的最新成果,并提出了兩種新的空間標(biāo)簽策略,基于傅里葉波的標(biāo)簽與基于形態(tài)學(xué)變換的標(biāo)簽。這一創(chuàng)新使得卷積層能夠在全局范圍內(nèi)捕捉標(biāo)簽信息,避免了傳統(tǒng) one-hot 標(biāo)簽在局部嵌入時(shí)的缺陷。

      研究由來自德國哥廷根的跨學(xué)科團(tuán)隊(duì)完成,他們是Riccardo Scodellaro, Ajinkya Kulkarni, FraukeAlves& Matthias Schr?ter,成員橫跨Max Planck Institute for Multidisciplinary SciencesUniversity Medical Center G?ttingen以及Max Planck Institute for Dynamics and Self-Organization。他們的研究方向涵蓋分子影像學(xué)、血液學(xué)與腫瘤學(xué)、放射學(xué)以及復(fù)雜系統(tǒng)物理學(xué),體現(xiàn)了醫(yī)學(xué)影像、人工智能與復(fù)雜系統(tǒng)理論的交叉融合。這種跨學(xué)科背景為FF算法在CNN中的應(yīng)用提供了堅(jiān)實(shí)的理論與實(shí)踐支撐。

      01

      工作綜述

      反向傳播雖然是深度學(xué)習(xí)的基石,但其局限性早已引發(fā)廣泛關(guān)注。BP的存儲(chǔ)開銷巨大,訓(xùn)練大型模型時(shí)顯存需求往往是權(quán)重存儲(chǔ)的數(shù)倍。其次,BP在類腦硬件或非傳統(tǒng)計(jì)算架構(gòu)上難以實(shí)現(xiàn),限制了其在低能耗計(jì)算中的應(yīng)用。BP與生物神經(jīng)系統(tǒng)的學(xué)習(xí)機(jī)制差異明顯,使得其在“類腦學(xué)習(xí)”探索中缺乏生物學(xué)合理性。

      為解決這些問題,研究者提出了多種替代方法。

      1.Hebbian學(xué)習(xí)與對(duì)比Hebbian學(xué)習(xí):基于“神經(jīng)元共同激活則連接增強(qiáng)”的局部學(xué)習(xí)規(guī)則,強(qiáng)調(diào)生物學(xué)動(dòng)機(jī)。

      2.平衡傳播(Equilibrium Propagation):在能量模型框架下,通過網(wǎng)絡(luò)的自由態(tài)與約束態(tài)差異來驅(qū)動(dòng)學(xué)習(xí),連接了Hopfield網(wǎng)絡(luò)與梯度下降。

      3.反饋對(duì)齊(Feedback Alignment)、PEPITA等局部學(xué)習(xí)規(guī)則:通過局部誤差信號(hào)或隨機(jī)投影來更新權(quán)重,避免了逐層反向傳播。

      4.零階優(yōu)化與能量模型:通過兩次前向傳播的差異來近似梯度,雖然效率較低,但在現(xiàn)代改進(jìn)下已具備競爭力。

      在這一廣闊的探索背景下,Hinton提出的Forward–Forward算法屬于局部學(xué)習(xí)規(guī)則的范疇。它通過正負(fù)樣本的 goodness 差異來驅(qū)動(dòng)權(quán)重更新,避免了反向傳播的復(fù)雜性。早期應(yīng)用主要集中在全連接網(wǎng)絡(luò),隨后擴(kuò)展到圖神經(jīng)網(wǎng)絡(luò)、光學(xué)神經(jīng)網(wǎng)絡(luò)以及類腦硬件實(shí)驗(yàn)。然而在卷積神經(jīng)網(wǎng)絡(luò)這一主流架構(gòu)中,F(xiàn)F算法的應(yīng)用仍是空白。本研究正是填補(bǔ)這一缺口的首次系統(tǒng)性嘗試。

      02

      研究創(chuàng)新點(diǎn)

      在這項(xiàng)研究中,最具突破性的貢獻(xiàn)是提出了兩種全新的空間擴(kuò)展標(biāo)簽策略,它們直接回應(yīng)了 Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中面臨的核心難題。Hinton 在最初的設(shè)計(jì)中采用的是one-hot 標(biāo)簽嵌入,即將類別信息編碼在圖像左上角的幾個(gè)像素中。

      然而這種方式在全連接網(wǎng)絡(luò)中尚可行,但在卷積神經(jīng)網(wǎng)絡(luò)中卻存在天然缺陷,卷積核在不同空間位置滑動(dòng)時(shí),往往無法捕捉到局部嵌入的標(biāo)簽信息,導(dǎo)致網(wǎng)絡(luò)難以利用標(biāo)簽進(jìn)行有效學(xué)習(xí)。

      為了解決這一問題,研究團(tuán)隊(duì)提出了兩種空間化的標(biāo)簽嵌入方法,使得類別信息能夠在整張圖像中均勻分布,從而保證卷積層在任意位置都能感知到標(biāo)簽信號(hào)。

      第一種方法是傅里葉波標(biāo)簽。研究者為每個(gè)類別生成一組獨(dú)特的灰度波紋,這些波紋由頻率、相位和方向的不同組合構(gòu)成。通過將這種波紋圖像與原始數(shù)據(jù)進(jìn)行像素級(jí)疊加,標(biāo)簽信息被擴(kuò)展到整個(gè)圖像空間。這樣一來,卷積核在任何位置都能捕捉到與類別相關(guān)的模式,從而避免了局部標(biāo)簽缺失的問題。傅里葉波標(biāo)簽的優(yōu)勢在于其數(shù)學(xué)上的可控性和全局一致性,能夠?yàn)榫W(wǎng)絡(luò)提供一種穩(wěn)定的類別信號(hào)。

      第二種方法是形態(tài)學(xué)標(biāo)簽。與傅里葉波的全局波紋不同,形態(tài)學(xué)標(biāo)簽通過對(duì)原始圖像施加一組確定性的形態(tài)學(xué)變換來嵌入類別信息,例如膨脹、腐蝕、旋轉(zhuǎn)或其他幾何操作。每個(gè)類別對(duì)應(yīng)一組獨(dú)特的變換組合,這些變換會(huì)改變圖像的結(jié)構(gòu)特征,從而迫使網(wǎng)絡(luò)在學(xué)習(xí)過程中關(guān)注圖像的形態(tài)差異,而不是依賴簡單的標(biāo)簽?zāi)J?。形態(tài)學(xué)標(biāo)簽的優(yōu)勢在于它能有效避免“捷徑解”——即網(wǎng)絡(luò)僅僅依賴標(biāo)簽的簡單模式來區(qū)分正負(fù)樣本,而忽視了圖像本身的復(fù)雜特征。

      這兩種空間擴(kuò)展標(biāo)簽策略的提出,直接解決了 CNN 在 FF 框架下的關(guān)鍵問題:如何讓卷積核在全局范圍內(nèi)感知類別信息。它們不僅保證了標(biāo)簽信號(hào)的空間可達(dá)性,還通過不同的機(jī)制引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)更深層次的特征。傅里葉波標(biāo)簽提供了全局一致的模式,而形態(tài)學(xué)標(biāo)簽則強(qiáng)化了對(duì)圖像結(jié)構(gòu)的關(guān)注。兩者結(jié)合,為 FF-CNN 的訓(xùn)練提供了新的可能性。

      從更宏觀的角度來看,這一創(chuàng)新點(diǎn)不僅是技術(shù)上的改進(jìn),更是理念上的突破。它體現(xiàn)了研究團(tuán)隊(duì)在類腦學(xué)習(xí)與卷積架構(gòu)結(jié)合上的深度思考:如果我們希望擺脫反向傳播的限制,就必須重新設(shè)計(jì)標(biāo)簽與數(shù)據(jù)的交互方式,讓網(wǎng)絡(luò)在前向傳播中就能充分利用類別信息。這種思路為未來的類腦計(jì)算和低能耗硬件實(shí)現(xiàn)提供了重要啟示。

      03

      方法與實(shí)現(xiàn)

      在針對(duì) MNIST 數(shù)據(jù)集 的實(shí)驗(yàn)中,研究團(tuán)隊(duì)設(shè)計(jì)了一種由三層連續(xù)卷積結(jié)構(gòu)組成的網(wǎng)絡(luò)架構(gòu)。每一層均采用相同數(shù)量的濾波器矩陣,這一參數(shù)也是實(shí)驗(yàn)中重點(diǎn)考察的超參數(shù)之一。值得注意的是,網(wǎng)絡(luò)中沒有引入最大池化層,因?yàn)樵陬A(yù)實(shí)驗(yàn)中發(fā)現(xiàn)池化操作會(huì)降低整體準(zhǔn)確率。

      數(shù)據(jù)流動(dòng)過程可以概括為:輸入圖像與其正負(fù)標(biāo)簽依次通過三層卷積,每層之后都進(jìn)行 層歸一化(Layer Normalization) 和 ReLU 激活。在每一層中,正負(fù)樣本的激活差異被用于計(jì)算該層的 sigmoid 函數(shù)輸出,從而形成局部的判別信號(hào)。


      圖1:空間擴(kuò)展標(biāo)簽存在于整個(gè)圖像中,而一個(gè)熱編碼僅限于左上角區(qū)域。對(duì)于FF訓(xùn)練,我們需要兩個(gè)數(shù)據(jù)集,它們都為圖像添加標(biāo)簽。第一行描述了陽性數(shù)據(jù)集的創(chuàng)建,其中示例圖像被正確標(biāo)記。最下面一行顯示了陰性數(shù)據(jù)集的示例,其中圖像與從其他可能標(biāo)簽中隨機(jī)選擇的假標(biāo)簽相結(jié)合。我們展示了添加標(biāo)簽的三種方法。(a)和(b)描述了Hinton使用的單熱編碼:圖像頂行的第一個(gè)像素用作指示符。在該示例中,設(shè)置為1的單個(gè)像素的列數(shù)對(duì)應(yīng)于目標(biāo)值。(c)和(d)描述了我們提出的基于傅里葉的技術(shù)。每個(gè)標(biāo)簽對(duì)應(yīng)于與輸入大小相同的圖像,但具有特征灰度值波。標(biāo)簽通過逐像素相加的方式包含在圖像中。(e)和(f)顯示了我們提出的基于形態(tài)學(xué)的方法。每個(gè)標(biāo)簽都與一組獨(dú)特的變換相關(guān)聯(lián),這些變換會(huì)影響圖像形態(tài),迫使網(wǎng)絡(luò)專注于圖像特征。

      在數(shù)學(xué)定義上,優(yōu)度(goodness)被設(shè)定為該層所有激活值的平方和:


      在損失函數(shù)設(shè)計(jì)上,研究者并未采用文獻(xiàn)中提出的對(duì)稱性方案,而是借鑒了其他工作提出的累積網(wǎng)絡(luò)損失,即通過將各層損失相加來增強(qiáng)層間協(xié)作。但與傳統(tǒng)做法不同的是,本文排除了第一層的損失。原因在于第一層的激活向量長度本身就能區(qū)分正負(fù)樣本,如果過度依賴這一信息,后續(xù)層將無法學(xué)習(xí)更復(fù)雜的特征。通過舍棄第一層的損失,網(wǎng)絡(luò)被迫依賴相對(duì)激活模式,從而在更深層次上提取有意義的特征。這一做法與 Hinton 在原始實(shí)現(xiàn)中的選擇保持一致。

      在訓(xùn)練細(xì)節(jié)上,團(tuán)隊(duì)遵循了兩點(diǎn)關(guān)鍵實(shí)現(xiàn)。

      • 層歸一化:對(duì)每個(gè)激活值進(jìn)行歸一化,使后續(xù)層只能利用前一層的模式信息,而非整體范數(shù)。
      • 學(xué)習(xí)率線性冷卻:在訓(xùn)練周期中途調(diào)整學(xué)習(xí)率,公式如下:


      其中,E 表示總訓(xùn)練輪數(shù),e 為當(dāng)前輪數(shù)。

      為了分析各層的貢獻(xiàn),研究者定義了基于層的判別損失與準(zhǔn)確率。Sigmoid 輸出被解釋為概率,當(dāng)值大于 0.5 時(shí),表示該層將圖像識(shí)別為正樣本。通過與真實(shí)標(biāo)簽比較,可以得到判別準(zhǔn)確率,并進(jìn)一步計(jì)算二元交叉熵?fù)p失。

      推理階段,網(wǎng)絡(luò)提供了兩種方案:

      • 線性分類器:除第一層外,每層的 HH 個(gè)神經(jīng)元與一個(gè)包含 NN 個(gè)節(jié)點(diǎn)的分類層全連接,節(jié)點(diǎn)數(shù)等于類別數(shù)。權(quán)重通過交叉熵?fù)p失訓(xùn)練,這是默認(rèn)的推理方式。
      • 優(yōu)度評(píng)估:每張圖像與所有可能的標(biāo)簽組合進(jìn)行前向傳播,計(jì)算每個(gè)標(biāo)簽的優(yōu)度值,最終選擇優(yōu)度最大的標(biāo)簽作為預(yù)測結(jié)果:


      其中,對(duì)于每個(gè)關(guān)聯(lián)的標(biāo)簽m,其優(yōu)度表示為


      其中H是除第一層神經(jīng)元之外的所有神經(jīng)元的數(shù)量。

      CIFAR10 與 CIFAR100的實(shí)驗(yàn)中,研究團(tuán)隊(duì)采用了更深的網(wǎng)絡(luò)結(jié)構(gòu)。具體而言,網(wǎng)絡(luò)擴(kuò)展為六層卷積,并將層歸一化替換為批歸一化(Batch Normalization),以提升訓(xùn)練穩(wěn)定性。這一設(shè)計(jì)參考了已有文獻(xiàn)中的優(yōu)化方法,同時(shí)保持空間擴(kuò)展標(biāo)簽策略不變。


      圖2:應(yīng)用于MNIST數(shù)據(jù)集的FF訓(xùn)練CNN的示意圖。正負(fù)樣本通過三個(gè)卷積層進(jìn)行處理,每個(gè)卷積層都經(jīng)過層歸一化和ReLU激活。在每一層,使用正樣本和負(fù)樣本的二元交叉熵計(jì)算優(yōu)度函數(shù)。然后,可以通過線性分類器或通過評(píng)估所有標(biāo)簽的優(yōu)度得分來進(jìn)行最終分類。

      這種方法的獨(dú)特之處在于,它完全摒棄了反向傳播的鏈?zhǔn)教荻扔?jì)算,而是通過局部 goodness 函數(shù)的優(yōu)化來驅(qū)動(dòng)學(xué)習(xí)。正負(fù)樣本的對(duì)比機(jī)制讓網(wǎng)絡(luò)在沒有反向傳播的情況下,依然能夠逐層提取有意義的特征。

      從整體來看,方法與實(shí)現(xiàn)部分展示了 FF 算法在 CNN 中的完整落地:通過空間擴(kuò)展標(biāo)簽保證卷積核能捕捉類別信息,通過 goodness 函數(shù)定義訓(xùn)練目標(biāo),再通過跨層累計(jì)損失與雙重推理方式實(shí)現(xiàn)分類。這一框架不僅在數(shù)學(xué)上自洽,也為未來在類腦硬件上的應(yīng)用提供了可行路徑。

      04

      實(shí)驗(yàn)結(jié)果與分析

      在實(shí)驗(yàn)部分,研究團(tuán)隊(duì)通過對(duì)MNIST、CIFAR10、CIFAR100三個(gè)經(jīng)典數(shù)據(jù)集的系統(tǒng)測試,驗(yàn)證了 Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中的可行性與局限性。結(jié)果不僅展示了 FF 與傳統(tǒng)反向傳播(BP)的性能對(duì)比,也揭示了空間擴(kuò)展標(biāo)簽策略在復(fù)雜數(shù)據(jù)集上的關(guān)鍵作用。

      MNIST數(shù)據(jù)集上,F(xiàn)F-CNN 的表現(xiàn)幾乎與 BP-CNN 持平。采用三層卷積結(jié)構(gòu)(每層 128 個(gè) 7×7 卷積核),F(xiàn)F-CNN在測試集上取得了99.16% 的精度,而BP-CNN 的精度為99.13%。這表明在簡單數(shù)據(jù)集上,F(xiàn)F 算法完全能夠替代 BP。然而,訓(xùn)練動(dòng)態(tài)上存在差異:FF 收斂速度較慢,需要更多迭代才能達(dá)到穩(wěn)定精度,但其內(nèi)存消耗顯著降低,約為 BP 的25–30%。這意味著在硬件受限的場景下,F(xiàn)F 算法具有明顯優(yōu)勢。


      圖3:FF訓(xùn)練的CNN架構(gòu)的最佳MNIST性能與相同架構(gòu)的反向傳播訓(xùn)練的CNN的結(jié)果相當(dāng)。(a)在批量大小為50的200個(gè)迭代訓(xùn)練后,根據(jù)每層濾波器的數(shù)量,為具有三個(gè)卷積層的CNN獲得的精度值。濾波器大小為7乘以7,學(xué)習(xí)率分別設(shè)置為FF的5x10-5和BP的10-3的最佳值。FF訓(xùn)練的網(wǎng)絡(luò)使用來自集合1的標(biāo)簽和35%的標(biāo)簽強(qiáng)度K。BP和FF的報(bào)告值是從驗(yàn)證數(shù)據(jù)中收集的。綠色數(shù)據(jù)點(diǎn)顯示了與FF訓(xùn)練網(wǎng)絡(luò)相關(guān)的結(jié)果,并使用優(yōu)度比較進(jìn)行推理。在這種情況下,使用(b)中報(bào)告的相應(yīng)混淆矩陣所示的測試數(shù)據(jù),每層128個(gè)濾波器實(shí)現(xiàn)了99.16±0.02%的準(zhǔn)確率。(c)顯示了為區(qū)分有助于訓(xùn)練的每個(gè)隱藏層的正負(fù)訓(xùn)練數(shù)據(jù)而計(jì)算的損失(紅線和藍(lán)線),以及訓(xùn)練期間使用的組合損失(綠線)。(d)顯示相同隱藏層的辨別精度(紅線和藍(lán)線)以及訓(xùn)練期間獲得的總精度(綠線)。

      在更具挑戰(zhàn)性的CIFAR10數(shù)據(jù)集上,差異開始顯現(xiàn)。傳統(tǒng) BP-CNN 的精度約為85.4%,而 FF-CNN 的表現(xiàn)依賴于標(biāo)簽策略:采用傅里葉波標(biāo)簽時(shí)精度為60.9%,而采用形態(tài)學(xué)標(biāo)簽時(shí)提升至68.6%。這一結(jié)果凸顯了標(biāo)簽設(shè)計(jì)的重要性。傅里葉波標(biāo)簽提供了全局一致的信號(hào),但在復(fù)雜圖像中容易被網(wǎng)絡(luò)當(dāng)作“捷徑”,導(dǎo)致模型忽視圖像本身的細(xì)節(jié)。而形態(tài)學(xué)標(biāo)簽通過改變圖像結(jié)構(gòu),迫使網(wǎng)絡(luò)關(guān)注真實(shí)的形態(tài)特征,從而有效避免了捷徑解,提升了分類性能。

      CIFAR100數(shù)據(jù)集上,研究團(tuán)隊(duì)進(jìn)一步驗(yàn)證了空間擴(kuò)展標(biāo)簽的可擴(kuò)展性。通過優(yōu)化標(biāo)簽集(從 2000 個(gè)候選模式中挑選出相關(guān)性最低的 100 個(gè)組合),F(xiàn)F-CNN 的精度穩(wěn)定在37–38%。雖然這一結(jié)果仍顯著低于 BP 的表現(xiàn),但它證明了空間標(biāo)簽策略能夠在百類任務(wù)中保持區(qū)分度,具備一定的擴(kuò)展能力。


      圖4:FF和BP訓(xùn)練的CNN的CAM顯示了網(wǎng)絡(luò)在進(jìn)行預(yù)測時(shí)認(rèn)為哪些圖像區(qū)域是有益的(黃色)或有害的(粉紅色)。(a)-(d)顯示四個(gè)輸入圖像。(e)-(h)和(i)-(l)分別是基于FF和BP培訓(xùn)的CAM。所有的例子都來自一個(gè)每層有16個(gè)卷積神經(jīng)元的網(wǎng)絡(luò),濾波器大小為5×5,在200個(gè)迭代周期內(nèi)用50個(gè)批量進(jìn)行訓(xùn)練。FF學(xué)習(xí)率:5×10^-5,BP學(xué)習(xí)率:1×10^-3。

      整體來看,實(shí)驗(yàn)結(jié)果揭示了 FF-CNN 的雙重特性:在簡單數(shù)據(jù)集上,它能夠與 BP 相媲美,并且在硬件資源有限的場景下更具優(yōu)勢;在復(fù)雜數(shù)據(jù)集上,性能依賴于標(biāo)簽策略,形態(tài)學(xué)標(biāo)簽展現(xiàn)出更強(qiáng)的魯棒性與合理性。盡管 FF 在精度上仍落后于 BP,但其訓(xùn)練機(jī)制的生物學(xué)合理性與硬件友好性,使其成為未來類腦計(jì)算與低能耗 AI 的潛在候選方案。

      這種結(jié)果也提示我們,F(xiàn)F 算法的真正價(jià)值或許并不在于直接替代 BP,而在于為深度學(xué)習(xí)提供一種新的思路:通過標(biāo)簽與數(shù)據(jù)的空間交互,推動(dòng)網(wǎng)絡(luò)在前向傳播中完成學(xué)習(xí)。這種理念在未來的 neuromorphic computing(類腦計(jì)算)平臺(tái)上,可能會(huì)展現(xiàn)出更大的優(yōu)勢。

      05

      可解釋性與學(xué)習(xí)動(dòng)態(tài)

      在 Forward–Forward (FF) 算法擴(kuò)展到卷積神經(jīng)網(wǎng)絡(luò)的過程中,研究團(tuán)隊(duì)特別強(qiáng)調(diào)了模型的可解釋性與訓(xùn)練動(dòng)態(tài)。這不僅是為了驗(yàn)證 FF-CNN 是否真正學(xué)到了有意義的特征,更是為了理解其在復(fù)雜數(shù)據(jù)集上的表現(xiàn)差異。

      首先,研究者利用Class Activation Maps (CAMs)對(duì) FF-CNN 的學(xué)習(xí)過程進(jìn)行了可視化分析。CAMs 是一種解釋性工具,可以揭示網(wǎng)絡(luò)在做出分類決策時(shí)關(guān)注的圖像區(qū)域。實(shí)驗(yàn)結(jié)果顯示,F(xiàn)F-CNN 的不同卷積層往往學(xué)習(xí)到互補(bǔ)的特征。例如,在識(shí)別數(shù)字“7”時(shí),某一層可能更關(guān)注水平線的內(nèi)部結(jié)構(gòu),而另一層則聚焦于邊緣輪廓。這種分層互補(bǔ)的特征學(xué)習(xí)表明,盡管 FF 算法不依賴反向傳播,它依然能夠逐層構(gòu)建出有意義的表示,并在整體上形成對(duì)圖像的全面理解。相比之下,傳統(tǒng) BP-CNN 的特征分布更趨于集中,而 FF-CNN 的特征呈現(xiàn)出更強(qiáng)的多樣性和分工性。


      圖5:選擇不同的空間標(biāo)簽會(huì)影響學(xué)習(xí)過程。(a)和(b)顯示了在CIFAR10數(shù)據(jù)集上測試的FF訓(xùn)練的CNN的隱藏層的二進(jìn)制精度值(區(qū)分正負(fù)數(shù)據(jù)集的能力)。雖然第一層專注于更簡單和更粗糙的圖像特征,在兩種標(biāo)記策略下表現(xiàn)相似,但深層受益于基于形態(tài)學(xué)的標(biāo)記,但當(dāng)標(biāo)記是簡單的圖案時(shí),它們會(huì)受到阻礙。給定相同的數(shù)據(jù)集圖像(c)和(f),與基于形態(tài)學(xué)的標(biāo)記(d)和(g)相關(guān)的歸一化CAM產(chǎn)生的最大值主要局限于圖像邊界(e,h)。

      其次,訓(xùn)練穩(wěn)定性成為 FF-CNN 的一個(gè)關(guān)鍵議題。研究發(fā)現(xiàn),F(xiàn)F 算法對(duì)標(biāo)簽設(shè)計(jì)極為敏感。若標(biāo)簽過于簡單(如傅里葉波標(biāo)簽),網(wǎng)絡(luò)可能會(huì)走向“捷徑解”,即僅依賴標(biāo)簽?zāi)J蕉鲆晥D像本身的復(fù)雜特征;而形態(tài)學(xué)標(biāo)簽則能迫使網(wǎng)絡(luò)關(guān)注圖像結(jié)構(gòu),從而獲得更穩(wěn)健的收斂路徑。這種敏感性意味著 FF-CNN 的訓(xùn)練過程可能出現(xiàn)不同的收斂軌跡,類似于動(dòng)力系統(tǒng)中的分岔現(xiàn)象:在相同的初始條件下,網(wǎng)絡(luò)可能因標(biāo)簽設(shè)計(jì)或參數(shù)微小差異而收斂到完全不同的解。

      這種分岔特性既是挑戰(zhàn),也是機(jī)遇。一方面,它揭示了 FF 算法的非線性與復(fù)雜性,說明其學(xué)習(xí)動(dòng)態(tài)比傳統(tǒng) BP 更難以預(yù)測和控制;另一方面,它也為研究類腦學(xué)習(xí)提供了新的視角——生物神經(jīng)系統(tǒng)的學(xué)習(xí)過程本身就充滿不確定性和多樣性,F(xiàn)F 算法的這種特性或許更接近真實(shí)的神經(jīng)學(xué)習(xí)機(jī)制。

      綜上,F(xiàn)F-CNN 的可解釋性分析表明,它能夠在不同層次上學(xué)習(xí)互補(bǔ)特征,而訓(xùn)練動(dòng)態(tài)的分岔現(xiàn)象則提醒我們,標(biāo)簽設(shè)計(jì)與參數(shù)選擇在這一框架下至關(guān)重要。這不僅是技術(shù)上的挑戰(zhàn),更是理解類腦學(xué)習(xí)與人工智能之間關(guān)系的重要窗口。

      06

      應(yīng)用前景與挑戰(zhàn)

      Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中的擴(kuò)展,展示了其獨(dú)特的應(yīng)用潛力。首先,它的最大優(yōu)勢在于局部更新與低內(nèi)存需求。與反向傳播需要存儲(chǔ)大量中間激活值不同,F(xiàn)F 算法只依賴局部的 goodness 函數(shù)進(jìn)行權(quán)重更新,這使得訓(xùn)練過程更加輕量化,尤其適合在顯存有限或硬件受限的環(huán)境中運(yùn)行。

      其次,F(xiàn)F 算法的機(jī)制天然契合類腦硬件的實(shí)現(xiàn)。在 neuromorphic computing(類腦計(jì)算)平臺(tái)上,反向傳播往往難以實(shí)現(xiàn),而 FF 的雙前向傳播與局部更新則更接近生物神經(jīng)系統(tǒng)的學(xué)習(xí)方式。這意味著 FF-CNN 有望成為未來低能耗硬件和類腦芯片上的重要候選算法。

      此外,F(xiàn)F 算法本身就是一種生物學(xué)啟發(fā)的學(xué)習(xí)機(jī)制。它通過正負(fù)樣本的對(duì)比來驅(qū)動(dòng)學(xué)習(xí),類似于神經(jīng)系統(tǒng)在強(qiáng)化與抑制之間的動(dòng)態(tài)平衡。這種機(jī)制不僅為人工智能提供了新的訓(xùn)練思路,也為理解人類大腦的學(xué)習(xí)過程提供了可能的模型。

      然而,挑戰(zhàn)同樣顯而易見。首先,F(xiàn)F 的推理計(jì)算開銷較大。在 goodness 比較模式下,每個(gè)輸入需要與所有可能的標(biāo)簽組合進(jìn)行前向傳播,這在多類別任務(wù)中會(huì)顯著增加計(jì)算量。其次,F(xiàn)F 算法的理論收斂性尚未嚴(yán)格證明,其訓(xùn)練動(dòng)態(tài)存在分岔現(xiàn)象,意味著結(jié)果可能因標(biāo)簽設(shè)計(jì)或參數(shù)微小差異而大幅不同。最后,在復(fù)雜數(shù)據(jù)集上,F(xiàn)F-CNN 的表現(xiàn)仍明顯落后于 BP-CNN,尤其是在 CIFAR10 和 CIFAR100 上,精度差距較大。這表明 FF 算法在實(shí)際應(yīng)用中仍需進(jìn)一步優(yōu)化。

      07

      結(jié)論與展望

      綜合來看,本文的研究證明了FF 算法在 CNN 中的可行性。通過空間擴(kuò)展標(biāo)簽策略,研究團(tuán)隊(duì)解決了卷積核無法捕捉局部標(biāo)簽信息的問題,使得 FF-CNN 能夠在圖像任務(wù)中實(shí)現(xiàn)有效訓(xùn)練。這一創(chuàng)新不僅是技術(shù)上的突破,更是理念上的轉(zhuǎn)變:它強(qiáng)調(diào)在前向傳播中完成學(xué)習(xí),而非依賴反向傳播的鏈?zhǔn)教荻取?/p>

      展望未來,F(xiàn)F 算法的應(yīng)用潛力主要集中在三個(gè)方向。首先是類腦硬件,在neuromorphic 芯片和低能耗計(jì)算平臺(tái)上,F(xiàn)F 的局部更新機(jī)制可能展現(xiàn)出更大的優(yōu)勢。其次是無監(jiān)督學(xué)習(xí),F(xiàn)F 的正負(fù)樣本對(duì)比機(jī)制天然適合在缺乏標(biāo)簽的場景中進(jìn)行特征學(xué)習(xí)。再次是對(duì)比學(xué)習(xí),通過擴(kuò)展正負(fù)樣本的構(gòu)造方式,F(xiàn)F 有望與現(xiàn)代自監(jiān)督學(xué)習(xí)方法結(jié)合,提升在復(fù)雜任務(wù)中的表現(xiàn)。

      更深層的意義在于,F(xiàn)F 算法為深度學(xué)習(xí)提供了一條生物學(xué)啟發(fā)的替代路徑。它不僅是對(duì)反向傳播的技術(shù)挑戰(zhàn),更是推動(dòng)人工智能與神經(jīng)科學(xué)交叉發(fā)展的橋梁。隨著研究的深入,我們或許能夠在 FF 框架下找到更接近人腦學(xué)習(xí)機(jī)制的算法,從而為智能計(jì)算開辟新的方向。

      這項(xiàng)研究提醒我們,深度學(xué)習(xí)的未來不止于更大的模型和更強(qiáng)的算力,還可能在于更接近生物本質(zhì)的學(xué)習(xí)方式。Forward–Forward 算法正是這一探索的重要一步。(END)

      參考資料:https://www.nature.com/articles/s41598-025-26235-2


      關(guān)于波動(dòng)智能——

      波動(dòng)智能旨在建立一個(gè)基于人類情緒與反應(yīng)的真實(shí)需求洞察及滿足的價(jià)值體系,融合人工智能與意識(shí)科學(xué),構(gòu)建覆蓋情緒識(shí)別、建模與推薦的智能引擎,自主研發(fā)面向社交、電商等場景的多模態(tài)情緒識(shí)別引擎、情緒標(biāo)簽系統(tǒng)及情緒智能推薦算法,形成從情緒采集、建模到商業(yè)轉(zhuǎn)化的完整解決方案。波動(dòng)智能提出“情緒是連接人、物與內(nèi)容的新型接口”,其產(chǎn)品廣泛應(yīng)用于AI社交、個(gè)性化內(nèi)容推薦、虛擬陪伴、電商體驗(yàn)優(yōu)化等領(lǐng)域。波動(dòng)智能正在探索“EMO-as-a-Service”技術(shù)服務(wù)架構(gòu),賦能企業(yè)實(shí)現(xiàn)更高效的用戶洞察與精準(zhǔn)情緒交互,推動(dòng)從功能驅(qū)動(dòng)到情感驅(qū)動(dòng)的產(chǎn)業(yè)范式升級(jí)。

      親愛的人工智能研究者,為了確保您不會(huì)錯(cuò)過*波動(dòng)智能*的最新推送,請(qǐng)星標(biāo)*波動(dòng)智能*。我們傾心打造并精選每篇內(nèi)容,只為為您帶來啟發(fā)和深思,希望能成為您理性思考路上的伙伴!

      加入AI交流群請(qǐng)掃碼加微信

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      他從正軍職轉(zhuǎn)任副廳職,2年后找老帥、總長、總政主任申訴回部隊(duì)

      他從正軍職轉(zhuǎn)任副廳職,2年后找老帥、總長、總政主任申訴回部隊(duì)

      驚視
      2026-04-04 14:07:43
      上海VS吉林沖擊十六連勝!懷特塞德繼續(xù)統(tǒng)治內(nèi)線,盧偉展望季后賽

      上海VS吉林沖擊十六連勝!懷特塞德繼續(xù)統(tǒng)治內(nèi)線,盧偉展望季后賽

      老葉評(píng)球
      2026-04-04 16:48:31
      廣州早茶新規(guī),5月1日起實(shí)施→

      廣州早茶新規(guī),5月1日起實(shí)施→

      FM96.2廣州新聞電臺(tái)
      2026-04-04 10:16:58
      國安三輪不勝!媒體人熱議:輸球非個(gè)例,戰(zhàn)術(shù)粗線條陣容太單薄

      國安三輪不勝!媒體人熱議:輸球非個(gè)例,戰(zhàn)術(shù)粗線條陣容太單薄

      奧拜爾
      2026-04-04 17:55:30
      臺(tái)積電:我們已經(jīng)顧不上美國工廠了,大陸再不給稀土,大家都得完

      臺(tái)積電:我們已經(jīng)顧不上美國工廠了,大陸再不給稀土,大家都得完

      觸摸史跡
      2026-04-03 21:47:03
      戰(zhàn)功赫赫的紅軍軍團(tuán)長,整編時(shí)竟無人愿收,主席震怒直言純屬瞎胡鬧

      戰(zhàn)功赫赫的紅軍軍團(tuán)長,整編時(shí)竟無人愿收,主席震怒直言純屬瞎胡鬧

      磊子講史
      2026-03-30 15:41:41
      萬科裁員1.25萬人

      萬科裁員1.25萬人

      地產(chǎn)微資訊
      2026-04-03 14:24:44
      北汽集團(tuán)3月銷量超18.2萬輛,同比增長7%

      北汽集團(tuán)3月銷量超18.2萬輛,同比增長7%

      IT之家
      2026-04-04 13:14:17
      《紐約時(shí)報(bào)》:特朗普根本不知道如何收拾自己造成的爛攤子

      《紐約時(shí)報(bào)》:特朗普根本不知道如何收拾自己造成的爛攤子

      奇思妙想生活家
      2026-04-04 15:14:07
      學(xué)醫(yī)后才知道,心衰最危險(xiǎn)信號(hào),不是氣喘,而是頻繁出現(xiàn) 4 種異常

      學(xué)醫(yī)后才知道,心衰最危險(xiǎn)信號(hào),不是氣喘,而是頻繁出現(xiàn) 4 種異常

      今日養(yǎng)生之道
      2026-04-04 13:45:35
      你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

      你們都是什么時(shí)候?qū)δ信麻_竅的?網(wǎng)友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      俘虜表示要露一手,朱德:我給你官當(dāng),俘虜:老哥,你比我還能吹

      俘虜表示要露一手,朱德:我給你官當(dāng),俘虜:老哥,你比我還能吹

      棠棣分享
      2026-04-01 19:10:34
      日本加息,比戰(zhàn)火、油價(jià)更狠!

      日本加息,比戰(zhàn)火、油價(jià)更狠!

      犀利強(qiáng)哥
      2026-04-03 22:04:33
      覆水難收,“兩人的關(guān)系回不去了”

      覆水難收,“兩人的關(guān)系回不去了”

      觀察者網(wǎng)
      2026-04-04 17:14:08
      入世25年,中國的財(cái)神是“WTO!而不是趙公明

      入世25年,中國的財(cái)神是“WTO!而不是趙公明

      律法刑道
      2026-04-04 08:17:06
      張雪峰創(chuàng)造了蘇州歷史

      張雪峰創(chuàng)造了蘇州歷史

      言立方
      2026-04-02 07:38:47
      為楊瀚森入股!二老板操盤,開拓者有望成為“雙中國球員”戰(zhàn)隊(duì)?

      為楊瀚森入股!二老板操盤,開拓者有望成為“雙中國球員”戰(zhàn)隊(duì)?

      民宿體驗(yàn)志
      2026-04-03 15:44:55
      他是男籃名宿,拿過籃板王,如今兒子也進(jìn)CBA,成為頂級(jí)中鋒

      他是男籃名宿,拿過籃板王,如今兒子也進(jìn)CBA,成為頂級(jí)中鋒

      大西體育
      2026-04-04 15:41:40
      日本足球什么水平?8個(gè)世界杯冠軍贏了7個(gè),董路黃健翔各執(zhí)一詞

      日本足球什么水平?8個(gè)世界杯冠軍贏了7個(gè),董路黃健翔各執(zhí)一詞

      夏侯看英超
      2026-04-03 21:28:31
      輕斷食再次封神!復(fù)旦大學(xué)研究證實(shí):讓肝臟脂肪在3月內(nèi)少20.5%?

      輕斷食再次封神!復(fù)旦大學(xué)研究證實(shí):讓肝臟脂肪在3月內(nèi)少20.5%?

      健康科普365
      2026-04-02 10:16:49
      2026-04-04 18:19:00
      人工智能學(xué)家 incentive-icons
      人工智能學(xué)家
      人工智能領(lǐng)域權(quán)威媒體
      4633文章數(shù) 37447關(guān)注度
      往期回顧 全部

      科技要聞

      內(nèi)存一年漲四倍!國產(chǎn)手機(jī)廠商集體漲價(jià)

      頭條要聞

      媒體:失蹤飛行員已成最大危機(jī) 特朗普恐無法體面退場

      頭條要聞

      媒體:失蹤飛行員已成最大危機(jī) 特朗普恐無法體面退場

      體育要聞

      剎不住的泰格·伍茲,口袋里的兩粒藥丸

      娛樂要聞

      闞清子口碑贏了!全開麥跑調(diào)拒絕重唱

      財(cái)經(jīng)要聞

      中微董事長,給半導(dǎo)體潑點(diǎn)冷水

      汽車要聞

      17萬級(jí)海豹07EV 不僅續(xù)航長還有9分鐘滿電的快樂

      態(tài)度原創(chuàng)

      健康
      本地
      手機(jī)
      教育
      藝術(shù)

      干細(xì)胞抗衰4大誤區(qū),90%的人都中招

      本地新聞

      跟著歌聲游安徽,聽古村回響

      手機(jī)要聞

      三星Galaxy Z Wide Fold曝光!4:3橫屏零黑邊:把手機(jī)變平板

      教育要聞

      重磅!13位校長入選!北京市中小學(xué)卓越校長最新名單來了

      藝術(shù)要聞

      西漢巨幅真跡出土!這才是草書的源頭法帖,王羲之也要叫“祖師爺”

      無障礙瀏覽 進(jìn)入關(guān)懷版