在 AI 硬件領域占據主導地位的英偉達 GPU 存在能效較低問題,這也是為什么很多公司在開發專用 AI 芯片的原因。專用硬件可以極大提升 AI 模型的計算速度。
近日,中國科學院微電子研究所(以下簡稱“微電子所”)的一項研究提供了一種新的硬件開發路徑,可實現高能效和可擴展的神經網絡架構。相關論文以《基于磁疇壁隧道結的全自旋神經形態計算硬件中的人工突觸和神經元》(Domain wall magnetic tunnel junction-based artificial synapses and neurons for all-spin neuromorphic hardware)為題發表在 Nature Communications。微電子所博士研究生劉龍為第一作者,微電子所邢國忠研究員、劉明院士為共同通訊作者。
![]()
圖 | DW-MTJ 基全自旋神經形態計算硬件研制及電路實現演示(來源:微電子所)
如今的 AI 領域有一種不斷擴展深度學習模型規模的趨勢。模型變得越來越大,參數量已經達到數萬億級別。這種規模的擴展有助于提高模型的精度和能力,但也帶來了顯著的計算資源和能耗問題,導致高昂的成本和環境影響。
為了應對深度學習的可持續性挑戰,必須在硬件架構級別進行創新,以提高能效和計算效率。
傳統的通用計算芯片(如 GPU 和 CPU)主要都是基于馮·諾依曼架構設計。該架構幾十年來一直是計算機系統的主流架構。然而,這種設計方式面臨著“存儲墻”等問題,極大限制了系統的整體效率,特別是在處理大規模數據時。
隨著計算需求的增加和性能瓶頸的顯現,業界也在積極探索新的架構設計,例如神經形態計算,像英特爾正在開發神經形態芯片 Loihi。
神經形態計算試圖模仿大腦神經元和突觸的結構和功能,以實現更高效的并行處理和低功耗計算,能提供傳統架構無法比擬的性能和效率。
當前的深度神經網絡(如 GPT-4)也是在模仿人腦的生物結構和工作原理,并已在圖像、語音和視頻等多個領域顯示出卓越的優勢。
因此,為大模型等 AI 應用設計專用神經形態芯片正逐漸興起。要將這些 AI 功能集成到硬件芯片中,尤其是神經形態芯片中,需要開發出能模擬深度神經網絡工作原理的高效突觸和神經元器件。
深度神經網絡由多層組成,每一層中的神經元與下一層中的神經元通過突觸連接。這些突觸具有可調整的權重,以優化網絡的性能。每個輸入信號都與相應突觸的權重相乘,然后將這些乘積求和,再經過一個非線性激活函數處理。經過處理后的輸出信號會傳遞到下一層,作為下一層的輸入信號。神經網絡通過這個過程最終能夠處理和分析復雜的數據。
然而,在實際硬件上實現這種高效計算,也就是模擬生物神經元和突觸的功能,存在許多技術難題。
科研人員長期致力于探索基于新型非易失性存儲器(NVMs)和自旋電子器件的硬件實現方案。據微電子所官網了解:“目前,已有多種類型的 NVMs 被用于實現神經網絡中各種運算并顯示出廣闊前景,其中自旋電子器件憑借自身豐富和可控的自旋動力學特性, 被認為是實現模擬突觸和神經元功能的理想候選之一。”
本次研究中,研究人員成功開發了基于全電控磁疇壁(DW)動力學特性的磁疇壁隧道結(DW-MTJ)器件,并實現了線性權重更新和非線性激活函數功能。
實驗證明,這些 DW-MTJ 集成器件能夠實現全自旋人工突觸和神經元功能,為開發高度可擴展的集成神經形態電路奠定了基礎。全自旋意味著所有信號處理都是通過電子的自旋特性完成的,而不是電荷。這種方法可以提高能效和處理速度。
![]()
圖 | 開發的 DW-MTJ 全自旋神經元和神經形態計算電路仿真及硬件實驗驗證(來源:微電子所)
具體來說,研究團隊利用自旋-軌道耦合和界面 Dzyaloshinskii-Moriya 相互作用(DMI)的協同效應,開發了一種可編程的多態突觸器件。該器件能夠在多個狀態之間切換,類似于生物突觸的可塑性,并且具有高可靠性。
計算表明,通過控制 5d 和 3d 原子間距的壓縮,可以增強 DMI 相互作用,從而穩定磁疇壁的釘扎。磁疇壁釘扎指磁疇壁被固定在特定位置,防止其自由移動,從而實現穩定的多態特性。
基于自旋-軌道矩對磁疇壁的高效驅動和可靠釘扎,團隊展示了具有 Sigmoid 型激活函數的自旋神經元。這種自旋神經元最高工作頻率達 20 MHz,能耗僅為 508 fJ/spike,顯示出高效能和低功耗的特點。
![]()
圖 | 基于 DW-pMTJs 的自旋突觸裝置(來源:Nature Communications)
值得一提的是,新開發的自旋電子器件與當前標準的 CMOS 技術(互補金屬氧化物半導體技術)和磁阻隨機存取存儲器(MRAM)工藝兼容,不需要使用任何特殊材料、復雜結構或額外的掩模,使其成為神經形態器件和芯片應用的有前途的候選者。
在硬件上高效地實現深度學習網絡所需的突觸和神經元功能,可以帶來性能提升、能效優化、應用擴展、規模化訓練和推理的便利,突破傳統架構的限制,并帶來顯著的經濟效益。
盡管距離取代目前的 AI 芯片或還存在一定差距,但神經形態芯片在一些需要實時處理的端側設備上前景廣闊。
現在算力不再局限于云端,而是向邊緣設備擴展,比如物聯網、自動駕駛、機器人等,以提供更低延遲和更高效的服務。
未來可能會出現更多的混合架構,利用馮·諾依曼架構處理通用任務,同時使用神經形態芯片處理專門任務。這樣可以在性能和能效之間找到平衡。開發專用硬件的初始成本雖然較高,但一旦實現規模化生產,其單位成本可能大幅降低。企業通過投資神經形態芯片等類似技術,可滿足不斷變化的市場需求,從而帶來競爭優勢。
總體上,本次研究成果在神經形態計算和自旋電子學領域具有重要意義,為開發高能效、高可靠且可擴展的神經網絡硬件提供了新的可能性。這將有助于神經形態計算芯片的實際應用。
參考:
https://www.nature.com/articles/s41467-024-48631-4#author-information
http://www.ime.ac.cn/zhxx/zhxw/202406/t20240611_7186809.html
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.