<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達23人夢之隊,讓AI用7天干翻了自己的GPU專家

      0
      分享至

      AI在7天內自主完成了通常需要專家數月甚至數年的GPU內核優化,而且結果比自己家的王牌產品還快10%——今天,學術預印本平臺arXiv上發布了一項被視為可能徹底改變軟件和芯片優化方式的突破性研究。


      這一研究由NVIDIA組建的一支23人的頂級團隊完成,名為《AVO: Agentic Variation Operators for Autonomous Evolutionary Search》(AVO:用于自主進化搜索的智能體變異算子)。

      簡單來說,AVO(Agentic Variation Operators,智能體變異算子)是讓AI自己當起了“程序員+架構師+測試員”的合體,去探索人類工程師可能永遠想不到的底層代碼優化方案,最終在英偉達最新的Blackwell(B200)GPU上,寫出了比當今最頂尖人類專家團隊(如cuDNN和FlashAttention-4)編寫的代碼還要快10%以上的高性能計算內核。

      值得注意的是,其核心開發者許冰在X上表示,他一開始根本不懂GPU編程,也由此開啟了這一段“盲編碼”的探索——也許,“不懂”才是最大的優勢,人類的認知反而會成為進化的局限。

      再見!傳統進化算法的局限

      想象一下,你有一套非常精密的計算程序(比如現在最火的AI模型中的“注意力機制”),這套程序要在顯卡(GPU)上跑得飛快。為了達到這個目標,專業的程序員們通常要花費幾個月甚至幾年時間,手動調整代碼、優化內存訪問、設計特殊算法,最終才能比通用版本快個20%、30%。

      但這些手工優化有個大問題:太慢了、太依賴個人經驗了。硬件在變、算法在變,每次都需要重新優化。

      為了自動化這個過程,科學家們想到了“進化算法”:就像生物進化一樣,隨機生成一批代碼,測試哪個跑得快,保留快的,變異出下一代,不斷重復。但這個方法有個致命缺陷:變異操作是“盲目的”——傳統進化算法中的"變異"就是簡單的隨機修改、交換代碼片段。這就好比你想讓猴子打出莎士比亞的作品,純靠隨機敲鍵盤是不行的。

      而且,傳統的進化算法和“大模型輔助設計”思路,通常把AI(大語言模型)限定在一個固定的流程里。比如,人類設定好規則(“變異”和“交叉”),讓AI生成一堆代碼候選方案,然后由人類或另一個程序來篩選和測試。


      AVO的革命性在于,它徹底顛覆了這個關系。 它不再把AI當作流程中的一個“候選生成器”,而是將整個變異過程本身,交給一個自主的智能體循環來完成。這個智能體擁有更高的權限和更全面的視角,它可以:

      • 查閱整個進化家譜:查看當前所有代碼版本的優劣和歷史。
      • 調用領域知識庫:學習特定領域(如GPU硬件架構)的專門知識。
      • 分析執行反饋:根據代碼的實際運行性能數據,進行自我診斷。

      基于這些信息,這個智能體可以自主完成提出修改、修復錯誤、批判方案、驗證結果等一系列完整動作。這就像一個不知疲倦、知識淵博且具備批判性思維的全棧工程師,在持續地重構和優化代碼。


      實戰成績:在最難優化的戰場上擊敗人類冠軍

      為了證明AVO的強大,研究團隊選擇了一個公認的“硬骨頭”作為測試場:注意力機制(Attention)的計算內核。這是驅動當今所有大語言模型(如ChatGPT、Gemini)的核心組件,也是全球頂尖工程師和科學家投入巨資、激烈優化的焦點。英偉達的cuDNN和Tri Dao團隊的FlashAttention系列,就是這一領域的標桿。

      在讓AVO在最新的NVIDIA Blackwell (B200)顯卡上運行7天后,實驗的結果驚人:



      • 超越cuDNN:AVO形成的多頭注意力(Multi-Head Attention,MHA)計算內核,在測試的各項配置中,性能超越了cuDNN高達3.5%。cuDNN是NVIDIA自家工程師花了多年打磨的閉源庫,AVO一個AI系統跑了7天就超越了它。這相當于學生超越了老師,而且這個老師已經是全世界最好的。
      • 超越FlashAttention-4:比學術界最先進注意力計算方法FlashAttention-4快10.5%。這種程度的提升已經可以稱之為革命性的突破了。
      • 遷移能力:更神奇的是,AVO優化好的代碼還能舉一反三——在MHA上進化7天的成果,遷移到GQA(Grouped-Query Attention,分組查詢注意力)只需30分鐘就能獲得7%-9%的提升。說明AVO學到的不是死記硬背的特定優化,而是通用的優化策略和思維方式。
      • 微架構級別的深度優化:AVO發現的優化不是簡單的換個算法,而是深入到GPU寄存器分配、warp調度、流水線時序的微架構級別。這說明AI已經具備了理解硬件底層行為的能力。
      這意味著什么?

      傳統方法像是在填空題里選答案,而AVO像是在開放題中自由發揮,可以探索各種可能性。而且,AVO不是靠猜什么優化有用,而是真正運行代碼、測量性能,用數據驅動進化。同時,智能體會從每次嘗試中學習,失敗的嘗試也有價值,告訴它這條路不通。

      AVO讓AI像真正的程序員一樣,會學習、會思考、會測試,最終寫出了比人類專家還快的代碼。這是AI優化自身能力的重要一步。

      從其進化結果來看,對AI硬件優化意味著:更快的大模型訓練,如果注意力機制計算能加速10%,整個大模型訓練都能更快;降低硬件門檻,同樣的硬件能跑更大的模型,或者同樣的模型能用更便宜的硬件;解放專家,不再需要頂尖優化工程師花費數月手工調優。

      從這一AI研究方向而言,這篇論文證明了一個重要觀點:AI不僅可以用來自動化任務,還可以用來自動化優化本身。未來可能會有更多“AI優化AI”的場景。

      結語

      這篇論文全部23位作者涵蓋了AI編譯器、高性能計算、計算機視覺、生成式AI等多個頂級子方向——AI智能體編程先鋒(Terry Chen, 許冰)、 AI編譯器之父(陳天奇)、NVIDIA研究VP(Ming-Yu Liu)、 GPU內核專家(John Tran, Andrew Kerr)、注意力機制專家(Ali Hassani)、學術界權威(Humphrey Shi, Luis Ceze),以及系統工程支撐團隊。

      這是一個從理論到工程、從學術到產品全鏈路覆蓋的頂級團隊。AVO不是一篇試試看的探索性論文,而是NVIDIA精心布局的戰略級成果。

      從更宏觀的視角看,AVO代表了AI研發范式的又一次進化。它不再滿足于讓AI生成內容或遵循指令,而是賦予其長期的、目標導向的、具備反思能力的自主探索權。它也為我們打開了一扇門:未來,在芯片設計、編譯器優化、算法創新等需要極度專業知識和創造力的領域,自主進化的AI智能體可能成為人類最得力的“共研者”。它們可以不知疲倦地探索人類思維難以觸及的“微觀架構”組合空間,加速我們邁向更強大、更高效計算未來的進程。

      或許,這項研究正像一顆投入湖面的石子,其漣漪將逐漸擴散至整個計算產業的每一個角落。

      論文地址 https://arxiv.org/pdf/2603.24517v1

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中美都在賭,美國賭中國不敢打日本,而中國則在賭美國不會下場

      中美都在賭,美國賭中國不敢打日本,而中國則在賭美國不會下場

      南權先生
      2026-03-24 15:30:39
      4.7萬億!馬斯克打破人類財富紀錄:他一個人的錢抵得過160個國家

      4.7萬億!馬斯克打破人類財富紀錄:他一個人的錢抵得過160個國家

      通鑒史智
      2026-03-15 11:45:00
      孫蕓蕓升級當外婆!孩子父親曬大量合影,和廖思維和平分手沒跑路

      孫蕓蕓升級當外婆!孩子父親曬大量合影,和廖思維和平分手沒跑路

      八斗小先生
      2026-03-26 14:40:39
      54歲瞿穎已婚實錘!丈夫身份曝光超意外

      54歲瞿穎已婚實錘!丈夫身份曝光超意外

      眼底星碎
      2026-03-26 13:47:18
      20億美元還不夠!中企對巴拿馬索賠漲價,巴政府內部已經亂套了

      20億美元還不夠!中企對巴拿馬索賠漲價,巴政府內部已經亂套了

      悄悄史話
      2026-03-26 14:09:05
      國產頂級神劇,只可惜,央視播完就禁了

      國產頂級神劇,只可惜,央視播完就禁了

      獨立魚
      2026-03-23 21:22:17
      女孩“全損課本”火了,自認為是清北的料子,老師:自我感動罷了

      女孩“全損課本”火了,自認為是清北的料子,老師:自我感動罷了

      復轉這些年
      2026-03-23 20:48:15
      油價降了!3月26日全國油價下調85元噸,4月7日油價將迎下跌!

      油價降了!3月26日全國油價下調85元噸,4月7日油價將迎下跌!

      沙雕小琳琳
      2026-03-26 15:31:42
      俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動?

      俄羅斯宣傳三天攻占愛沙尼亞!炮制公投,又是特別軍事行動?

      項鵬飛
      2026-03-24 20:28:43
      伊朗掛斷王毅電話后發全球照會,薩勒曼震怒

      伊朗掛斷王毅電話后發全球照會,薩勒曼震怒

      空間展示知識
      2026-03-26 07:06:58
      俄羅斯人想不明白:為什么強大的中國,幾千年都不要西伯利亞?

      俄羅斯人想不明白:為什么強大的中國,幾千年都不要西伯利亞?

      賤議你讀史
      2026-03-26 00:07:41
      卡爾森:壞了!原來小丑不是特朗普,而是我自己

      卡爾森:壞了!原來小丑不是特朗普,而是我自己

      朝廷心腹
      2026-03-26 09:07:14
      603444,業績大增!擬10派70元!

      603444,業績大增!擬10派70元!

      證券時報e公司
      2026-03-26 19:32:17
      真的太孤獨了!山東47歲母親稱已懷胎8月,兩女遠嫁卻極力反對…

      真的太孤獨了!山東47歲母親稱已懷胎8月,兩女遠嫁卻極力反對…

      火山詩話
      2026-03-25 13:41:56
      伊朗導彈砸向美國航母:伊朗打出了開戰以來最強一拳

      伊朗導彈砸向美國航母:伊朗打出了開戰以來最強一拳

      阿芒娛樂說
      2026-03-26 12:37:49
      伊朗一對“情侶”躲進谷倉中擁吻,被發現時,已經吻了2800年

      伊朗一對“情侶”躲進谷倉中擁吻,被發現時,已經吻了2800年

      北海史記
      2026-03-26 13:31:29
      英媒:美式“炮艦帝國主義”難以得逞

      英媒:美式“炮艦帝國主義”難以得逞

      參考消息
      2026-03-26 13:30:07
      伊媒:伊朗若遭美國地面入侵將打擊曼德海峽

      伊媒:伊朗若遭美國地面入侵將打擊曼德海峽

      參考消息
      2026-03-26 11:02:08
      1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

      1982年血色使館:中國外交官唐健生為了生存殺光了所有同事

      阿校談史
      2026-03-20 11:03:27
      研究所所長猥褻下屬后續,女主被扒 多張高清照曝光 知情人再爆料

      研究所所長猥褻下屬后續,女主被扒 多張高清照曝光 知情人再爆料

      離離言幾許
      2026-03-26 15:01:09
      2026-03-26 21:12:49
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      131380文章數 862012關注度
      往期回顧 全部

      科技要聞

      Meta高管狂分百億期權,700名員工卻下崗

      頭條要聞

      張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

      頭條要聞

      張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

      體育要聞

      申京努力了,然而杜蘭特啊

      娛樂要聞

      劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

      財經要聞

      油價"馴服"特朗普?一到100美元就TACO

      汽車要聞

      一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

      態度原創

      藝術
      教育
      手機
      房產
      游戲

      藝術要聞

      哪一座橋不是風景?

      教育要聞

      來上課了——高考閱讀難題大綜合(細節+主旨+含義)(下)第1段

      手機要聞

      OPPO K15 Pro系列突然官宣:天璣9500s+主動散熱,4月1日發布

      房產要聞

      突發,三亞又有大批征遷補償方案出爐!

      10萬獎池!2026 KKCS1.6 巔峰之路傳奇聯賽(春季賽)正式開賽!——KK官方對戰平臺

      無障礙瀏覽 進入關懷版