<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      華人團隊實現AI自動尋優,矩陣乘法核心首超CUDA閉源庫

      0
      分享至

      “矩陣乘法是英偉達 CUDA 生態最核心的護城河之一。而我們打造的 CUDA-L2 在大規模、系統性的評測中,超越英偉達針對該核心算子的閉源優化方案。我們不僅實現了超越,而且將方法開源,這對于打破技術壁壘具有標志性意義?!盌eepReinforce 公司工程師蘇松喬告訴 DeepTech。

      近日,蘇松喬和合作者打造出一款名為 CUDA-L2 的智能系統,通過結合 AI 模型和強化學習,成功造出能以極高速度在 GPU 上運行的矩陣乘法核心程序。CUDA-L2 能夠自動搜索成千上萬種可能的程序編寫方式,以實際運行速度作為獎勵,引導 AI 找到最優解。

      在 A100 這款高性能 GPU 上,它生成的程序比當今業界最優秀的官方庫比如英偉達的 cuBLAS 還要快上 19%,在模擬真實服務器環境的測試中,速度優勢更是擴大到 26%。這意味著未來的 AI 應用,從實時對話到復雜科學計算,都可能因此變得更快和更高效。

      蘇松喬表示:“這項成果的應用前景非常直接。大模型超過一半的 GPU 計算時間都花在矩陣乘法上。因此,矩陣乘法算子的性能提升,將直接、成比例地提升大模型的整體運行效率。理論上,若矩陣乘法速度提升 10%,大模型的效率可提升約 5%?!?/p>

      他和合作者曾用 ChatGPT 粗略估算,矩陣乘法 10% 的性能提升,可能為全球 GDP 帶來約 4,400 億美元的增長,相當于全球 GDP 的 0.4%。雖然這只是估算,但足以說明其底層基礎性技術帶來的巨大經濟影響力。實際應用上,只需將現有大模型框架中的矩陣乘法計算替換為我們更快的實現即可。


      (來源:https://arxiv.org/abs/2512.02551)

      在 GPU 上高效執行矩陣乘法到底有多難?

      矩陣乘法是 AI 模型中最基礎、最耗時的計算操作之一。過去,優化這類計算程序是頂級工程師的專屬領域,需要針對不同的問題規模和不同硬件進行極其復雜且耗時的調整。

      我們可以把矩陣乘法想象為一個排列整齊的 Excel 表格。矩陣乘法就是一種特殊的規則,用于將兩個這樣的表格合并從而生成一個全新的表格。這個操作在 AI 領域幾乎無處不在,幾乎是所有智能計算的基石。無論是讓 AI 生成一幅畫還是理解一句話,亦或是推薦一個視頻,背后都有海量的矩陣乘法在默默工作。

      然而,在 GPU 上高效執行這個矩陣乘法非常困難。GPU 就像一臺擁有成千上萬個小型計算核心的超級引擎,如何把計算任務合理分給這些核心,如何讓數據在高速但是容量有限的記憶單元之間流暢移動,都需要精秒的設計,同時不同大小的表格需要完全不同的優化策略。


      (來源:https://arxiv.org/abs/2512.02551)

      當 AI 遇見強化學習

      傳統上,設計這些高速計算程序也就是內核,是人類工程師所要面臨的艱巨任務之一。但是本次 CUDA-L2 系統引入了一個全新的設計師:即一個經過海量代碼訓練的大模型。這個模型從一開始就懂得很多編程知識,可謂非常的博學。

      但是,光有博學還不夠,關鍵是要學會優化。CUDA-L2 采用了強化學習的方法來開展訓練。強化學習不會告訴模型每一步具體怎么走,而是設置一個目標讓模型去嘗試各種動作。

      當它做出一個動作導致分數增加時,它就得到了獎勵,從而知道這個動作是好的;反之,分數減少則是一種懲罰。通過多次的嘗試,模型就能自己摸索出來通關的最佳策略。

      CUDA-L2 的訓練過程也是如此。模型嘗試生成不同的計算程序,系統會實際地運行它們,并使用運行速度作為獎勵分數。同時,程序如果出錯或者寫得太冗長也會被扣分。就這樣,在數百萬次的嘗試和學習中國,模型逐漸掌握了編寫超高速矩陣乘法程序的秘籍。它甚至能夠參考詳細的硬件性能報告,從內存吞吐量、計算單元利用率等數據中學習如何調整程序。


      (來源:https://arxiv.org/abs/2512.02551)

      談及這一成果的后續計劃,蘇松喬說道:“目前,這篇論文尚未正式投稿,我們更關注于在 GitHub 上持續開源和更新代碼,推動工業界的實際應用。我個人已工作多年,此前長期在 Meta(原 Facebook)從事與 AI 基礎設施、網絡、數據庫和推理優化相關的系統研發工作,目前處于創業階段。”

      參考資料:

      相關論文 https://arxiv.org/abs/2512.02551

      Github 鏈接:https://github.com/deepreinforce-ai/CUDA-L2

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      色字頭上一把刀!46歲"縱欲過度"的蕭亞軒,已然走上了另一條路

      色字頭上一把刀!46歲"縱欲過度"的蕭亞軒,已然走上了另一條路

      說歷史的老牢
      2026-01-12 13:47:27
      期待!南昌這里將設置隧道、跨水橋!

      期待!南昌這里將設置隧道、跨水橋!

      南昌樓市情報
      2026-01-15 18:39:15
      人不會無緣無故患濕疹!研究發現:得濕疹,離不開這6點

      人不會無緣無故患濕疹!研究發現:得濕疹,離不開這6點

      岐黃傳人孫大夫
      2026-01-15 07:35:03
      在伊朗,美國復制不了委內瑞拉模式

      在伊朗,美國復制不了委內瑞拉模式

      觀察者網
      2026-01-15 13:38:40
      全球第一!車長近5米4,媲美埃爾法,預售僅31.98萬起,還配激光雷達

      全球第一!車長近5米4,媲美埃爾法,預售僅31.98萬起,還配激光雷達

      隔壁說車老王
      2026-01-15 05:07:46
      為啥不讓印度舉辦奧運會?看完15年前新德里辦的運動會,你就懂了

      為啥不讓印度舉辦奧運會?看完15年前新德里辦的運動會,你就懂了

      寒士之言本尊
      2025-11-25 16:53:30
      劉小明會見深圳市市長覃偉中

      劉小明會見深圳市市長覃偉中

      這里是儋州
      2026-01-15 08:38:02
      戰爭在所難免,特朗普通報全球,美開始撤僑,考驗普京的時候到了

      戰爭在所難免,特朗普通報全球,美開始撤僑,考驗普京的時候到了

      三石記
      2026-01-15 18:28:20
      1945年,丘吉爾拍桌子反對中國“入常”,羅斯福只用一句話,局勢當場逆轉

      1945年,丘吉爾拍桌子反對中國“入?!保_斯福只用一句話,局勢當場逆轉

      文史明鑒
      2026-01-14 20:53:37
      打痛日本:一只小瓶子背后的供應鏈攻防戰

      打痛日本:一只小瓶子背后的供應鏈攻防戰

      觀察者網
      2026-01-15 08:28:06
      烏克蘭國防部證實,葉爾馬克沒有聯系任何征兵機構,也沒有入伍

      烏克蘭國防部證實,葉爾馬克沒有聯系任何征兵機構,也沒有入伍

      山河路口
      2026-01-15 18:01:44
      驟降15℃!局地大到暴雪!安徽雨雪天氣速報

      驟降15℃!局地大到暴雪!安徽雨雪天氣速報

      魯中晨報
      2026-01-15 18:11:03
      日本立憲民主黨與公明黨就組建新黨達成一致

      日本立憲民主黨與公明黨就組建新黨達成一致

      新京報
      2026-01-15 16:24:02
      馬斯克的“瘋狂”預言:為養老存錢將毫無意義,未來每個人都能擁有自己想要的一切!

      馬斯克的“瘋狂”預言:為養老存錢將毫無意義,未來每個人都能擁有自己想要的一切!

      識局Insight
      2026-01-15 12:51:25
      年底聚會,記得:抽3種煙的人別理,點3種菜的人別交,真的很準

      年底聚會,記得:抽3種煙的人別理,點3種菜的人別交,真的很準

      神牛
      2026-01-13 10:24:10
      重磅爆料!閆學晶被舉報偷稅上億,證據已提交稅務局,這次真完了

      重磅爆料!閆學晶被舉報偷稅上億,證據已提交稅務局,這次真完了

      奇思妙想草葉君
      2026-01-14 22:04:26
      43家創業板公司預告2025年業績(附股)

      43家創業板公司預告2025年業績(附股)

      證券時報
      2026-01-15 10:55:13
      民進黨被曝已赴陸,將接受九二共識?賴清德:我不貪不取為何彈劾

      民進黨被曝已赴陸,將接受九二共識?賴清德:我不貪不取為何彈劾

      鐵錘簡科
      2026-01-15 18:48:57
      林允沈騰在崇禮滑雪???

      林允沈騰在崇禮滑雪?。?/a>

      八卦瘋叔
      2026-01-15 09:40:03
      NBA球隊怎么不愿梭哈巨星了?

      NBA球隊怎么不愿梭哈巨星了?

      澎湃新聞
      2026-01-15 16:30:29
      2026-01-15 20:04:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16128文章數 514485關注度
      往期回顧 全部

      科技要聞

      阿里最狠的一次“自我革命”

      頭條要聞

      男子為戒毒植入電極:開機后瘋狂性沖動給母親發黃圖

      頭條要聞

      男子為戒毒植入電極:開機后瘋狂性沖動給母親發黃圖

      體育要聞

      聶衛平:黑白棋盤上的凡人棋圣

      娛樂要聞

      傳奇棋圣聶衛平離世,網友集體悼念

      財經要聞

      央行再次結構性降息0.25個百分點

      汽車要聞

      吉利帝豪/繽越推冠軍一口價 起售價4.88萬

      態度原創

      旅游
      數碼
      藝術
      教育
      親子

      旅游要聞

      從電子簽到免簽:菲律賓對中國旅游市場“急轉彎”,意欲何為?

      數碼要聞

      巴法絡BUFFALO公布無極滾輪鼠標BSMBB700,約980天長續航

      藝術要聞

      歷代書家集字春聯大集合

      教育要聞

      為什么要對孩子客客氣氣說話

      親子要聞

      既在意料之中,又在意料之外

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品久久久久久无码中文野结衣| 狼友视频一区二区三区| 长子县| 99热这里只有精品国产免费免费| 都市激情 在线 亚洲 国产| 最新在线中文字幕| 亚洲VA不卡一区| 国产成人精品av| 69精品| V一区无码内射国产| 伊人久久精品久久亚洲一区| 国产精品调教| 色噜噜狠狠综曰曰曰| 欧美在线 | 亚洲| 无码av在线播放| 最新久久成人国产精品视频免费| 一本色道久久综合亚洲精品不卡| 黄色综合网| 亚洲鲁丝片AV无码多人| 99精品国产高清一区二区麻豆 | 国产成人精品永久免费视频| 国内自拍视频在线观看| 日韩av东京热| 日韩 欧美 亚洲 一区二区| 国产精品无遮挡猛进猛出| 亚洲精品乱码久久久久久蜜桃不卡| 崇信县| 大伊香蕉精品一区视频在线| 富婆熟妇熟女二区三区| 国产网站在线看| 三男一女吃奶添下面视频 | 国偷自产av一区二区三区| 日日草天天干| 无码精品国产va在线观看dvd| 亚洲最大成人综合网| 亚洲老鸭窝一区二区三区| 久久天天躁狠狠躁夜夜不卡| 麻豆一区二区中文字幕| 亚洲AV秘 无码二区在线| 99re热视频这里只精品| 乌兰浩特市|