<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      IBM Spyre加速器的PyTorch原生支持構(gòu)建之路

      0
      分享至


      我們最近發(fā)布了在PyTorch生態(tài)系統(tǒng)中啟用IBM Spyre加速器的2026年上半年路線圖。在配套的技術(shù)說(shuō)明中,我們介紹了該硬件的特性——32個(gè)活躍AI核心、混合精度SIMD-脈動(dòng)陣列以及可編程數(shù)據(jù)流設(shè)計(jì)。

      在這里,我們想詳細(xì)介紹路線圖的關(guān)鍵主題,以及我們?nèi)绾卧谝粋€(gè)主要由GPU塑造的生態(tài)系統(tǒng)中為數(shù)據(jù)流加速器構(gòu)建一流的PyTorch支持。我們的理念是生態(tài)優(yōu)先——我們利用上游機(jī)制,最小化自定義代碼,并回饋那些讓下一個(gè)加速器更容易遵循相同路徑的組件。

      擴(kuò)展Inductor以支持?jǐn)?shù)據(jù)流抽象

      我們正在樹(shù)外擴(kuò)展inductor,以處理數(shù)據(jù)流加速器所需的抽象。三個(gè)擴(kuò)展最為重要:首先,我們引入了基于塊的張量布局,使編譯器能夠推理Spyre環(huán)形連接核心所期望的塊結(jié)構(gòu)數(shù)據(jù)移動(dòng)。其次,我們添加了多核工作劃分過(guò)程,在編譯期間而非運(yùn)行時(shí)將塊分配到Spyre的32個(gè)核心上。第三,我們添加了暫存器優(yōu)化——Spyre核心使用顯式管理的片上內(nèi)存而非硬件緩存,inductor在調(diào)度數(shù)據(jù)時(shí)需要考慮這一點(diǎn)。這些擴(kuò)展將使torch.compile能夠?yàn)槲覀?026年上半年范圍內(nèi)的每個(gè)優(yōu)先模型生成高效的Spyre代碼,從Llama 3.1 8B到Granite 4 Hybrid 30B。

      后端編譯器中間表示的兩階段方法

      我們對(duì)位于inductor高級(jí)圖和Spyre機(jī)器碼之間的后端編譯器中間表示采取兩階段方法。

      在第一階段,SuperDSC(SDSC)將作為后端編譯器中間表示——所有操作降級(jí)和代碼生成的單一入口點(diǎn)。我們優(yōu)先模型所需的每個(gè)torch操作都可以在SDSC中表達(dá),在PyTorch集成層和硬件特定優(yōu)化之間提供清晰的分離。

      在第二階段,我們將過(guò)渡到KernelTile IR(KTIR),這是一個(gè)更符合社區(qū)的規(guī)范,與TileIR等新興計(jì)劃更加一致。KTIR將泛化塊級(jí)表示,使其他數(shù)據(jù)流加速器——不僅僅是Spyre——可以將其用于更低級(jí)別的調(diào)度和代碼生成。我們計(jì)劃在今年上半年發(fā)布完整的KTIR規(guī)范,并且我們正在設(shè)計(jì)的開(kāi)源調(diào)度算法可以適應(yīng)我們自己硬件之外的應(yīng)用。

      設(shè)備集成與分布式通信

      Spyre將完全通過(guò)樹(shù)外擴(kuò)展注冊(cè)為PyTorch設(shè)備:設(shè)備生命周期、內(nèi)存管理、數(shù)據(jù)傳輸和調(diào)度。我們的目標(biāo)是以這種方式處理100%的注冊(cè),與直接設(shè)備訪問(wèn)相比開(kāi)銷低于5%。我們計(jì)劃將構(gòu)建的通用原語(yǔ)回饋到PyTorch核心的OpenReg測(cè)試基礎(chǔ)設(shè)施中。

      對(duì)于多卡推理,我們通過(guò)torch.inductor編譯功能性集合操作(all-reduce、all-gather),這將使我們?cè)?026年上半年實(shí)現(xiàn)所有優(yōu)先模型的分布式推理。長(zhǎng)期來(lái)看,我們計(jì)劃遷移到torch.distributed,并最終隨著社區(qū)通信層的穩(wěn)定遷移到torch.comms。

      生產(chǎn)推理與vLLM集成

      生產(chǎn)推理將通過(guò)vLLM運(yùn)行。我們將Spyre作為vLLM平臺(tái)插件啟用,采用上游模型實(shí)現(xiàn)而非維護(hù)我們自己的分支。我們的優(yōu)先模型將通過(guò)Spyre上的vLLM進(jìn)行端到端服務(wù)。

      兩項(xiàng)優(yōu)化將推動(dòng)實(shí)際可用性。新的Spyre注意力后端將消除同質(zhì)序列長(zhǎng)度約束,直接減少Token間延遲。上游vLLM中改進(jìn)的torch.compile工件緩存將把啟動(dòng)時(shí)間降至幾秒鐘。我們正在與vLLM社區(qū)合作,以穩(wěn)定平臺(tái)插件接口。

      測(cè)試與持續(xù)集成

      我們正在構(gòu)建一個(gè)分層測(cè)試金字塔,將驗(yàn)證整個(gè)堆棧:操作級(jí)正確性、inductor編譯和降級(jí)、模塊級(jí)測(cè)試(包括注意力、歸一化和激活)、頂層模型質(zhì)量和性能,以及端到端vLLM推理。所有測(cè)試都將限定在優(yōu)先模型范圍內(nèi),并每晚運(yùn)行,回歸失敗將在數(shù)小時(shí)內(nèi)標(biāo)記。

      我們正在將此持續(xù)集成基礎(chǔ)設(shè)施構(gòu)建為對(duì)PyTorch生態(tài)系統(tǒng)的樹(shù)外貢獻(xiàn),建立其他加速器團(tuán)隊(duì)可以采用的模式。我們的目標(biāo)是每晚運(yùn)行的通過(guò)率超過(guò)95%,完整流程在三小時(shí)內(nèi)完成。

      回饋社區(qū)

      生態(tài)優(yōu)先意味著回饋,而不僅僅是在上面構(gòu)建。本半年有三項(xiàng)突出貢獻(xiàn):我們計(jì)劃上游OpenReg原語(yǔ),使樹(shù)外設(shè)備測(cè)試成為PyTorch的一流能力。我們正在努力將KTIR泛化為社區(qū)規(guī)范,使數(shù)據(jù)流加速器共享通用的塊級(jí)中間表示,而不是各自發(fā)明自己的。我們將記錄樹(shù)外持續(xù)集成模式,使下一個(gè)加速器團(tuán)隊(duì)不必從頭解決基礎(chǔ)設(shè)施問(wèn)題。

      設(shè)計(jì)文檔和RFC存放在我們的公共存儲(chǔ)庫(kù)中。我們歡迎參與——無(wú)論是審查KTIR規(guī)范、試用Spyre跟蹤分析器,還是參與關(guān)于PyTorch原生加速器支持應(yīng)該是什么樣子的討論。

      Q&A

      Q1:IBM Spyre加速器有什么硬件特點(diǎn)?

      A:IBM Spyre加速器擁有32個(gè)活躍AI核心、混合精度SIMD-脈動(dòng)陣列以及可編程數(shù)據(jù)流設(shè)計(jì)。其核心使用顯式管理的片上內(nèi)存而非硬件緩存,核心之間采用環(huán)形連接架構(gòu),適合塊結(jié)構(gòu)數(shù)據(jù)移動(dòng)。

      Q2:PyTorch如何支持Spyre這樣的數(shù)據(jù)流加速器?

      A:通過(guò)樹(shù)外擴(kuò)展inductor來(lái)處理數(shù)據(jù)流加速器所需的抽象,包括引入基于塊的張量布局、添加多核工作劃分過(guò)程以及暫存器優(yōu)化。Spyre將完全通過(guò)樹(shù)外擴(kuò)展注冊(cè)為PyTorch設(shè)備,處理設(shè)備生命周期、內(nèi)存管理、數(shù)據(jù)傳輸和調(diào)度,目標(biāo)是與直接設(shè)備訪問(wèn)相比開(kāi)銷低于5%。

      Q3:KTIR在Spyre的PyTorch支持中扮演什么角色?

      A:KTIR(KernelTile IR)是第二階段的后端編譯器中間表示,它是一個(gè)更符合社區(qū)的規(guī)范,與TileIR等新興計(jì)劃一致。KTIR將泛化塊級(jí)表示,使其他數(shù)據(jù)流加速器也可以將其用于更低級(jí)別的調(diào)度和代碼生成,而不僅僅服務(wù)于Spyre硬件。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      馬筱梅曝大S豪宅去向,S媽又"作妖",張?zhí)m出手,小楊阿姨也不簡(jiǎn)單

      馬筱梅曝大S豪宅去向,S媽又"作妖",張?zhí)m出手,小楊阿姨也不簡(jiǎn)單

      無(wú)處不風(fēng)景l(fā)ove
      2026-03-09 21:48:38
      歐冠雙場(chǎng)大勝:拜仁馬競(jìng)聯(lián)手造慘案,意甲獨(dú)苗已出局

      歐冠雙場(chǎng)大勝:拜仁馬競(jìng)聯(lián)手造慘案,意甲獨(dú)苗已出局

      阿錯(cuò)田間生活
      2026-03-11 06:30:53
      WTI原油期貨跌幅超10%,跌破85美元/桶

      WTI原油期貨跌幅超10%,跌破85美元/桶

      每日經(jīng)濟(jì)新聞
      2026-03-10 09:23:10
      以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國(guó)并不會(huì)第一個(gè)翻臉

      以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國(guó)并不會(huì)第一個(gè)翻臉

      八斗小先生
      2025-12-26 09:33:27
      火箭不忍了!休賽期計(jì)劃曝光,鎖定兩大目標(biāo),申京離隊(duì)進(jìn)入倒計(jì)時(shí)!

      火箭不忍了!休賽期計(jì)劃曝光,鎖定兩大目標(biāo),申京離隊(duì)進(jìn)入倒計(jì)時(shí)!

      煙潯渺渺
      2026-03-11 05:36:34
      特朗普:若伊朗阻斷霍爾木茲海峽,美國(guó)將施以更猛烈打擊

      特朗普:若伊朗阻斷霍爾木茲海峽,美國(guó)將施以更猛烈打擊

      界面新聞
      2026-03-10 09:28:51
      淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

      淺色系穿搭!這個(gè)組合讓你在健身房瞬間吸引眼球!

      獨(dú)角showing
      2025-12-31 21:08:57
      baby私下聚會(huì)視頻!旗袍邋遢煙不離手請(qǐng)男模,舉止浮夸疑精神失常

      baby私下聚會(huì)視頻!旗袍邋遢煙不離手請(qǐng)男模,舉止浮夸疑精神失常

      八卦王者
      2026-03-09 11:05:16
      蘭大博士黃河救人獲省委書(shū)記點(diǎn)贊,此前他還資助困難學(xué)生,本人回應(yīng):說(shuō)我是英雄愧不敢當(dāng),只是做了一件小事

      蘭大博士黃河救人獲省委書(shū)記點(diǎn)贊,此前他還資助困難學(xué)生,本人回應(yīng):說(shuō)我是英雄愧不敢當(dāng),只是做了一件小事

      極目新聞
      2026-03-10 19:48:21
      網(wǎng)友曝張藝興多個(gè)活動(dòng)被取消,疑被國(guó)家話劇院開(kāi)除,本人發(fā)聲明!

      網(wǎng)友曝張藝興多個(gè)活動(dòng)被取消,疑被國(guó)家話劇院開(kāi)除,本人發(fā)聲明!

      小娛樂(lè)悠悠
      2026-03-10 08:35:31
      德容恩:拜仁實(shí)在太強(qiáng)了,我們本該回收打反擊

      德容恩:拜仁實(shí)在太強(qiáng)了,我們本該回收打反擊

      懂球帝
      2026-03-11 06:54:13
      第33波!10枚導(dǎo)彈全命中!伊朗發(fā)出停火條件,特朗普只能認(rèn)輸?

      第33波!10枚導(dǎo)彈全命中!伊朗發(fā)出停火條件,特朗普只能認(rèn)輸?

      薛小榮
      2026-03-10 19:40:48
      低脂勻稱的健美胴體是最完美的藝術(shù)品--寶藝媛;膚白貌美的尤物!

      低脂勻稱的健美胴體是最完美的藝術(shù)品--寶藝媛;膚白貌美的尤物!

      女子健美相冊(cè)
      2026-02-13 18:51:48
      信號(hào)!千億巨頭入局,三亞開(kāi)啟新一輪大征拆!

      信號(hào)!千億巨頭入局,三亞開(kāi)啟新一輪大征拆!

      網(wǎng)易海南房產(chǎn)
      2026-03-10 11:32:27
      第6波反制,中方準(zhǔn)時(shí)索賠,巴政府收到罰單,兩家公司被中國(guó)約談

      第6波反制,中方準(zhǔn)時(shí)索賠,巴政府收到罰單,兩家公司被中國(guó)約談

      影孖看世界
      2026-03-10 16:56:04
      國(guó)乒3消息:樊振東出戰(zhàn)世乒賽,10號(hào)重慶賽程出爐,莎頭抽上上簽

      國(guó)乒3消息:樊振東出戰(zhàn)世乒賽,10號(hào)重慶賽程出爐,莎頭抽上上簽

      越嶺尋蹤
      2026-03-10 04:31:26
      性壓抑已經(jīng)變態(tài)至此了?

      性壓抑已經(jīng)變態(tài)至此了?

      黯泉
      2026-03-07 11:28:43
      宋平同志生平照片

      宋平同志生平照片

      新華社
      2026-03-10 19:08:38
      曼聯(lián)哭暈!頭號(hào)目標(biāo)公開(kāi)拒絕,寧愿去利物浦也不來(lái)老特拉福德

      曼聯(lián)哭暈!頭號(hào)目標(biāo)公開(kāi)拒絕,寧愿去利物浦也不來(lái)老特拉福德

      瀾歸序
      2026-03-11 04:02:26
      王曼昱慘敗因不舒服?大楊揚(yáng)透露樊振東不回歸原因,幫王勵(lì)勤解圍

      王曼昱慘敗因不舒服?大楊揚(yáng)透露樊振東不回歸原因,幫王勵(lì)勤解圍

      三十年萊斯特城球迷
      2026-03-10 22:31:30
      2026-03-11 07:44:49
      至頂頭條 incentive-icons
      至頂頭條
      記錄和推動(dòng)數(shù)字化創(chuàng)新
      16700文章數(shù) 49695關(guān)注度
      往期回顧 全部

      科技要聞

      蔚來(lái)今年要少虧150億,沖擊年度盈利

      頭條要聞

      "一對(duì)老夫妻雙雙129歲相戀100年"視頻引熱議 當(dāng)?shù)鼗貞?yīng)

      頭條要聞

      "一對(duì)老夫妻雙雙129歲相戀100年"視頻引熱議 當(dāng)?shù)鼗貞?yīng)

      體育要聞

      加蘭沒(méi)那么差,但鱸魚(yú)會(huì)用嗎?

      娛樂(lè)要聞

      《逐玉》注水風(fēng)波升級(jí)!315評(píng)論區(qū)淪陷

      財(cái)經(jīng)要聞

      “龍蝦補(bǔ)貼”密集出爐 最高1000萬(wàn)!

      汽車(chē)要聞

      MG4有SUV衍生 上汽乘用車(chē)多款新車(chē)規(guī)劃曝光

      態(tài)度原創(chuàng)

      本地
      藝術(shù)
      房產(chǎn)
      公開(kāi)課
      軍事航空

      本地新聞

      云游中國(guó)|候鳥(niǎo)高顏值亮相!沉浸式打卡青海濕地

      藝術(shù)要聞

      這組剪紙?zhí)懒耍?/h3>

      房產(chǎn)要聞

      信號(hào)!千億巨頭入局,三亞開(kāi)啟新一輪大征拆!

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      剛說(shuō)完戰(zhàn)爭(zhēng)很快結(jié)束 特朗普改口

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版