<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      到底什么是All-Reduce、All-to-All?

      0
      分享至

      我們在看AIGC大模型、算力集群相關文獻的時候,經常會看到“ All-Reduce ”、“ All-to-All ”這樣的詞組。

      大家知道它們是什么意思嗎?


      故事還是要從英偉達說起。

      2014年,為了取代傳統的PCIe協議,英偉達推出了全新的NVLINK技術,用于GPU和GPU之間的點對點高速互聯。

      后來,NVLINK技術不斷迭代。 2018年,為了實現8顆GPU之間的互連,英偉達又發布了NVSwitch 1.0。

      在搗鼓GPU互連技術的過程中,英偉達還發明了一個名叫 NCCL(NVIDIA Collective Communications Library)的集合通信庫。

      NCCL支持多種編程語言和網絡,在算法層面提供了豐富的外部API,可以大幅提升通信網絡性能,也可以讓GPU之間的通信設計變得更簡單。

      在NCCL中,定義了兩種通信模式:

      1、點對點通信(Point to point communication,P2P)

      2、集合通信(Collective communication,CC)

      點對點大家一看就懂,就是兩個點之間進行通信。一個是Sender,一個是Receiver。

      什么是集合通信呢?是指一組(多個)節點內進行通信。在我們傳統通信里,就是點到多點,多點到多點,涉及到組網(網狀、星狀、環狀、mesh等)那種。

      NCCL還定義了一些計算節點之間數據交換的基本操作模式,并將其命名為——“通信原語(也有寫作通信元語

      這些通信原語包括:Broadcast、Scatter、Gather、All-Gather、Reduce、All-Reduce、Reduce-Scatter、All-to-All等。

      沒錯,All-Reduce和All-to-All,就是其中之二。

      這些通信原語是構建復雜通信行為的“原子操作”。現在所有復雜的AI算力集群,內部通信都是基于這些通信原語。它們極大地提升了并行計算的效率和便利性。

      接下來,我們就逐個解釋一下,這些通信原語的意思。

      Broadcast(1對多的廣播

      這個最簡單。當主節點執行Broadcast操作時,數據會從主節點發送至其他所有節點。


      Broadcast是一個典型的分發、散播行為。在分布式機器學習中,Broadcast常用于網絡參數的初始化。

      Scatter(1對多的發散)

      Scatter也是一種分發、散播行為。它也是 將主節點的數據發送至其他所有節點。只不過, Broadcast發送的是完整數據,而 Scatter是將數據進行切割后,再分發,就像分生日蛋糕。


      Gather(多對1的收集)

      Gather,是將多個sender(發送節點)上的數據收集到單個節點上,可以理解為反向的Scatter。


      All-Gather(多對多的收集)

      Gather是多個到一個,All-Gather是多個到多個。

      All-Gather是將多個sender(發送節點)上的數據收集到多個節點上。它相當于多個Gather操作。或者說,是一個Gather操作之后,跟著一個Broadcast操作。


      Reduce(多對1的規約)

      Reduce的英文意思是“減少、降低”。在集合通信里,它表示“規約”運算,是一系列簡單運算操作(包括:SUM、MIN、MAX、PROD、LOR等)的統稱。

      經常用Excel表格的童鞋,對這些簡單運算應該不陌生。例如SUM,就是求和。MIN,就是找出最小值。

      其實說白了,Reduce就是:輸入多個數,執行操作后,得到更少的數(例如1個數)。

      下面這個,就是以ReduceSum(求和規約)為例:


      All-Reduce(多對多的規約)

      All-Reduce,這個是我們在文章開頭提到的,AI領域非常常見的一個詞組。

      在大模型訓練中,經常會用到數據并行(DP)這個并行方式。里面就有AIl Reduce這個關鍵操作。

      我們以All Reduce Sum(求和)為例:

      首先,對所有節點進行數據收集。然后,對數據進行求和。再然后,把結果重新發回給所有節點。


      在大模型訓練中,Server GPU節點收集的數據,就是各個Worker GPU節點計算得出的“梯度”。求和之后再發回的過程,是“更新梯度”。看不懂沒關系,以后小棗君會再介紹。

      Reduce-Scatter(組合的規約與發散)

      Reduce-Scatter稍微有點復雜、燒腦。

      它是先歸約(Reduce),再分散(Scatter)。具體來說:

      首先,在所有參與計算的GPU節點上,對位于相同位置或索引的數據塊執行指定的規約運算(例如求和SUM)。

      接著,將規約后的完整結果按維度切分,并將不同的數據塊分發給各個節點。最終,每個節點只得到整個規約結果的一部分,而不是全部。


      簡單來說,它先對所有數據進行“匯總計算”,然后再將計算好的結果“分散下發”。

      All-to-All(多對多的全互連)

      AIl-to-AII也是AI領域出現頻率很高的一個詞組。它是全交換操作,可以讓每個節點都獲取其他節點的值。

      在使用All-to-All時,每一個節點都會向任意一個節點發送消息,每一個節點也都會接收到任意一個節點的消息。每個節點的接收緩沖區和發送緩沖區都是一個分為若干個數據塊的數組。


      All-to-All的具體操作是:將節點i的發送緩沖區中的第j塊數據發送給節點j。節點j將接收到的來自節點i的數據塊,放在自身接收緩沖區的第i塊位置。

      All-to-All與All-Gather相比較,區別在于:All-Gather操作中,不同節點向某一節點收集到的數據是完全相同的。而在All-to-All中,不同的節點向某一節點收集到的數據是不同的。在每個節點的發送緩沖區中,為每個節點都單獨準備了一塊數據。

      上面這個圖,大家如果學過工程數學的話,就會發現,它就是一個矩陣倒置。或者說,是Excel里的行列倒轉。

      All-to-All的核心目標是重分布。它不進行聚合運算,而是專注于在不同節點間重新分布數據塊。

      以后小棗君會給大家介紹, All-to-All 操作在大模型訓練中的混合并行策略里至關重要。例如, 當需要從數據并行組切換到模型并行組時,All-to-All可以高效地重組數據。

      Ring-base collective(基于環的集合)

      最后還要提一個有趣的結構——環(Ring)。

      Ring-base collective是將所有的通信節點通過首位相連形成一個單向環,數據在環上依次傳輸。

      傳輸方式有兩種,一種是一次性傳輸全部,還有一種,是對數據進行切割,然后分別發送。


      All-Reduce里有一種Ring All-Reduce(環形全規約)算法。它是通過組合Reduce-Scatter和All-Gather兩個操作來實現的。

      Ring All-Reduce算法分為兩個階段:

      第一階段,將N個worker分布在一個環上,并且把每個worker的數據分成N份。


      對于第k個worker,這個worker會把第k份數據發給下一個worker,同時從前一個worker收到第k-1份數據。


      然后,第k個worker會把收到的第k-1份數據和自己的第k-1份數據整合,再將整合的數據發送給下一個worker。


      以此循環N次之后,每一個worker都會包含最終整合結果的一份。


      第二階段,每個worker將整合好的部分發送給下一個worker。worker在收到數據之后,更新自身數據對應的部分即可。

      很顯然,這種環形算法可以解決傳統All-Reduce中Server節點的能力瓶頸問題。

      最后的話

      好啦,以上就是常見通信原語的具體工作原理。

      AI大模型訓練推理任務,是由海量的GPU共同完成的。而這些GPU之間的通信,就是基于上面這些通信原語模型。


      下一期,小棗君會詳細介紹一下大模型訓推任務中的并行計算方式,以及這些通信原語究竟是如何運用于不同的并行計算方式中。

      敬請關注!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      武漢即將迎來中到大雪,氣溫最低-4℃,還有6到8級大風

      武漢即將迎來中到大雪,氣溫最低-4℃,還有6到8級大風

      魯中晨報
      2026-01-15 14:47:03
      89年臺灣邀請黃維留臺居住,黃維用七個字拒絕,贏得所有人尊重

      89年臺灣邀請黃維留臺居住,黃維用七個字拒絕,贏得所有人尊重

      雍親王府
      2026-01-15 15:55:03
      深度長文:外星人到底在哪里?(超5000字,建議收藏)

      深度長文:外星人到底在哪里?(超5000字,建議收藏)

      宇宙時空
      2026-01-14 14:45:18
      2026年養老金調整新規:1956年前人員或獲更多上調

      2026年養老金調整新規:1956年前人員或獲更多上調

      風雨與陽光
      2026-01-15 11:45:37
      全長僅85米的世界最短國界:西班牙為何死守這塊沒有平民的巖石?

      全長僅85米的世界最短國界:西班牙為何死守這塊沒有平民的巖石?

      經緯史觀
      2026-01-15 14:38:06
      哈登失準仍大勝,快船13戰11勝北伐!泰倫盧被迫開竅激活內線奇兵

      哈登失準仍大勝,快船13戰11勝北伐!泰倫盧被迫開竅激活內線奇兵

      鍋子籃球
      2026-01-15 17:02:24
      27中27!快船刷新NBA紀錄,泰倫盧聲援祖尼爾,喬丹科比該轉正了

      27中27!快船刷新NBA紀錄,泰倫盧聲援祖尼爾,喬丹科比該轉正了

      世界體育圈
      2026-01-15 18:25:36
      伊朗局勢依然緊張感拉滿!特朗普喊“援助在路上”,開打倒計時?

      伊朗局勢依然緊張感拉滿!特朗普喊“援助在路上”,開打倒計時?

      上觀新聞
      2026-01-14 19:57:11
      吃他汀猝死的人增多?醫生含淚告誡:天冷吃他汀,必須多關注6點

      吃他汀猝死的人增多?醫生含淚告誡:天冷吃他汀,必須多關注6點

      健康之光
      2026-01-13 10:51:03
      高考719分我騙女友考408,她轉身跟學霸去清華!開學我們四目相對

      高考719分我騙女友考408,她轉身跟學霸去清華!開學我們四目相對

      星宇共鳴
      2026-01-13 09:20:02
      參議院準許川普繼續打委、為打伊鋪平道路,或同時動格陵蘭或先動

      參議院準許川普繼續打委、為打伊鋪平道路,或同時動格陵蘭或先動

      邵旭峰域
      2026-01-15 12:22:50
      攜程港股盤中大跌超20%,兩天市值蒸發逾1000億

      攜程港股盤中大跌超20%,兩天市值蒸發逾1000億

      鳳凰網財經
      2026-01-15 11:32:05
      1975年上海刑場驚魂:戴笠親孫子死刑前喊了一句話,中央急電:立刻放人

      1975年上海刑場驚魂:戴笠親孫子死刑前喊了一句話,中央急電:立刻放人

      寄史言志
      2026-01-15 12:05:14
      真正消耗股民精力的,從來不是一兩次漲跌

      真正消耗股民精力的,從來不是一兩次漲跌

      流蘇晚晴
      2026-01-15 19:12:32
      何晴去世30天,許亞軍終于發聲,連續兩次“示愛”,才知他多體面

      何晴去世30天,許亞軍終于發聲,連續兩次“示愛”,才知他多體面

      阿纂看事
      2026-01-14 09:31:14
      突發!美國將在24小時內襲擊伊朗,俄羅斯又一個小弟將改頭換面

      突發!美國將在24小時內襲擊伊朗,俄羅斯又一個小弟將改頭換面

      我心縱橫天地間
      2026-01-15 16:35:45
      -6℃!浙江迎來雨夾雪、雪

      -6℃!浙江迎來雨夾雪、雪

      臺州交通廣播
      2026-01-15 17:24:37
      樊振東歐洲殺瘋了,贊助暴漲12倍,豪門破百年禁忌

      樊振東歐洲殺瘋了,贊助暴漲12倍,豪門破百年禁忌

      讓心靈得以棲息
      2026-01-15 11:07:58
      曝皇馬尋找新主帥!阿韋洛亞首秀出局,簽約1年半,夏窗或下課

      曝皇馬尋找新主帥!阿韋洛亞首秀出局,簽約1年半,夏窗或下課

      奧拜爾
      2026-01-15 16:59:58
      微信群聊“八卦”被拘,女教師堅稱是閑聊,一怒之下將公安局告上法庭,法院判了

      微信群聊“八卦”被拘,女教師堅稱是閑聊,一怒之下將公安局告上法庭,法院判了

      環球網資訊
      2026-01-15 13:36:56
      2026-01-15 19:55:00
      鮮棗課堂 incentive-icons
      鮮棗課堂
      ICT知識科普。
      998文章數 1257關注度
      往期回顧 全部

      科技要聞

      阿里最狠的一次“自我革命”

      頭條要聞

      男子為戒毒植入電極:開機后瘋狂性沖動給母親發黃圖

      頭條要聞

      男子為戒毒植入電極:開機后瘋狂性沖動給母親發黃圖

      體育要聞

      聶衛平:黑白棋盤上的凡人棋圣

      娛樂要聞

      傳奇棋圣聶衛平離世,網友集體悼念

      財經要聞

      央行再次結構性降息0.25個百分點

      汽車要聞

      吉利帝豪/繽越推冠軍一口價 起售價4.88萬

      態度原創

      本地
      時尚
      教育
      家居
      軍事航空

      本地新聞

      云游內蒙|黃沙與碧波撞色,烏海天生會“混搭”

      金工守藝人陳英澤:一錘定音,鍛出山川意向

      教育要聞

      為什么要對孩子客客氣氣說話

      家居要聞

      自在自宅 個性自由

      軍事要聞

      美國已正式開始出售委內瑞拉石油

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中国极品少妇xxxxx| 久久国产精品萌白酱免费| 国产成人精品1024免费下载| 久热中文字幕在线精品观| 免费A片国产毛无码A片| 天天色欧美综合| 岳乳丰满一区二区三区| 久久无码高潮喷水抽搐| 中文字幕日韩精品人妻| 国产欧美VA天堂在线观看视频 | 狠狠躁日日躁| A片地址| 亚洲色偷拍一区二区三区| 91在线观看| 亚洲AV无码一区二区三区在线播放| 亚洲国色天香卡2卡3卡4| 苍梧县| 又大又粗又爽18禁免费看| 亚洲天堂男人天堂| 中文字幕久荜| 男人天堂社区| 亚洲30p| 国产成人女人在线观看| 日本丰满的人妻hd高清在线| 久国产精品韩国三级视频| 亚洲男人的天堂久久精品| 一本无码久本草在线中文字幕dvd| 门头沟区| 亚洲加勒比久久88色综合| 久热官网| 美女内射毛片在线看3d| 性中国熟妇| 久久狠狠高潮亚洲精品| 久久精品亚洲| 无码吃奶揉捏奶头高潮视频| 国内视频自拍| 亚洲精品久久久久久久蜜桃臀 | 国产亚洲AV片在线观看播放| 狠狠人妻久久久久久综合蜜桃| 日韩在线视频一区二区三| 国产精品毛片在线完整版|