<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      什么樣的智算網絡方案,才是客戶真正想要的?

      0
      分享至

      隨著AI熱潮的不斷發展,業界已經充分意識到:除了算力卡之外,智算網絡也是決定算力集群性能的重要因素之一。智算網絡就像算力集群內部的“神經脈絡”。如果它不能高效工作,哪怕肌肉和大腦再發達,整體的能力都會受到限制。

      這些年,圍繞智算網絡技術方案,業界逐漸形成了兩大主流方向:一種是以“GPU + Infiniband(IB)”為代表的私有方案流派;還有一種,是以“魔改”高性能以太網(RoCEv2)為代表的開放方案流派。與此同時,國內算力需求持續快速增長,國產算力生態加速崛起,形態更加多元,出現了更多不同品牌的 GPU、網卡和整機系統。在這種多元化背景下,行業對于“更開放、更易演進、可持續”的網絡底座需求也變得愈發迫切。

      正因如此,“魔改以太網”開放方案的陣營正在不斷擴大。這條技術路線不僅保持了成本、生態方面的固有優勢,在性能、可靠性、兼容性等關鍵指標上持續逼近乃至趕超IB。對于國內目前如火如荼的智算基礎設施建設來說,這無疑是一個重大利好。

      前段時間,新華三推出了一個很有特色的創新架構智算方案,名字叫做DDC,吸引了整個行業的關注。這個方案,就屬于剛才說的開放方案流派。

      說到DDC,可能很多專業讀者會首先想到業界最早提出的“分布式解耦機框(Disaggregated Distributed Chassis)”。如果它是DDC 1.0,那么新華三推出的DDC架構,則是在DDC 1.0基礎上的演進升級,全稱叫Diversified Dynamic-Connectivity,多元動態聯接。它同樣屬于分布式解耦機框的技術路線,但引入了多項關鍵技術創新,在傳輸性能、連接規模、開放解耦、運維簡化等方面都有了巨大的改進提升。


      接下來,我們就詳細看看,新華三的DDC方案,到底有哪些黑科技。

      高帶寬+大規模

      新華三的DDC方案包括NCP(網絡處理單元)和NCF(網絡交換單元)兩層,通過Spine-Leaf葉脊架構進行全連接。NCP相當于業務線卡,NCF相當于交換網板,都是獨立工作的盒型形態。


      方案對應到新華三的具體產品,是H3C S12500AI系列交換機。NCF有一款H3C S12500AI-NCFN。NCP有兩款,分別是H3C S12500AI-18EP20EP-NCPN、H3C S12500AI-36DH20EP-NCPN。

      產品的外型和端口數如下圖所示:


      NCP和NCF的端口都支持800G,完全可以滿足當前主流網卡形態的接入需求,帶寬妥妥夠。

      規模方面,也很容易計算。單POD組網(DDC單集群)下,800G信元端口可以分為兩個400G,也就是支持40個NCF和256個NCP,總共支持256(接入設備)*36(接入端口)=9216個端口(400G)。如果是800G的話,就是4608個端口。

      這個端口數量,足夠支撐國內絕大多數的智算集群應用。如果要搞萬卡集群,就可以采用多POD組網(DDC多集群),最大可支持8個POD,也就是73728個400G端口(或36864個800G端口)。


      零擁塞+零波動

      接下來,我們來看最關鍵的無損傳輸。也就是說,當智算網絡處于高流量負荷狀態的時候,會不會出現丟包、抖動和擁塞。

      眾所周知,AIGC大模型訓練業務對網絡丟包極為敏感,輕則導致吞吐效率降低,重則將使訓練任務中斷。無論是哪一種,都會嚴重影響算力集群的訓練周期和成本。

      新華三DDC方案是如何確保實現零波動、零擁塞的呢?

      答案就是以信元轉發為核心的負載均衡機制,以及基于“VoQ(Virtual Output Queueing,虛擬輸出隊列)+Credit”的確定性擁塞控制機制。

      大模型訓練場景的流量特點,概括來說,就是大而且雜。因為訓練包括多種方式(例如DP數據并行、PP流水并行、TP張量并行、EP專家并行),每種方式的流量模型不一樣。有的帶寬高(低),有的流數多(少),還經常會高并發、突發。

      傳統的ECMP(等價多路徑路由)等負載均衡機制根本無法應對這種復雜流量特征,流量容易被哈希到同一鏈路,產生擁塞。


      新華三DDC方案的做法,是網卡(GPU)側的數據流進入NCP后,切割為等長字節的信元。然后,將這些信元動態、均衡地噴灑到內部交換網絡(NCF)的所有鏈路上。在信元到達出口NCP時,再進行重組。

      這就是以信元轉發為核心的負載均衡機制


      再看看確定性擁塞控制機制。

      下圖,是傳統非DDC的RoCE方案的擁塞案例,基于PCF(優先級流控制)+ECN(顯性擁塞通知)機制。


      具體來說,當Spine1到Leaf9之間的鏈路(黃色線)出現擁塞時,Spine1會逐層向上反壓,向Leaf1發PFC幀。這就會導致Leaf1和Spine1之間端口的相關隊列全部被壓住。這就會影響Spine1到其它Leaf(例如綠色線)的流量。這就是線頭阻塞問題。

      在DDC方案里,就不存在這種情況。

      DDC方案的VoQ,是在入口設備上基于不同出端口維護的隊列。當Spine1到Leaf9之間的鏈路出現擁塞時,只影響基于Leaf9的VoQ隊列。其它VoQ隊列(例如Leaf1到Leaf8)并不受影響。這就避免了線頭阻塞的問題,實現了精準反壓。


      這有點像餐廳排號,大桌、中桌、小桌分開排隊,互不影響。

      VoQ解決了線頭阻塞問題。那么確定性的擁塞控制,又是如何實現的呢?這就需要Credit授權控制轉發機制的配合。

      可以將Credit理解為令牌。當入向要往出向進行轉發時,會先發授權請求。當出向的帶寬可以保證報文轉發的時候,出口NCP才會給入口NCP發Credit授權回應,允許流量推送。


      Credit有點像餐廳的叫號系統。只有叫號了,才允許進入,就可以避免擁塞。

      在以信元轉發為核心的負載均衡機制和基于“Credit + VoQ”的確定性擁塞控制機制的共同加持下,新華三DDC方案能夠實現鏈路利用率100%的負載均衡效果,且充分吸收突發流量,徹底消除DDC網絡內部的擁塞。


      經權威機構測試驗證,新華三DDC方案的帶寬利用率絲毫不亞于InfiniBand網絡。

      在8臺服務器64張英偉達H20 GPU卡,進行NCCL-Test對比測試。All Reduce場景下,DDC性能與IB基本持平。16G數據時,DDC比IB提升了0.27%。All-to-All場景下,256M以下數據對比IB無提升效果。1G以上數據時,DDC性能提升明顯。16G數據時,比IB提升了21.74%。這說明,數據量越大,DDC的優勢越明顯。


      網卡解耦+多元異構

      新華三DDC作為分布式機框,實現了“物理上的分體、邏輯上的整體”。它就像一個“超級交換機”,前面提到的信元切割、重組,還有VoQ+Credit技術,都是在其內部完成的,不需要網卡的參與。

      也就是說,DDC實現了與網卡和GPU的完全解耦。

      此外,DDC基于信元的擁塞管理和負載均衡是獨立于IP轉發域的。DDC對不同的流量模型和特征都不敏感。設備接入DDC后,網卡側也不需要進行專門的調優。

      這就意味著,基于DDC架構的智算網絡,可以接入多元算力,兼容性和靈活性更強。對任意流量模型,DDC方案都可以達到最佳負載均衡效果。


      正如本文開頭所說,能夠承接多元算力生態,是目前國內發展智算網絡技術的剛性需求。新華三DDC方案可以很好地兼容各個廠商的算卡,給用戶組建多元異構算力集群創造了條件,也可以幫助用戶降低成本開支。這為國內AI智算集群建設提供了一個更理想的選項。

      極簡部署+極簡運維

      新華三DDC方案需要聯接海量設備和異構算力,業務流量大,流量特征復雜。這給整個系統的運維帶來了很大的挑戰。

      對此,新華三推出了AD-DC智算版智能管控分析平臺。該平臺預設了DDC開局模板,具備一鍵自動上線功能,設備即插即用,無需復雜調優,從而大幅簡化部署流程,可以實現天級快速交付。

      通過平臺,還可以對整個DDC網絡進行可視化管理,直接掌控全網架構。平臺也可以自動檢測設備間的鏈路狀態,如果發現斷連、錯連等異常,就會及時告警,實現可視化定位。


      AD-DC智算版智能管控分析平臺引入了AI算法進行運維。系統會實時采集設備端口流量、Pause幀等關鍵指標,結合AI算法進行深度分析,精準識別網絡擁塞、異常流量等潛在故障。

      在芯片丟包、光模塊故障等方面,AD-DC都有快速診斷能力,可以大幅降低系統運行風險,減少對訓練任務造成的影響。

      開放生態,共建產業標準

      最后,我們再來看看DDC的生態。

      行業里的智算網絡方案分為封閉(私有閉源)和開放兩種。業界有一些可提供GPU和網絡方案的廠商,就會通過集合通信庫(CCL)將二者進行捆綁,迫使客戶只能選擇整套解決方案。

      新華三在設計DDC架構之初,就選擇了“生態開放”的路線。

      DDC的控制平面使用標準的BGP EVPN協議,不但實現網元之間自協商、自組網,降低了配置復雜程度,更能支持不同廠商的NCP/NCF實現異構組網。

      這幾年,新華三一直堅持這個路線沒動搖。2024年,他們攜手合作伙伴,發布了OSF(Open Schedule Fabric,開放調度網絡)協議網絡架構,分別在需求場景分析、方案框架定義、技術方案落地等三個方面提交了多篇標準議案,得到了IETF組織的認可。這個架構將調度式網絡架構與傳統以太網絡結合,能夠達到均衡利用網絡資源、故障快速切換等優化目標。

      正如前面所說,國內的智算建設具有多元化的特點。所以,開放生態顯然更適合當下的發展趨勢。往小了說,開放生態對用戶有利,降低了使用智算算力的技術難度,也減少了成本投入。往大了說,我們國家智算基礎設施的建設布局,以及整個智算產業和生態的健康發展,都會隨之受益。

      結語

      好啦,寫到這里,相信大家對新華三的DDC方案已經有了充分的了解。

      智算中心的總投資中,智算網絡投資占比僅為10%。10%的智算網絡投資將會撬動30%以上算力效能提升。這是一個非常劃算的買賣。

      這充分說明,在智算時代,網絡已不再是單純的“聯接”。它與計算深度融合,可以發揮“算力×聯接”的倍增效應。

      新華三開了一個好頭,通過DDC架構創新,解決了智算網絡在超大規模、極致性能與生態適配方面的難題,不僅為國產化方案樹立了標桿,也為全球用戶提供了新的選項。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      章子怡這一整像好多人 就是越來越不像自己 網友:變萌變好看了

      章子怡這一整像好多人 就是越來越不像自己 網友:變萌變好看了

      塵埃里的看客
      2026-03-20 22:32:14
      研究發現:就算駕駛每秒一光年的飛船,也飛不到宇宙的邊緣

      研究發現:就算駕駛每秒一光年的飛船,也飛不到宇宙的邊緣

      觀察宇宙
      2026-03-20 18:55:12
      舒淇雷軍同框太戳心!年過半百仍藏社恐溫柔,這份純粹太難得

      舒淇雷軍同框太戳心!年過半百仍藏社恐溫柔,這份純粹太難得

      阿廢冷眼觀察所
      2026-03-21 20:38:59
      兩個小藥丸兒,一個助硬,一個延時長,在家門口的藥店就能買到

      兩個小藥丸兒,一個助硬,一個延時長,在家門口的藥店就能買到

      中醫陳旺醫生
      2025-11-14 10:43:05
      曝雙頂流的孩子已經三周歲

      曝雙頂流的孩子已經三周歲

      聚焦最新動態
      2026-03-21 08:06:03
      去深圳才發現:年輕人都不穿耐克、薩洛蒙了,滿街都是這3個品牌

      去深圳才發現:年輕人都不穿耐克、薩洛蒙了,滿街都是這3個品牌

      白宸侃片
      2026-03-11 13:18:49
      金價真的一夜變天了!3月21日最新報價,全國金價竟然差這么多?

      金價真的一夜變天了!3月21日最新報價,全國金價竟然差這么多?

      次元君情感
      2026-03-21 14:19:47
      多賽一場9分領跑 阿森納遭魔鬼賽程 也無需擔心1周1賽曼城能反超

      多賽一場9分領跑 阿森納遭魔鬼賽程 也無需擔心1周1賽曼城能反超

      智道足球
      2026-03-21 10:33:24
      下周有望走強的五大板塊梳理

      下周有望走強的五大板塊梳理

      風風順
      2026-03-21 12:49:26
      門口放三樣東西,再窮也能翻身!不是迷信,是老祖宗傳下的理兒

      門口放三樣東西,再窮也能翻身!不是迷信,是老祖宗傳下的理兒

      千秋文化
      2026-03-19 21:08:53
      猶太人沒想到,遍布全球掌控美國,無法戰勝的對手居然是中國!

      猶太人沒想到,遍布全球掌控美國,無法戰勝的對手居然是中國!

      瑛派兒老黃
      2026-03-21 00:27:15
      真被馬斯克說中,全球爭搶的不是芯片,而是中國20萬一臺的變壓器

      真被馬斯克說中,全球爭搶的不是芯片,而是中國20萬一臺的變壓器

      小冠說娛
      2026-03-20 17:18:07
      香港再無董建華

      香港再無董建華

      華人星光
      2025-11-25 12:01:27
      北京這天,49歲袁泉和54歲寧靜同框,骨相美和皮相美的差距明顯

      北京這天,49歲袁泉和54歲寧靜同框,骨相美和皮相美的差距明顯

      洲洲影視娛評
      2026-03-21 18:04:56
      中央批準:這位央企女老總,出任省委常委!

      中央批準:這位央企女老總,出任省委常委!

      運營商段子手
      2026-03-21 18:02:16
      【科研】顏寧院士發微博拒絕會議,因為“不能一直輸出,必須要有學習和沉淀”

      【科研】顏寧院士發微博拒絕會議,因為“不能一直輸出,必須要有學習和沉淀”

      新浪財經
      2026-03-20 07:08:44
      出差凌晨5點回到家,發現妻子不在,我打開手機定位找到她位置

      出差凌晨5點回到家,發現妻子不在,我打開手機定位找到她位置

      草莓信箱
      2026-03-20 10:41:22
      戀愛腦星座TOP3,愛到沒有底線,太真實了!

      戀愛腦星座TOP3,愛到沒有底線,太真實了!

      朗威談星座
      2026-03-21 22:10:26
      美國被曝計劃奪取伊“核儲備”!伊朗總統:未尋求發展核武器!伊朗軍方威脅打擊美以官員:在國外度假也將不再安全

      美國被曝計劃奪取伊“核儲備”!伊朗總統:未尋求發展核武器!伊朗軍方威脅打擊美以官員:在國外度假也將不再安全

      每日經濟新聞
      2026-03-21 22:40:54
      原來她早已離世!抗癌七年花了7500萬,59歲去世老公發誓終身不娶

      原來她早已離世!抗癌七年花了7500萬,59歲去世老公發誓終身不娶

      甜柚敘事
      2026-03-21 11:49:23
      2026-03-22 01:55:00
      鮮棗課堂 incentive-icons
      鮮棗課堂
      ICT知識科普。
      1008文章數 1257關注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機器人出貨量第一!

      頭條要聞

      伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

      頭條要聞

      伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      田栩寧終于涼了?出軌風波影響惡劣

      財經要聞

      通脹警報拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

      態度原創

      手機
      藝術
      家居
      旅游
      數碼

      手機要聞

      終端市場集體喊“漲” 手機面板持續走“跌”

      藝術要聞

      斯托揚畫作:她們的眼神能勾動你的心!

      家居要聞

      時空交織 空間綺夢

      旅游要聞

      【花Young貴陽】春日限定!十里河灘海棠花盛開引客來

      數碼要聞

      炸鍋!國產存儲芯片再突破!手機固態價格大跳水,內存自由要來了

      無障礙瀏覽 進入關懷版