某高校HPC選型立項(xiàng)會現(xiàn)場
幾位大甲方正在激烈討論…
![]()
![]()
![]()
![]()
這位副院長所說的分享,其實(shí)是
上周某「科研算力基礎(chǔ)設(shè)施」閉門會
會上,一位大型科研機(jī)構(gòu)的研究員
講出了自己單位的HPC選型心得
![]()
他的開場白,有這么一段
「我不是反對GPU,但我們所里大部分HPC集群,還都是用CPU來搭建的」
![]()
為啥選CPU呢?這位專家繼續(xù)解釋
在我們科研單位,一個(gè)HPC集群
通常要承載不同科研任務(wù)
這些任務(wù),來自不同科研團(tuán)隊(duì)
對算力的需求,也是千差萬別
有的吃緩存、有的吃IO、有的吃主頻
CPU可以更靈活應(yīng)對這些負(fù)載,效率奇高

還有,我們跑的軟件
都是科研軟件,一般人都沒聽過
大量科研軟件,都優(yōu)先支持CPU
這些軟件的廠家,更愿意在CPU上做優(yōu)化

總之,科研任務(wù)「雜而重」
CPU是全能型選手(性能、靈活性、兼容性)
扛活兒能力更強(qiáng)
基本邏輯搞明白,接下來問題是
市面上CPU,選哪款比較好?
當(dāng)然是
第五代AMD EPYC 處理器
Turin系列中的【AMD EPYC 9755】
這也是AMD最新一代CPU
![]()
話說,這款“9755”一問世
就被很多科研大佬瘋狂點(diǎn)贊
他們也有過買不到合適算力卡的苦惱
結(jié)果“9755”把這些高端大活兒都包辦了
這顆“懂科研的CPU”
一口氣解決困擾科研人員的六大難題
![]()
HPC機(jī)房是科研院所的香餑餑
每個(gè)課題組都在搶資源
之前大家都是輪流排隊(duì)共用
動不動就是幾十個(gè)仿真任務(wù)同時(shí)跑
而且個(gè)個(gè)大活兒,負(fù)載重、周期長
![]()
采用AMD EPYC 9755
可以有效緩解HPC機(jī)房的排隊(duì)狀況
因?yàn)檫@家伙的性能確實(shí)強(qiáng)悍
采用先進(jìn)的4nm制程
單顆CPU,高達(dá)128核,256 個(gè)線程
更有同門師兄“9965”甚至能提供192核

以一臺雙路HPC節(jié)點(diǎn)為例
搭載2顆 AMD EPYC 9755
單節(jié)點(diǎn)算力,就能飆到22.12TFlops
干起活來嗖嗖快

而且,“9755”采用了全新Zen 5架構(gòu)
具備了更高IPC(每時(shí)鐘指令數(shù))
IPC越高,CPU單位時(shí)間內(nèi)處理任務(wù)越多
相比上一代Zen 4架構(gòu)
通用任務(wù)快17%,AI和科研任務(wù)快37%

![]()
一個(gè)典型科研計(jì)算任務(wù)
比如迭代計(jì)算、量子化學(xué)模擬
需要【高強(qiáng)度+大規(guī)模+長時(shí)間】穩(wěn)定計(jì)算
極大挑戰(zhàn)CPU的“抗壓能力”
這期間要:不降頻,不掉速,全程拉滿

而“9755”專干這種大場面
高頻穩(wěn)定輸出,一口氣干到底
它基礎(chǔ)頻率 2.7GHz,最高可達(dá)4.1GHz
還有能飆到5GHz的同門兄弟
好比一場科研馬拉松長跑
起跑快、途中快、沖刺快,全程不降速

![]()
有些科研任務(wù)
可能包含大規(guī)模矩陣乘、浮點(diǎn)運(yùn)算等
比如結(jié)構(gòu)力學(xué)、流體力學(xué)、電磁場仿真等
要是CPU不給力,漫長等待如煉獄

莫慌,“9755”支持AVX-512指令集
具有完整的512b數(shù)據(jù)路徑
這可是應(yīng)對矩陣計(jì)算的秘笈
讓它可以全程保持較高的全核頻率
算得又快又穩(wěn),告別漫長等待

![]()
大型計(jì)算任務(wù),往往伴隨海量數(shù)據(jù)
不是算不動,而是數(shù)據(jù)“堵在半路了”
內(nèi)存帶寬跟不上,IO通道也擁堵
數(shù)據(jù)加載慢一步,CPU就只能躺平

AMD EPYC 9755早就修好數(shù)據(jù)高速路
首先,大緩存拉滿
配備高達(dá)512MB的L3緩存
熱數(shù)據(jù)直接放在自己“被窩”里
先來一波“近場訪問”,絕對不卡殼

第二,內(nèi)存通道拉滿
每顆CPU支持12通道DDR5內(nèi)存
內(nèi)存容量最高可擴(kuò)展到 6TB
第三,內(nèi)存速率拉滿
最高支持6400MT/s
數(shù)據(jù)加載又快又穩(wěn)

最后,高速IO拉滿
支持PCIe 5.0 + CXL 2.0
高速設(shè)備隨心擴(kuò)展,數(shù)據(jù)流轉(zhuǎn)暢通無阻

![]()
科研軟件是“有脾氣”的
有的對緩存特別敏感
就要大緩存、高內(nèi)存帶寬
有的盯著頻率,主頻越高越歡
有的看核數(shù),偏愛高核心數(shù)

AMD EPYC 9755好比超級大廚
能夠滿足各種軟件的不同胃口
高核心數(shù)、高頻率、大L3緩存、高IPC、
12通道 DDR5 6400、AVX-512...
還有一點(diǎn),它是X86架構(gòu)
生態(tài)兼容性好,適配度和優(yōu)化完善

![]()
HPC集群一上量
采購成本、運(yùn)營成本,都是大開支
電老虎一發(fā)威,每年動輒百萬級電費(fèi)
![]()
AMD EPYC 9755堪稱性價(jià)比王者
前期采購看→相同預(yù)算,算力更高
同樣規(guī)模下,搭載“9755”的集群
擁有更多核數(shù)、更高主頻、更強(qiáng)算力
算效比更高
后期上線看→相同電費(fèi),效率更高
“9755”能效比高,功耗更低
跑同樣多任務(wù),電費(fèi)省下一大筆
![]()
長遠(yuǎn)運(yùn)營看→便于內(nèi)部統(tǒng)一統(tǒng)籌
搭載“9755”的集群支持高效虛擬化調(diào)度
單位可以將HPC集群統(tǒng)一建設(shè)和管理
避免院系、科室自建,造成浪費(fèi)
既能提供超大規(guī)模算力
又能按需靈活分配資源
![]()
怎么樣,科研場景六大難點(diǎn)
AMD EPYC 9755全部攻克
讓每個(gè)科學(xué)計(jì)算項(xiàng)目,都絲滑無比
讓科研經(jīng)費(fèi)的每分錢,都花在刀刃上
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.