![]()
L3緩存容量飆到5.3倍。
作者 | ZeR0
編輯 | 漠影
芯東西拉斯維加斯12月4日報道,剛剛,在年度云計算盛會AWS re:Invent上,全球最大云計算巨頭亞馬遜云科技(AWS)發布第五代自研服務器CPU——Graviton5。
![]()
Graviton5在單個封裝中集成192個核心,核心數較上一代翻倍,核心架構升級為Neoverse V3,并優化了內存系統,搭配大容量緩存,支持DDR5-8800內存,IO系統支持DDR5內存,且是亞馬遜云科技服務器集群中首款支持PCIe Gen 6的CPU。
該芯片配備2MB二級緩存(L2 Cache);三級緩存(L3 Cache)容量達到前代產品的5.3倍,達到192MB,這意味著每個核心能獲得高達2.6倍的三級緩存,帶來更優的整體性能和穩定性。
在AWS re:Invent大會期間,亞馬遜云科技副總裁、杰出工程師Ali Saidi與芯東西等少數媒體進行了深入交流。Saidi告訴芯東西,Graviton5采用3nm制程,已掌握成熟的電壓控制技術,主頻適中,同時通過系統層面的創新優化散熱,例如采用裸片冷卻技術,去除CPU頂蓋,減少頂蓋帶來的熱阻,直接在CPU上安裝散熱器,確保核心能夠有效散熱,無需擔心散熱問題。
據Saidi透露,亞馬遜云科技正與內存供應商合作,推動現有產品支持更高頻率,對不同工作負載的測試表明,這是一套平衡的系統,能夠為核心提供充足的內存帶寬,同時實現顯著的性能提升。
亞馬遜在2018年發布了首款Graviton處理器,2019年推出Graviton2,2021年推出Graviton3,2023年發布Graviton4。每一代產品都力求實現25%~30%的性能提升,Graviton5也不例外——每個核心性能比上一代提升約25%。
亞馬遜云科技針對多種工作負載進行了測試:在CPU密集型機器學習場景中,Graviton5比Graviton4快32%;在Nginx等負載均衡場景中,速度提升27%;作業類應用速度提升30%至40%;數據庫場景中,不同類型數據庫的性能普遍提升約30%。
亞馬遜云科技計算與機器學習服務副總裁Dave Brown在演講中分享了一些Graviton5早期客戶的測試數據:Airbnb性能提升高達25%,Atlassian性能提升30%、延遲降低20%,Honeycomb.io延遲降低25%、每核心性能提升36%,SAP的SAP HANA分析查詢性能提升60%。
![]()
蘋果云系統與平臺副總裁Payam Mirrashidi也來到現場為AWS Graviton CPU站臺。
他分享說,目前,蘋果每天通過運行在亞馬遜云科技和Graviton上的Swift應用處理數十億次請求。將核心服務用Swift重構并遷移到Graviton后,蘋果實現了40%的性能提升和30%的成本降低。從x86到Graviton的遷移過程極為順暢,幾乎可以直接替代Java環境。蘋果早在十多年前就將移動設備遷移到Arm架構。
![]()
“如今,遷移到基于Arm的Graviton,我們再次收獲了基礎設施效率提升的巨大價值。”Mirrashidi說,“我們迫不及待地想看到大家用AWS Graviton和Swift創造出更多精彩成果。”
據Saidi分享,亞馬遜云科技與Arm在核心定義方面密切合作:Graviton2采用Neoverse N1核心,Graviton3采用Neoverse V1核心,Graviton4采用Neoverse V2核心,Graviton5采用Neoverse V3核心。每一代都通過與Arm合作,確保核心滿足需求,進而為客戶帶來顯著性能收益。
”Graviton的成功證明,通過授權Arm IP,我們能夠打造出具有行業競爭力的系統。未來,我們將繼續專注于這一模式,持續為客戶創造價值。”Saidi說。
基于Graviton5的M9g實例(預覽版)今日同步發布,相比M8g實例性能提升高達25%,是目前Amazon EC2中性價比最高的實例。
![]()
Saidi在媒體溝通會期間分享說,該實例每核心配備4GB內存,將于2026年正式全面可用,后續還將拓展更多實例類型。
以Graviton4為例,亞馬遜云科技提供的實例最高支持3TB內存、190個核心、600Gbps網絡帶寬和100TB存儲容量,涵蓋多種實例類型,可滿足客戶各類工作負載需求。
目前Graviton5僅推出一款實例類型,未來將拓展更多選擇。
亞馬遜云科技公用計算高級副總裁Peter DeSantis在演講中談道,亞馬遜云科技云服務的核心屬性包括安全性、可用性、彈性、成本等,亞馬遜云科技正在大規模投資數據中心、電力和容量建設,以支持AI轉型,同時大力投入降低模型構建和工作負載運行的成本。如今亞馬遜云科技的芯片系列包括Graviton專用服務器CPU和Trainium AI訓練芯片等。
![]()
亞馬遜云科技計算與機器學習服務副總裁Dave Brown回顧了亞馬遜云科技造芯歷程和設計思路的演變。據他分享,Nitro系統改變了人們對云計算可能性的認知,證明只要能掌控芯片、硬件和系統架構,就能實現商用硬件無法企及的性能和效率提升。在深入研究Nitro系統的過程中,亞馬遜云科技自然產生了一個疑問:
“既然定制芯片能同樣改善網絡和存儲性能,為什么不能將其應用于計算領域?”
于是,亞馬遜云科技重新思考:如果專門為云工作負載設計一款服務器處理器 —— 不是適配、不是改造,而是從零開始為云原生場景打造——會是什么樣子?
這就是Graviton處理器的由來。
這款全新設計的處理器,核心目標是為客戶在云中日常運行的工作負載提供最優性價比。
如今,各行各業的企業都在通過Graviton獲得更高性能和更低成本:Adobe將碳排放減少37%,Epic Games借助它支撐全球大規模低延遲游戲工作負載,F1通過Graviton使模擬運算速度提升40%,Pinterest降低了47%的成本,SAP的云原生SAP應用性能提升35%。
這些正在運行的生產系統,通過Graviton實現了更快、更環保、更經濟的運行。
其軟件合作伙伴通過優化編譯器、改進運行時、完善庫文件,并在平臺上全面支持Graviton。圍繞Graviton形成的長期架構和行業協作生態還在持續成長和成熟。
![]()
要在Amazon EC2中實現最優性價比,需要關注每一個層級。除了提高芯片性能外,這還涉及系統的構建和運行方式。
由于亞馬遜云科技同時設計處理器和服務器,它能夠實現全棧優化,其中就包括客戶不常關注的散熱環節。
大多數處理器采用傳統散熱方案:芯片之上是熱界面材料,然后是保護頂蓋,再覆蓋一層熱界面材料,最后是散熱器。這種方案可靠且易于制造,幾十年來一直是行業標準,但亞馬遜云科技深入分析后發現,其物理原理存在優化空間。
熱傳遞的物理邏輯很簡單:散熱路徑中的每一層都會減緩熱量傳導,阻力越大,結溫越高;而高溫會增加漏電率,漏電率上升又會導致功耗增加,低效問題會迅速累積。
![]()
傳統CPU采用這種設計,是因為需要適配多種系統、形態和工具方案,頂蓋能提供穩定的接口。
但由于亞馬遜云科技掌控著Graviton的整個系統,有機會嘗試不同思路。
因此,它沒有遵循傳統模式,而是設計了 “直接貼合芯片” 的散熱方案:移除頂蓋和對應的熱界面材料,減少熱阻,讓熱量傳導更高效。這需要精密制造和精心選材,但成果顯著——風扇功耗降低了33%。
![]()
提升系統效率只是實現卓越性能的一部分,芯片本身必須一代比一代更出色。Graviton的研發是長期且持續迭代的過程:每一代產品都會拓展支持的工作負載類型,而新工作負載的出現會讓亞馬遜云科技發現新的瓶頸,進而指導下一代產品的研發,形成持續優化的循環。
![]()
每一款Graviton處理器都基于前代成果,不斷推動架構向前發展。
![]()
亞馬遜云科技針對實際應用性能優化Graviton。在Graviton3時代,亞馬遜云科技發現二級緩存(L2 Cache)缺失對實際工作負載性能有明顯影響。
![]()
緩存是CPU性能最重要的影響因素之一,因此成為其核心優化方向。緩存的作用是存儲頻繁訪問的數據,若數據不在緩存中,處理器就必須訪問主內存,速度會慢得多。
![]()
現代CPU采用三級緩存架構:一級緩存(L1)最快但容量最小,二級緩存(L2)容量更大但速度稍慢,三級緩存(L3)容量最大且為所有核心共享。
如果三級緩存都未命中,就必須訪問DRAM,耗時可達100ns。對CPU周期而言,這是很長的時間。
![]()
因此,大容量緩存至關重要:能將更多數據留在核心附近,減少慢速內存訪問。
![]()
基于此,Graviton4將每個核心的二級緩存容量從1MB翻倍至2MB,這也是其相比Graviton3性能提升高達30%的原因之一。
![]()
二級緩存擴容顯著降低了二級緩存缺失率。
![]()
但CPU設計始終需要權衡取舍:Graviton4的核心數增加了15%,三級緩存僅增加12%。
![]()
這對于當時要支持的縱向擴展工作負載是合適的平衡,但更多核心共享相對少量增加的三級緩存,導致每個核心能分配到的三級緩存反而減少,進而使三級緩存缺失率上升。這就是芯片設計中需要不斷評估的權衡問題。
![]()
此外,亞馬遜云科技還進行了一項重大架構調整:在兩個CPU之間添加一致性鏈路,使其能為數據庫和大型分析工作負載提供最多192個核心。
![]()
但鏈路連接會帶來額外開銷:當一個核心需要訪問另一個CPU上的內存時,請求必須通過互連鏈路傳輸,增加延遲、協議開銷,有時還會出現排隊,在某些場景下,耗時可能達到原來的3倍。
因此,其團隊思考:能否在單個封裝中實現192個核心,同時讓所有核心都能均勻、快速地訪問內存,并配備更大容量的緩存?
這就是Graviton5設計的來源。
如今,使用亞馬遜自研服務器CPU Graviton系列的客戶數量已超過90000家,實現數百萬顆CPU量產。
其中包括前1000名Amazon EC2大客戶中的98%,涵蓋初創企業、大型企業等不同規模的客戶,部分客戶的大部分甚至全部計算工作都運行在Graviton上。這些客戶包括Adobe Analytics、SAP、亞馬遜自身、Stripe、Pinterest、Airbnb等知名企業。
多年來,Graviton一直是Amazon EC2中性價比最高的選擇,讓客戶“以更少成本實現更多價值”。
客戶采用Graviton后,通常有兩種方式轉化性能提升的價值:一種是改善應用延遲,對于延遲敏感型場景,Graviton帶來的更高性能和更低延遲,能直接推動業務成果優化;另一種是在保持服務等級協議(SLA)或延遲不變的前提下,提升每秒事務數或請求數。
對于擁有大規模服務器集群的客戶而言,如果每個實例的處理能力提升25%,意味著服務器數量可減少25%,性能提升直接轉化為成本降低。
再加上Graviton本身相比x86產品的成本優勢,客戶能獲得顯著的性價比提升。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.