(本文編譯自Electronic Design)
在數字化時代的浪潮下,數據中心作為信息存儲、處理和傳輸的核心樞紐,正經歷著迅猛的發展。隨著信息技術的飛速進步,數據中心所承載的業務量與日俱增,從傳統的互聯網服務到新興的人工智能、大數據分析、云計算等領域,其應用范圍不斷拓展。這不僅促使數據中心的規模持續擴大,更使得機架功率密度急劇攀升。如今,數據中心機架功率密度已突破每架 100 千瓦以上,不斷挑戰著數據中心熱設計的極限。
功率密度的大幅提升,意味著數據中心在單位空間內產生的熱量呈幾何倍數增長。傳統的散熱方式,如風冷技術,在面對如此高強度的熱量產生時,逐漸顯得力不從心。因此,尋求一種高效、可靠的散熱技術,成為了數據中心行業發展的當務之急。液冷技術正是在這樣的背景下應運而生,它以其卓越的散熱性能,為高密度數據中心的散熱難題提供了可行的解決方案。
高性能計算和人工智能帶來的散熱壓力
近年來,高性能計算(HPC)和人工智能(AI)技術的迅猛發展,為數據中心帶來了新的機遇,但也使其散熱壓力倍增。液冷技術正迅速成為解決數據中心散熱問題的關鍵方案。目前已有浸沒式、芯片直冷等多種液冷技術,但關于液冷的諸多誤解仍普遍存在。
如今,大多數現有供電設施長期來看將無法滿足這一需求。僅單塊圖形處理器(GPU)平均每日耗電量就達54千瓦時,相當于普通家庭兩天的用電量。而若擴展到5000個數據中心機架(配備30萬塊GPU),其耗電量約能為40萬戶家庭供電,規模堪比美國得克薩斯州奧斯汀市。如此龐大的耗電量,意味著會產生海量的熱量。
若冷卻系統無法充分散熱以實現最大計算性能(通常只能達到額定容量的75%以下),將給傳統數據中心的暖通空調(HVAC)設備帶來沉重負擔。軟件仿真技術可助力優化數據中心冷卻系統的設計。
數據中心的液冷解決方案
成功推行液冷解決方案,需要整合來自不同機構的多種技術。這些系統最好有序協同安裝,以打造可持續運營的數據中心。但要找到一家可靠的交鑰匙供應商并非易事,這類供應商需能全面負責方案制定、項目規劃、協調管理,以及現場所有各類技術的安裝,確保系統無縫啟動。
系統安裝完成后,終端用戶的維護工作可能相對復雜。盡管液冷解決方案的采用率正在攀升,但大多數數據中心技術人員并未接受過充分培訓,無法熟練操作液冷硬件及掌握必要的組件維護技能。
設計師在評估液冷解決方案前,必須明確自身的目標與訴求。下一步應制定計劃,對數據中心項目及其現有設備或目標新設備展開詳細審計,這將有助于明確設備要求與場地條件。
之后,需準備好清晰闡述自身目標,并篩選出最優的單一來源供應商。該供應商應不偏袒原始設備制造商(OEM),且精通多種液冷技術。
單一來源合作伙伴需具備以下能力:主導初期方案規格制定與范圍界定、采購用戶指定技術;提供現場項目管理與安裝服務、完成服務器的安裝調試;為新系統提供全生命周期維護。若設計師同時評估多家解決方案供應商,需記得向每家索取總擁有成本(TCO)匯總報告,以進行真實、可靠的對比。
常見液冷技術介紹
液冷技術適用場景廣泛、應用范圍全面,但安裝過程較為復雜。
后門熱交換器(RDHX)
后門熱交換器(RDHX)是一種在數據中心中應用較為廣泛的液冷技術。其工作原理是將熱交換器直接安裝在服務器機架的后門位置,通過冷卻液在熱交換器內部的循環流動,吸收服務器排出的熱空氣的熱量,從而實現對服務器的冷卻。后門熱交換器(RDHX)是最常用的技術之一,它是侵入性最低的液冷解決方案,可對現有機架系統進行改造升級。
芯片直冷技術(DTC)
芯片直冷技術(DTC)又稱冷板液冷或直接液冷(DLC)。其原理是通過將冷卻液直接傳導至服務器組件,如CPU、GPU等芯片表面,利用冷卻液的高比熱容和良好的熱傳導性能,迅速將芯片產生的熱量帶走,并通過循環系統將熱量傳遞出去,實現對芯片的有效冷卻。該技術對安裝人員要求更高、操作更復雜,但冷卻效率更高,且能支持更高的機架密度。
單相浸沒式冷卻技術
第三種方案是全液浸冷卻,即單相浸沒式冷卻技術。它將服務器或電子組件完全浸沒在具有導熱性且不導電的液態介電質中,以介電質作為冷卻劑來實現散熱的一種先進液冷技術。全液浸冷卻的安裝復雜度遠高于前兩者,但相比后門熱交換器和芯片直冷技術具有顯著優勢,比如能實現最高冷卻效率和最優計算性能。同時,它還能大幅降低數據中心對暖通空調系統的需求,減少機房環境噪音,改善工作人員操作體驗。
這種技術也被稱為開式槽浸沒冷卻,將服務器或電子組件浸入具有導熱性且不導電的液態介電質中,以該介電質作為冷卻劑,防止電路放電。這種不導電的液態介電液能吸收組件產生的熱量,且因屬于單相技術,在整個冷卻過程中始終保持液態。
介電冷卻劑是一種可傳遞電場力但不導電的介質,常見例子包括礦物油或去離子水系統。
冷卻劑與浸沒在槽中的發熱硬件直接接觸,硬件通過熱傳導升高冷卻劑溫度。受熱后的冷卻劑被泵送至熱交換器,經冷卻后再回流至開式槽中。冷卻塔就是熱交換器的一種類型。
單相冷卻系統維護成本更低、冷卻劑費用更少,且在蒸汽產生和冷卻劑蒸發方面的問題更少。
單相浸沒式冷卻的優缺點
單相浸沒式冷卻的優點包括:
散熱效率高:液體比熱容大,能高效帶走組件熱量,可應對高熱負荷場景。
冷卻均勻:介電液直接接觸并包裹浸沒的組件,實現組件整體均勻冷卻。
降低噪音:無需風扇或其他氣流驅動裝置,大幅降低環境噪音水平。
簡化冷卻設施:不依賴空氣循環,無需配備風扇、空調機組或大型冷卻基礎設施。
環境適應性強:系統相對隔離濕度、灰塵等環境因素,在惡劣環境中更具優勢。
該冷卻方式的缺點則如下:
初始部署成本高:浸沒式冷卻基礎設施造價不菲,對現有數據中心進行改造時成本尤其高昂。
冷卻液管理復雜:介電液的選型與管理至關重要,可能產生較高費用,且需確保材料的長期兼容性與穩定性。
維護與可達性差:組件維修或更換時需從冷卻液中取出,給維護操作帶來不便。
結語
展望未來,液冷技術在數據中心領域將迎來更為廣闊的發展空間。隨著人工智能、大數據、云計算等技術的持續發展,數據中心的規模和功率密度將進一步提升,對液冷技術的需求也將更加迫切。在技術發展方面,液冷技術將朝著更高效率、更低成本、更智能化的方向發展。在應用方面,液冷技術的應用范圍將不斷擴大。不僅在新建的數據中心中,液冷技術將成為主流的散熱方式,而且在對現有數據中心的改造升級中,液冷技術也將得到更廣泛的應用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.