![]()
圖片來源@unsplash
由AI大模型基礎設施熱潮引發的機械硬盤短缺現狀,正于近段時間持續上演。
過去,機械硬盤(HDD)產業高度集中,其供應往往受季節性、周期性需求影響。因為一旦客戶完成硬件部署,供應量超過需求量,硬盤價格就會隨之波動。
相關供應鏈報告最新顯示,2025年第四季度合同談判結束后,機械硬盤合約價格環比上漲約4%,創下過去八個季度以來的最大漲幅,預計這一上漲趨勢還將持續。
同樣是數據存儲,機械硬盤如何為AI發展提供支撐?
相較于閃存(Flash),機械硬盤的隨機讀寫速度較慢,其優勢在于大規模部署下具備良好的經濟性,能夠提供出色的長期數據保存能力。這意味著,機械硬盤非常適合于存儲海量數據,例如數據預處理階段的原始數據集、AI推理階段模型生成的各類數據等。
在中美企業級市場,特別是對AI云競相投資的云服務廠商和超大規模數據中心,對機械硬盤拋出了大量長期需求訂單。
老牌巨頭西部數據洞察了這一市場先機。
西部數據最新季度財報顯示,截至2026年1月2日的第二季度,收入30.2億美元,同比增長25%,且預計下一季度收入將同比增長約40%。財報電話會上,西部數據CEO Irving Tan透露,2026年產能已全部售罄,并與三家頭部客戶簽署長期合約。
至于如何增加產能以滿足客戶需求?這并非著只增加原有硬盤出貨量就可以。通過與客戶的長期協議和容量約定,西部數據認為,AI時代需要不斷通過創新開發更高容量、更高性能、功耗更低的硬盤,在與客戶的不斷驗證中重塑硬盤技術。
實際上,自2025年年初,西部數據與閃迪分拆后,就開始更加專注于機械硬盤業務,力求通過技術創新與產品實踐以抓住AI時代的機遇。
在近日舉辦的Innovation Day上,西部數據正式從Western Digital更名為WD,并對其產品進行了明確定位。包括:
1. 更高容量:推出首款40TB UltraSMR ePMR HDD,并計劃在2029年實現HAMR技術100TB容量的突破。通過ePMR(能量輔助垂直磁記錄)和HAMR(熱輔助磁記錄)兩種技術路徑并行發展,為客戶提供多樣化選擇與靈活性,實現平滑過渡,避免業務中斷。 2. 更高性能:通過高帶寬硬盤(High Bandwidth Drive Technology)與雙樞軸技術(Dual Pivot Technology),提供2倍帶寬(未來可達8倍)以及2倍順序IO性能增益,以HDD的經濟性支持AI工作負載,同時降低對閃存的依賴。 3. 優化能效:推出全新功耗優化型HDD,可降低20%功耗,以降低客戶總體擁有成本(TCO)。
![]()
在西部數據看來,目前有一類客戶擁有大量數據和AI工作負載,起初用的是閃存,現在希望用上HDD去兼顧經濟效益和性能。但這類客戶有一部分沒有時間或資源去開發必要的軟件,來適配并利用UltraSMR、高帶寬和高IO等技術優勢。為此,西部數據還將計劃推出整合了HDD優勢的簡化方案,通過提供一個智能軟件層API,客戶僅需通過最小化的軟件調整,即可在其基礎設施中充分利用HDD。
在活動前夕,筆者獨家對話西部數據首席產品官Ahmed Shihab,針對西部數據如何應對需求的激增,產品路線圖,以及AI時代的產業變革進行探討。Ahmed曾任微軟負責存儲共享產品,并曾在AWS負責基礎設施構建。
Ahmed指出,AI時代數據激增帶來的存儲需求有兩個重要變化:一是模型消耗數據的速度加快,客戶希望繼續利用基于HDD的對象存儲中的數據,但他們開始通過構建智能的數據管道來排隊處理數據,以確保存儲能跟上計算需求,使GPU得到充分利用;
二是客戶在數據攝入和訓練之間增加了一個步驟:數據清洗或篩選,以確保數據質量,以及利用推理過程的輸出來與客戶交互,重新調整數據并進行模型再訓練,以確保答案的正確性并提升模型精度。
Ahmed認為,HDD產業的發展動力是多元化的。AI確實是容量需求的一大驅動力,但云原生應用的需求也在增長。
談及中美客戶市場,Ahmed指出,雖然客戶構建GPU集群的節奏可能不同,但對數據的需求都在持續增長。AI發展需要海量數據,無論GPU數量多寡,數據量都在增加。中美客戶都在尋求可靠、低能耗和大容量的HDD。
以下是對話實錄,經筆者編輯整理。
問:回顧過去三年,大模型帶來的存儲挑戰在不同時期有哪些特征?例如在大模型爆發初期,業內可能更追求模型訓練的速度;而近兩年大家對數據質量要求更高,希望模型落地更具真實性。在你看來,從2023年大模型爆發至今,存儲需求有哪些發展變化?
Ahmed Shihab:起初,大語言模型主要專注于展示其能力。但隨著人們開始使用這些模型,重點轉向了模型的實用性,即回答現實生活中的問題并為客戶做更多事情。因此,語言模型變得越來越大,需要的數據量也急劇增加。這不僅包括原始訓練數據,還包括用戶與模型交互過程中產生的數據。
隨著數據規模擴大,模型消耗數據的速度也在加快。客戶希望繼續利用基于HDD的對象存儲中的數據,但他們開始通過構建智能的數據管道(Pipelines)來排隊處理數據,以確保存儲能跟上計算需求,使GPU得到充分利用。為了支持這一點,我們在軟件基礎設施方面看到了巨大的演進。
另一個顯著變化是,客戶在數據攝入和訓練之間增加了一個步驟:數據清洗或篩選(Data Curation),以確保數據質量。通過在輸入模型前篩選出高質量數據,可以創建更準確的模型,減少幻覺,并為用戶生成更真實的回復。最后一步是利用推理過程的輸出來與客戶交互,重新調整數據并進行模型再訓練,以確保答案的正確性并提升模型精度。所有這些過程都生成了更多數據,并產生了更快處理數據的需求。正是基于這些變化,我們調整了產品路線圖。
![]()
問:關于剛才提到的容量路線圖,我記得此前提到的目標是2030年達到50TB。而剛才調整為2029年達到100TB。請問這一路線圖的調整是基于哪些判斷?又是通過哪些技術手段來實現的?
Ahmed Shihab:是的,我們的路線圖計劃讓客戶在2029年能夠開始對100TB容量的HDD進行技術認證。實現這一目標需要多種技術的結合。我們利用現有的HAMR技術,這是一種我們已經研發并與客戶共同測試了一段時間的新型記錄技術。此外,我們正在開發的其他技術包括磁學與存儲介質領域,通過HAMR技術和硬盤內激光技術的改進大幅提升面密度,從而增加每張磁碟的數據存儲量。所有這些創新都將在現有的3.5英寸規格內實現。
問:去年與中國廠商交流時,有反饋說AI爆發前存儲系統并未受到足夠重視,甚至有人認為HDD產業遇到了天花板。現在AI出現了,請問HDD的增量市場是否全部來自AI?
Ahmed Shihab:HDD產業的發展動力是多元化的。AI確實是容量需求的一大驅動力,但云原生應用的需求也在增長。此外,社交媒體中的視頻、流量增加和內容生成也在推動HDD需求增長。而且,大部分數據被保留的時間更長了,因為它們可以用于訓練AI。因此,我們看到AI、云和企業級市場都在增長。最后補充一點,AI確實加速了我們的路線圖。此前客戶已經在尋求更大容量、更高性能、更節能的硬盤,而持續的市場需求增長和硬盤的TCO優勢確實加速了我們原有的進程。
問:客戶選擇HDD通常是因為比起閃存更便宜。但這兩年隨著AI帶來需求增長,HDD的價格似乎也在快速上漲。你提到要幫助客戶降低TCO,但在市場需求推動下,HDD的單價是否其實在不斷增長?
Ahmed Shihab:西部數據始終關注客戶需求,并確保定價的公允性。我們致力于與客戶建立長期合同和合作伙伴關系,以實現雙贏。我們著眼于市場上更加重大的機遇,以保障客戶增長的可持續性。這是我們一貫為客戶去做的事情,未來也將持續踐行。
問:從全球視角來看,你認為目前的市場格局如何?特別是中國市場和美國市場在發展上有哪些差異?
Ahmed Shihab:全球趨勢顯示,對AI的需求正持續攀升,這源于各方競相開發頂尖AI技術的競爭——因為未來二十年,AI將重新定義人類的生活方式。這種需求當前依然強勁,且呈現持續增長態勢。我們已獲得全球許多客戶的堅定需求承諾,包括在中國和美國市場。
問:從應用側的角度,老舊數據中心與新建的算力中心有所不同。你認為老舊數據中心是否有必要進行HDD容量升級改造?如果有必要,改造的難度和成本有多高?
Ahmed Shihab:客戶在評估基礎設施時,通常會比較現有資產的TCO與更換更大容量新硬盤的成本。每位客戶的考量方式不同,取決于利用率、需求或電力等多種因素,因此得出的結論也不盡相同。我們鼓勵客戶審視自身容量狀況,思考如何最大化利用現有資源。要給出適用于所有客戶的通用答案確實困難。不同情境下的解決方案也大相徑庭。
問:關于建設萬卡集群,像美國云廠商推進節奏快、規模大,而中國這邊節奏相對較慢。這種區別是否會導致雙方對大容量HDD的需求不同?在服務實施和與西部數據團隊溝通中,會有明顯的差異嗎?
Ahmed Shihab:雖然客戶構建GPU集群的節奏可能不同,但對數據的需求都在持續增長。AI發展需要海量數據,無論GPU數量多寡,數據量都在增加。在這個意義上,我們并沒有看到太大的區別。我們看到無論是美國還是中國的客戶,無論節奏快慢,他們對我們的要求本質上是一樣的:他們都在尋求可靠、低能耗和大容量的HDD。正因如此,我們制定了發展路線圖并提升技術能力,以響應這些客戶的需求。(作者 | 楊麗,編輯 | 蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.