財聯社4月3日訊(編輯 史正丞)隨著新年以來Anthropic、字節跳動等AI巨頭不斷發布爆款應用,疊加“龍蝦”熱潮推動開源大模型的調用激增,英偉達的H100芯片在租賃市場迎來身價“V型”反轉的高光時刻。
要知道,這款芯片是黃仁勛在2022年3月GTC上發布,同年秋季開始出貨的產品。
據半導體研究機構SemiAnalysis周四推出的“H100一年期租賃合約價格指數”,這款“老芯片”的租賃合約價格從2025年10月觸及每小時1.7美元后,已經在今年3月飆升至每小時每塊GPU 2.35美元,飆升近40%。
![]()
(來源:SemiAnalysis)
該指數基于對100多家云服務提供商、算力資源的買家和賣家進行的直接調查數據構建,每月采集一次。
最新報告指出,按需租用的GPU算力在所有類型GPU中都已售罄——即便近期價格上漲,那些已經鎖定按需實例的客戶也不愿把這些算力釋放回資源池。該機構也比喻稱,在2026年初尋找GPU算力,就像試圖預訂“最后一班離開航班”的機票一樣:價格高昂,而且幾乎沒有可用資源。
研究人員補充稱:“客戶正爭相以每塊GPU每小時14美元的價格搶購亞馬遜云服務的p6-b200競價實例,一些新興云服務巨頭(Neocloud Giants)甚至已經不再提供單節點銷售;部分英偉達H100 GPU仍按2—3年前簽訂時的原價續約,甚至有些H100合同直接續簽到2028年。”
至于架構更先進的Blackwell芯片?研究人員表示,由于對開放權重模型的強勁需求以及推理需求的持續激增,新部署Blackwell的交付周期現在正延長至6到7個月。
在2025年晚些時候,市場一度預期隨著性能更強、算力成本更低的Blackwell芯片加速部署,Hopper芯片(H100、H200)的租賃價格可能會出現大幅下降。但最新的情況恰恰相反,現在市場對H100的需求不僅保持堅挺,在許多情況下甚至還在增強。
SemiAnalysis在報告中指出,今年初算力需求的重要驅動因素之一來自原生媒體生成。例如,字節跳動的Seedance(即夢)和谷歌Nano Banana驅動用戶大量生成和優化視頻/圖像期間,推動詞元(token)吞吐量大幅上升。更顯著的需求來源是多智能體(multi-agent)工作負載的興起,推動詞元使用量和算力消耗呈拋物線式增長。
SemiAnalysis表示,光是他們自己“在過去一周里就消耗數十億詞元”,每百萬詞元成本在5美元左右。不過公司也心滿意足地表示,由此節省的時間以及工作流程與能力的擴展,帶來的回報遠超算力成本。
報告也指出,算力供應收緊且價格上漲的動態,與廣泛的市場情緒存在脫節。CoreWeave、Nebius等新興云服務商的股價正處于過去6到12個月區間的低端。分析指出,目前市場仍然錨定在“終將出現供給過剩與算力商品化”的敘事框架上。但現實的情況卻是,在激進的供給緊張環境下,幾乎所有類型的算力資源都會保持旺盛需求——無論其相對性能差異如何。
展望未來,研究人員給出三個關鍵觀察點來判斷GPU租賃價格是否仍會維持高位。
首先,隨著GB300集群在整個2026年逐步放量,市場將關注新增供給究竟能否緩解當前的算力緊張局面。其次,需要關注持續中的芯片短缺是否進一步惡化。最后,還要觀察各大AI巨頭的年度經常性收入(ARR)擴張情況,以及AI應用的普及速度和詞元消耗規模的持續增長節奏。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.