財聯社1月21日訊(記者 付靜 王碧微)“我們手上的H100、H200全部都租出去了。前幾天準備買64臺H200,到處找現貨,只零零散散找到了幾十臺。B200在國內基本上沒有現貨,上次拿著現金在深圳到處收貨,最后只收到十幾臺。”2026年1月,算力租賃從業者王偉(化名)向財聯社記者講述了他在深圳的搶貨經歷。
歲末年初,國內的算力供應鏈下游市場就屢屢傳出貨源告急的消息,王偉甚至將這種現狀稱為“地獄模式”。
多位從業者向財聯社記者證實,目前市場處于極度供需失衡狀態,英偉達B200等高端GPU芯片在國內市場幾乎“隱形”,5090、4090等中低端GPU受原材料漲價等因素影響價格激增;下游帶動下,DDR5內存條價格大幅跳漲,部分大容量型號漲幅超過300%。
財聯社記者注意到,算力市場劇烈波動之時,正值摩爾線程-U(688795.SH)、沐曦股份-U(688802.SH)等國產AI芯片企業密集掛牌上市之際,2026年伊始,算力市場就一個字:熱!
顯卡商轉行炒內存,“套牌車”混入服務器
本月初,有自媒體文章稱“元旦上班第一天,算力供應鏈罵聲一片,2026年的算力市場開局就是‘地獄’模式。”
受訪的幾位算力從業者坦言,這種描述實際上并不夸張。
“很痛苦,現在是算力需求旺盛,但是(算卡)資源確實是不足的。我們現在每天都心驚肉跳,因為買不到貨,現在大家手上都沒東西租了,都只有一點點零零散散的東西。”王偉告訴財聯社記者。
“對我們來說,現在的問題不是買不到卡,而是太貴。”一家AI廠商基礎設施負責人告訴財聯社記者。
國產算力商基流科技的一位高管告訴財聯社記者,目前,高端訓練卡由于其不可替代性和供需缺口,價格堅挺,貨源稀缺;而消費級顯卡,則在顯存等核心元器件成本上升傳導后價格飆漲。
北京瀾啟智算業務負責人鄭萬利告訴財聯社記者,2025年9月以來,DDR5內存條價格上漲超300%,DDR4內存條漲幅也超150%。
“64GB DDR5 5600速率的內存現在漲到了1萬多,4800速率的也要差不多1萬,但在2025年7、8月份時才2000多塊錢,漲了4倍多。”鄭萬利向記者列舉了一組數據,“96GB的價格現在應該是2萬出頭,128GB的往3萬去了。”
鄭萬利算了一筆賬:原來一臺H100機頭價格約30萬元,現在僅裝配32根64GB內存條的成本就超過30萬元。
如果配置B200機頭,至少需要24根內存條,加上CPU、硬盤、機架、電源等,整機價格已攀升至六七十萬元。
鄭萬利還透露,H200整機價格最低時曾降至190多萬元,目前最新報價已回升至230多萬元。
上述AI廠商基礎設施負責人則透露,“目前8卡5090加CPU加內存的整機已經報價40多萬,上個月只要32萬。”
根據慢慢買App,一款10月在京東售價為16899元的七彩虹RTX5090D顯卡價格已經飆漲至今日的20399元。
甚至連二手租賃價格也隨之波動,一位算力租賃商告訴記者,現在算力租賃價格相較此前低點已經漲了5%-10%。
除了供應鏈本身的產能受限,投機資金的涌入加劇了市場的瘋狂,渠道供應商馬明(化名)觀察到,一些原先做顯卡的渠道商現在轉行做起了存儲生意。
“顯卡資金占用量大,而存儲風險更低,漲幅更快,能快進快出。”馬明告訴財聯社記者,這些渠道商基本上從去年10月、11月開始收貨,手法是“左腳踩右腳”——低價收貨,高價出掉,再用更高的價格收回,不斷推高市場水位。
馬明舉例分析,市場上存在三類存儲產品:真實消耗的、未消耗的、庫存補出來的。
有人以4000元收購2000根內存,其中1000根被裝機消耗,另外1000根則以4300元賣給下一手投機者。
在高額利潤的誘惑下,黑灰產鏈條開始滋生,馬明向記者揭露了存儲市場背后的“假內存”現象。
第一類是“套牌車”,賣方手中有正版貨源,也有拆機貨,他們將拆機貨原本的標簽換掉,包裝成正版貨出售,同一個序列號可能同時出現在兩根內存上,賣給不同的客戶。
第二類情況更為惡劣,馬明透露,市場上出現了連PCB板、顆粒都是假的內存條,這些產品并非原廠生產,無法達到原廠質檢標準,裝入服務器后會出現嚴重的性能問題。
“其實除了內存,硬盤、處理器都漲得很瘋狂。”馬明補充道,硬盤價格翻了1-3倍,服務器處理器漲幅很大,且很多型號處于缺貨狀態。
一位渠道商告訴財聯社記者,一款英特爾i5處理器,現在售價約1800元,9月份大概1400元,一路漲起來;英特爾至強6530處理器目前售價約9200元,而一個月前則為8000出頭。
KeyBanc數據顯示,由于超大規模云服務商“掃貨”,英特爾與AMD在2026全年的服務器CPU產能已基本售罄。為了應對供需極端失衡并確保后續供應穩定,兩家公司均計劃將服務器CPU價格上調10%-15%。
H200“看得到摸不著”,國內算力需求將分流
在價格暴漲的同時,核心算力芯片的供應依然是產業鏈的痛點。
盡管近期美國已放寬英偉達H200對華出口,但多位受訪者表示,國內供應實質性短缺的局面并未改變。
“目前的情況比較特殊。”一位算力服務企業高管告訴財聯社記者,雖然政策有放寬跡象,但實際進口審批流程依然嚴謹,導致H200的實質性供給非常有限,國內處于“看得到但還不太摸得著”的狀態。
優刻得(688158.SH)服務器中心及AI算力負責人丁振雷持有類似觀點,他向財聯社記者表示,美國放寬H200出口,長期戰略上不會產生影響,但在短期內,面對大的算力場景,企業可能會“緩一緩”,等待具體落地情況。
這種“看得到摸不著”的供應現狀,正在倒逼算力需求在市場中分流。
前述基流科技高管分析,未來市場會形成“多層次、多路徑”的并行格局。
對極致性能和有國際生態依賴的場景,企業仍會爭取英偉達芯片;但對更廣泛的行業應用、對數據安全與自主可控有高要求的政務和企業市場,國產算力已成為主流選擇。
“國產算力芯片的機會,不在于在通用賽道上全面正面超越,而在于聚焦優勢戰場。”該高管認為,在推理場景、工業質檢、智能政務、金融風控等行業專用場景,國產芯片在能效比、成本和特定模型適配上已展現出性價比優勢。
云服務廠商的采購動作印證了這一趨勢,丁振雷向財聯社記者透露,優刻得目前已采購了3-5家國產芯片。
“只要能國產替代的,我們首先能做的工作就是提早適配。當它的性能優化到一定程度的時候就快速引入,這時候供給來源要多樣化。”丁振雷表示。
與此同時,軟件定義的趨勢正在反向重塑硬件標準。
鄭萬利向財聯社記者分析,DeepSeek等國產大模型的爆發,對MoE(混合專家)架構和混合精度訓練提出了具體要求,這倒逼國產硬件廠商必須跨過“適配”這道門檻。
鄭萬利判斷,國產算力接下來會迎來更多市場需求,未來兩年將是國產算力開拓商業市場的關鍵期,“國產卡肯定是個方向”。
對于市場上關于“算力過剩”或“泡沫”的討論,一線從業者給出了不同的觀察。
“那些說算力過剩的,都是制造焦慮。國內算力是遠遠不夠的。”王偉直言,目前模型距離成為真正的生產工具還有距離,需要持續投資。
丁振雷則從技術邏輯層面反駁了泡沫論,他認為,2025年是Agent(智能體)元年,Agent是提高生產力的邏輯而非單純的降本邏輯。一個真正好用的Agent落地,對Token(詞元)的消耗是巨大的。
“如果Agent不落地,算力可能是過剩的;但只要解決了真正的生產力問題,算力還是欠缺的。”丁振雷表示。
上市潮背后,“煙囪”難題仍存
供應鏈焦慮的另一面,是國產芯片企業在資本市場的高歌猛進。
2025年底,摩爾線程、沐曦股份相繼在科創板上市,首日漲幅分別達到468.78%和692.95%。隨后,壁仞科技(06082.HK)登陸港交所,天數智芯(09903.HK)啟動港股公開認購并獲得超300倍的超額認購。
資本熱潮下,相關公司的財務數據尚待改善。根據招股書數據,摩爾線程與沐曦股份過去三年合計虧損超過80億元;正在沖刺科創板的長鑫科技(DRAM廠商),截至2025年6月30日,累計研發投入188.67億元,占累計營業收入的33.11%,但其2025年前三季度的歸母凈利潤-52.8億元,同比僅略微減虧。
同時,TrendForce集邦咨詢分析師龔明德告訴財聯社記者,預計2026年全球AI服務器產值將提升逾42%,達到4300億美元,在這個龐大的市場中,國產廠商面臨的不僅是資金問題,更是如何解決“不好用”的技術難題。
海光信息(688041.SH)副總裁吳宗友在接受財聯社記者采訪時指出,過去幾年信創國產化發展很快,但也給客戶造成了不少困擾,不同芯片廠商各自為戰,形成了“煙囪式”的建設模式,導致算力利用率低下。“有這么多的芯片,都要去適配和優化,投入的成本非常多。”
為此,海光信息正在推進“AI計算開放架構”。吳宗友介紹,該架構沒有加入門檻,旨在把所有的AI產業鏈上下游廠商聚合在一起,形成統一的開發規范,讓客戶不再被單一芯片綁定。
“國內各行各業尤其是互聯網客戶非常接受AI計算開放架構。”吳宗友透露,互聯網客戶購買力強,不希望被單一廠商控制,因此對開放路線接受度很高。
上述基流科技高管也表示,該公司研發的Venus智算平臺能夠兼容多種硬件架構,支持異構GPU,降低對進口GPU的依賴,同時能夠實現高效混合訓練與推理。
在硬件集群建設層面,挑戰同樣嚴峻。中科曙光(603019.SH)高級副總裁李斌告訴財聯社記者,建設萬卡集群并非簡單的堆砌,隨著規模擴大,互連網絡、可靠性和能效都面臨以指數級上升的工程難題。
李斌特別提到了當前行業熱議的“光銅之爭”,他認為,銅連接雖然成本低、功耗低,但傳輸距離受限。隨著單鏈路速率提升至200G或400G,銅線傳輸距離縮短至厘米級,芯片直接出光成為必然趨勢。
“為什么要用到CPU?因為現在光模塊功耗高、可靠性差,十萬卡規模如果全用光模塊根本做不起來。”李斌分析,未來硅光和CPU技術成熟后,可以大幅提高可靠性并降低功耗。他預判,當速率超過400G時,沒有"硅光技術"的系統可能無法實現。
為了解決異構算力的管理難題,云廠商正在嘗試通過軟件調度來抹平硬件差異。
丁振雷介紹,優刻得正在做異構管理和虛擬化能力,將不同算力切割得更細,把合適的負載調度到合適的位置。“原本大家采用不同類型的卡擔憂很大,如果有統一標準,門檻會大大降低。”
從存儲市場的投機亂象,到芯片供應的博弈,再到架構層面的突圍,2026年的算力市場在焦慮與希望中開局。
對于國產廠商而言,上市融資只是獲得了入場券,能否在“地獄模式”中通過技術和生態的考驗,是未來兩年必須解決的現實難題。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.