![]()
【摘要】國產(chǎn)算力正在迎來一系列利好。8月底,DeepSeek-V3.1宣布率先適配國產(chǎn)芯片設(shè)計,F(xiàn)P8精度革命推動算力效率躍升。同時,青海聯(lián)合天合光能等頭部新能源企業(yè)完善了綠電托底能力。
這一大背景下,國內(nèi)公司正在從不同角度形成聯(lián)合:海光信息開放CPU互聯(lián)生態(tài),昆侖芯中標(biāo)移動十億級集采,壁仞為國產(chǎn)算力集群項目提供算力底座。
國產(chǎn)算力正從“單點(diǎn)突破”走向“系統(tǒng)協(xié)同”。短期內(nèi),替代英偉達(dá)的可能不會是某一家公司,而是更多中國企業(yè)在開放協(xié)作中構(gòu)建起來的算力標(biāo)準(zhǔn)與生態(tài)。
以下為正文:
8月21日,DeepSeek正式官宣其新一代模型 DeepSeek-V3.1,除常規(guī)升級外,DeepSeek尤其強(qiáng)調(diào)了下一代將采用UE8M0 FP8 Scale參數(shù)精度,并明確指出該精度標(biāo)準(zhǔn)是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。
過去,大模型訓(xùn)練推理普遍使用FP32(32位浮點(diǎn)數(shù)),隨后逐步過渡到FP16(16位浮點(diǎn)數(shù))混合精度,以減少存儲和通信開銷,F(xiàn)P8能進(jìn)一步將數(shù)據(jù)寬度壓縮至8位。不僅算力效率翻倍,而且能降低訓(xùn)練和推理過程中網(wǎng)絡(luò)帶寬的通信量。
此外,國家互聯(lián)網(wǎng)信息辦公室近期就H20算力芯片漏洞后門安全風(fēng)險約談英偉達(dá)公司,國企采購H20受限。對華銷售遇阻后,英偉達(dá)通知部分零部件供應(yīng)商暫停H20芯片生產(chǎn)。
DeepSeek-V3.1刺激下的這一全新國產(chǎn)AI體系,對我國自主化進(jìn)程是重大利好。
同時,青海作為綠電優(yōu)勢地域,已經(jīng)依托政策與天合光能、中國聯(lián)通等公司打造了國內(nèi)首個基于云計算調(diào)度的全國產(chǎn)化大規(guī)模智算集群,能夠基于國產(chǎn)化算力底座與全域智能調(diào)度技術(shù),打造一體機(jī)+私有化+云端的多維模式敏捷部署能力,構(gòu)建一體化AI平臺。
多輪刺激下,國產(chǎn)算力正在迎來一個更豐滿的故事。
01
CPU企業(yè)如何入局
9月剛過半,海光信息放出了兩個重要消息。
9月5日,重慶智博會開幕期間,海光信息宣布將開放CPU能力,依托國家先進(jìn)計算產(chǎn)業(yè)創(chuàng)新中心“AI計算開放架構(gòu)聯(lián)合實(shí)驗室”,向產(chǎn)業(yè)生態(tài)伙伴提供直連IP、開放協(xié)議及定制化指令集。
9月13日消息,海光信息在閉門會議中宣布要面向全棧產(chǎn)業(yè)伙伴開放CPU互聯(lián)總線。
兩項舉措的接連曝光,能明顯看出海光正在走一條更加趨于全棧協(xié)同的生態(tài)道路。第一步先消除國產(chǎn)CPU與AI芯片之間的壁壘,第二步將互聯(lián)總線的開放范圍擴(kuò)大到整個產(chǎn)業(yè)鏈上下游,包括GPU、DPU、OEM、IO、OS等鏈上伙伴。
作為國內(nèi)CPU量產(chǎn)成績最佳的企業(yè),海光的下場對算力規(guī)模化發(fā)展至關(guān)重要。當(dāng)前國產(chǎn)算力資源組成中,各個芯片技術(shù)路線雖然齊頭并進(jìn),但產(chǎn)業(yè)生態(tài)離散化現(xiàn)象嚴(yán)重,不僅CPU與加速卡之間算力調(diào)度困難,計算產(chǎn)業(yè)各個環(huán)節(jié)同樣存在算力流通阻塞問題。
海光此舉,一方面能基于自家CPU的平臺紐帶作用,快速破除AI芯片壁壘,高效調(diào)度智算資源,降低算力應(yīng)用成本;另一方面也能通過開放式的海光系統(tǒng)互聯(lián)總線,與產(chǎn)業(yè)鏈上下游形成合力,隨著接口標(biāo)準(zhǔn)等愈發(fā)規(guī)范,集群式算力協(xié)同體系將加速成形。
值得一提的是,在此節(jié)點(diǎn)能夠做出這種決策的,大概率只有海光一家。
加碼生態(tài)的背后,海光C86架構(gòu)近幾年已經(jīng)足夠穩(wěn)定,相較于同類芯片產(chǎn)品,海光通用處理器CPU已獨(dú)立實(shí)現(xiàn)多代產(chǎn)品的自研和商用,量產(chǎn)成績保證了安全技術(shù)水平上的大幅領(lǐng)先,要讓產(chǎn)業(yè)鏈的其他人愿意用,首先就要保證自家產(chǎn)品的安全可控。
海光的另一個優(yōu)勢在于C86架構(gòu)能夠完全兼容Wintel主流生態(tài),可以快速適配數(shù)百萬款常見的應(yīng)用軟件和系統(tǒng)軟件,產(chǎn)業(yè)上下游伙伴與海光的合作推進(jìn)會更加迅速省心,這是算力規(guī)模化的必要條件。
更關(guān)鍵的是,海光的開放表明其C86底層架構(gòu)已足夠成熟,在安全自主層面具備充分底氣。通過多年飽和研發(fā)投入,公司已經(jīng)徹底完成技術(shù)的消化吸收和再創(chuàng)新。其C86架構(gòu)不僅實(shí)現(xiàn)了多代產(chǎn)品的獨(dú)立迭代,也在安全可控性上達(dá)到領(lǐng)先水平。
02
AI芯片量產(chǎn)加速
AI芯片領(lǐng)域的變化是從“去英偉達(dá)”開始的。此前據(jù)媒體消息,阿里巴巴與百度已經(jīng)在人工智能模型訓(xùn)練中引入自研芯片,以部分替代英偉達(dá)的產(chǎn)品。阿里自今年年初起,便在小規(guī)模模型的訓(xùn)練中使用自研芯片;百度則嘗試用昆侖P800芯片訓(xùn)練新版文心大模型。
據(jù)報道援引三位使用過阿里自研芯片的員工透露,其性能已經(jīng)可以與英偉達(dá)目前在華最強(qiáng)的H20芯片相媲美。這意味著,國產(chǎn)替代的臨界點(diǎn)正在到來。
另一邊,英偉達(dá)本身也受制于人。有報道稱,英偉達(dá)甚至已與特朗普達(dá)成協(xié)議:作為交換條件,公司需上繳其在華H20芯片銷售額的15%。8月底,CEO黃仁勛表示,公司與白宮就向中國出口“降配版”下一代芯片的談判仍在進(jìn)行。
早在8月21日,昆侖芯就宣布在中國移動2025-2026年AI通用計算設(shè)備集采項目中大獲全勝。在“類CUDA生態(tài)”標(biāo)段,基于昆侖芯的AI服務(wù)器包攬標(biāo)包1、標(biāo)包2、標(biāo)包3的70%、70%、100%份額,中標(biāo)規(guī)模達(dá)十億級。這證明昆侖芯已經(jīng)可以兼容國際主流生態(tài),更在性能、成本和適配性上具備競爭力。
與此同時,壁仞科技也在穩(wěn)步推進(jìn)。2025年6月,公司完成了新一輪的15億元融資。
依托壁礪系列通用GPU算力產(chǎn)品,壁仞科技近期的主要策略是為國產(chǎn)算力集群項目提供了高效、穩(wěn)定、安全可控的算力底座。
舉例而言,7月25日,浙江聯(lián)通、壁仞科技、中興通訊、優(yōu)云科技四方聯(lián)合打造的國產(chǎn)算力集群,在浙江烏鎮(zhèn)智算中心正式點(diǎn)亮。該集群項目依托浙江省的算力資源,為智能網(wǎng)聯(lián)汽車、智能制造、金融、醫(yī)療、政務(wù)等前沿領(lǐng)域的高性能計算需求都提供了強(qiáng)有力的數(shù)字支撐。
值得一提的是,此次國產(chǎn)智算集群的建成與落地運(yùn)營,還意味著壁仞科技依托自有產(chǎn)品的集群能力優(yōu)勢,已在三大運(yùn)營商完成國產(chǎn)算力集群的規(guī)模化商業(yè)落地,充分展現(xiàn)壁仞科技在集群建設(shè)領(lǐng)域的技術(shù)實(shí)力和商業(yè)化潛力。
03
資本開支增長,大一統(tǒng)時代開啟
2025年第二季度,半導(dǎo)體行業(yè)穩(wěn)健增長的大背景下,國產(chǎn)AI算力芯片廠商業(yè)績顯著上升。
值得一提的是,國內(nèi)云廠商和互聯(lián)網(wǎng)公司密集發(fā)力,換句話說,客戶的意愿度決定了國產(chǎn)算力合作究竟有多深。
第二季度,國內(nèi)三大互聯(lián)網(wǎng)廠商阿里巴巴、百度、騰訊資本開支合計同比增長168%,環(huán)比增長12%。
此外,受益于AI對于公司核心業(yè)務(wù)的推動,北美四大云廠商谷歌、微軟、Meta、亞馬遜資本支出合計同比增長69%,環(huán)比增長23%。
黃仁勛表示:超大規(guī)模云廠商的資本支出在2025年將達(dá)到6000億美元,預(yù)計2030年AI基礎(chǔ)設(shè)施市場規(guī)模將達(dá)到3萬億至4萬億美元,預(yù)計超大規(guī)模云廠商2025-2030年資本支出復(fù)合增速高達(dá)46%。
充沛的資本加持下,國產(chǎn)算力替代需要真正考慮一個系統(tǒng)工程問題——如何做好從芯片到應(yīng)用的整體配合。當(dāng)前,整個算力產(chǎn)業(yè)鏈可分為四大層次:芯片層、系統(tǒng)層、軟件層和應(yīng)用層。
芯片層是基礎(chǔ),包括CPU、GPU、AI加速卡等計算芯片,以及內(nèi)存芯片、存儲芯片等。系統(tǒng)層涵蓋服務(wù)器、數(shù)據(jù)中心、網(wǎng)絡(luò)設(shè)備等硬件設(shè)施。軟件層包含操作系統(tǒng)、數(shù)據(jù)庫、中間件、AI框架等。應(yīng)用層則是最終面向用戶的各類算力服務(wù)和應(yīng)用場景。
目前,這四層體系面臨的主要問題是:單點(diǎn)突破有余,系統(tǒng)協(xié)同不足。國產(chǎn)芯片性能不斷提升,但軟硬件協(xié)同優(yōu)化不夠,導(dǎo)致整體算力效率無法最大化。
海光信息、壁仞科技、昆侖芯近期在做的合作,都是在朝著這一方向解決問題。
減少重復(fù)造輪子,降低企業(yè)研發(fā)門檻,是加速國產(chǎn)算力整體生態(tài)建設(shè)的必經(jīng)之路。
04
尾聲
國產(chǎn)算力替代勢必要從單點(diǎn)突破進(jìn)入系統(tǒng)協(xié)作新階段。
芯片廠商開放IP、整機(jī)企業(yè)制定標(biāo)準(zhǔn)、軟件公司適配優(yōu)化、應(yīng)用企業(yè)反饋迭代,只有同步完善這種緊密協(xié)作的模式,才能打破各環(huán)節(jié)之間的壁壘。
從海光開放生態(tài),到百度聯(lián)合昆侖芯自研芯片訓(xùn)練大模型,再到中科曙光聯(lián)合20多家企業(yè)發(fā)布AI計算開放架構(gòu),生態(tài)建設(shè)仍是國產(chǎn)芯片廠商面臨的重要考題。
短期內(nèi),替代英偉達(dá)的可能不會是某一家公司,而是更多中國企業(yè)在開放協(xié)作中構(gòu)建起來的算力標(biāo)準(zhǔn)與生態(tài)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.