![]()
![]()
中國算力的增長新范式。
編輯|栗子
在AI算力的深海里,沉默往往預(yù)示著更劇烈的爆發(fā)。
1月26日,距離國產(chǎn)AI算力企業(yè)天數(shù)智芯(09903.HK)登陸港股僅僅過去18天,這家在外界看來一貫低調(diào)的企業(yè)就對外拋出了一顆“重磅炸彈”:一份敢于將超越國際巨頭Hopper、Blackwell乃至Rubin的具體日期寫進(jìn)日歷的四代架構(gòu)路線圖。
![]()
圖片來源:天數(shù)智芯
更重要的是,這并非畫餅。事實上,天數(shù)智芯2025年推出的天數(shù)天樞架構(gòu),在DeepSeek V3這種關(guān)鍵的大模型場景上,已經(jīng)交出了實測性能領(lǐng)先英偉達(dá)Hopper約20%的成績單,成為首個實現(xiàn)對國際主流架構(gòu)實質(zhì)性超越的國產(chǎn)方案。
“秀肌肉”已經(jīng)不足以形容天數(shù)智芯的技術(shù)路線。因為它宣告了國產(chǎn)算力正在告別“對標(biāo)式”的路徑依賴,正式駛?cè)胱灾鞫x的領(lǐng)航海域。
這場看似常規(guī)的技術(shù)發(fā)布,實則打開了國產(chǎn)GPU產(chǎn)業(yè)新敘事的大門。
過去七年,天數(shù)智芯選擇了一條最慢也最難的路:全棧自研、深耕行業(yè)、死磕落地。這種“笨功夫”在物理AI爆發(fā)的前夜,終于匯聚成了突破性的質(zhì)變信號。
當(dāng)算力競爭從“量的堆砌”轉(zhuǎn)向“質(zhì)的較量”,天數(shù)智芯用超300家客戶、超1000次部署的實戰(zhàn)答卷證明:國產(chǎn)算力不再是實驗室里的備選方案,而是在千億市場的浪潮中,正以“現(xiàn)在完成時”的成果為“將來時”的承諾背書,重構(gòu)著屬于中國算力的增長新范式。
1.算力進(jìn)化的“中國路徑”
通用GPU的底層架構(gòu)是算力產(chǎn)業(yè)的基因密碼,也是決定格局走向的核心變量。
長期以來,國際巨頭憑借先發(fā)優(yōu)勢構(gòu)建起堅不可摧的技術(shù)壁壘,國產(chǎn)企業(yè)多在“對標(biāo)-追趕”的邏輯中艱難跋涉,這就像在他人鋪設(shè)的軌道上奔跑。
但天數(shù)智芯此次公布的架構(gòu)路線圖徹底打破了這種慣性,它以清晰的時間軸和可量化的突破,勾勒出算力進(jìn)化的“中國路徑”。
這份路線圖不再是虛無縹緲的愿景,而是一份精確到日歷的產(chǎn)品手冊,直接將超越Hopper、Blackwell、Rubin的時間點寫進(jìn)了2025至2027年的規(guī)劃中。
2025年落地的天數(shù)天樞架構(gòu)已率先完成破局,在執(zhí)行注意力機制相關(guān)計算時,算力的實際有效利用率突破了90%。
在當(dāng)前備受矚目的DeepSeek V3場景下,其性能較英偉達(dá)Hopper提升了約20%,成為首個實現(xiàn)對國際主流架構(gòu)實質(zhì)性超越的國產(chǎn)方案,這證明了自主創(chuàng)新的硬實力。
![]()
接下來的路線更加激進(jìn),2026年將開啟“雙線超越”,天璇架構(gòu)不僅對標(biāo)英偉達(dá)Blackwell,還將新增ixFP4精度支持以精準(zhǔn)匹配差異化場景需求;同年推出的天璣架構(gòu)則實現(xiàn)全面性能超越,完成從AI計算到加速計算的全場景覆蓋,解決不同行業(yè)的算子適配痛點。
至2027年,天權(quán)架構(gòu)將劍指英偉達(dá)Rubin,后續(xù)更將徹底跳出對標(biāo)框架,轉(zhuǎn)向突破性計算芯片架構(gòu)設(shè)計,為未來未知算法預(yù)留成長空間。
支撐這份激進(jìn)路線圖的是三大核心技術(shù)創(chuàng)新的底層賦能。
TPC BroadCast(計算組廣播機制)通過上游數(shù)據(jù)廣播減少重復(fù)訪存,在降低功耗的同時等效提升帶寬,破解了算力與能耗的平衡難題。
Instruction Co-Exec(多指令并行處理系統(tǒng))實現(xiàn)多類型指令同步執(zhí)行,強化復(fù)雜任務(wù)處理能力,適配科研、金融等高端計算場景,好比讓引擎具備了處理多種復(fù)雜路況的能力。
Dynamic Warp Scheduling(動態(tài)線程組調(diào)度機制)通過智能調(diào)度避免資源爭搶,大幅提升計算資源利用率,讓集群部署的算力損耗降至行業(yè)低位,宛如為引擎配備了智能導(dǎo)航,避開擁堵,一路暢通。技術(shù)的創(chuàng)新,為天數(shù)智芯打造“高質(zhì)量算力” 的理念筑牢根基。
更具行業(yè)意義的是其問題導(dǎo)向的研發(fā)邏輯。
針對DeepSeek V3論文中提及的FP8累加精度不足、矩陣轉(zhuǎn)置開銷過大兩大行業(yè)共性痛點,天數(shù)智芯在Transformer-Engine架構(gòu)中給出了定制化解決方案,支持用戶任意保留累加位數(shù),徹底打消了精度焦慮,同時新增IX-MTX-Trans模塊實現(xiàn)無損矩陣轉(zhuǎn)置,在推理場景中帶來了10%左右的性能提升。
這種盯著產(chǎn)業(yè)痛點做研發(fā)的思路,讓技術(shù)突破不再是實驗室里的孤芳自賞,而是直接轉(zhuǎn)化為能讓客戶感受到Token成本減半、單機性能翻倍的實用創(chuàng)新。天數(shù)智芯所追求的,是成為新時代的“算力風(fēng)洞”,助力用戶在業(yè)務(wù)場景中,通過計算創(chuàng)造新世界。
2.重構(gòu)算力的“價值坐標(biāo)系”
當(dāng)算力成為數(shù)字經(jīng)濟的核心生產(chǎn)資料,就像工業(yè)時代的煤炭與鋼鐵,“算力夠用”早已不是企業(yè)的核心訴求,“算力好用、劃算、可持續(xù)”才是決定產(chǎn)業(yè)競爭力的關(guān)鍵。
面對行業(yè)普遍存在的能效比偏低、部署成本高、技術(shù)迭代快導(dǎo)致資產(chǎn)減值等痛點,天數(shù)智芯提出了高效率、可預(yù)期、可持續(xù)的高質(zhì)量算力三維特質(zhì),為算力產(chǎn)業(yè)建立了新的價值坐標(biāo)系。
這標(biāo)志著天數(shù)智芯從一家單純的技術(shù)公司,正式跑通了一家成熟的產(chǎn)品公司邏輯,其護(hù)城河已不再是驚艷的參數(shù),而是綜合的客戶體驗。
“高效率”直指算力浪費的行業(yè)頑疾。
通過全鏈路優(yōu)化實現(xiàn)最優(yōu)TCO(總體擁有成本),核心是提升單位功耗下的有效算力輸出。這意味著企業(yè)無需為冗余算力買單,用更少的硬件投入和能耗成本就能獲得滿足業(yè)務(wù)需求的計算支撐。
依托kv cache(關(guān)鍵值緩存)量化+無損反量化核心技術(shù),天數(shù)智芯將模型推理實際內(nèi)存使用量降低50%以上;通過自研IX-SIMU全棧軟件系統(tǒng),實時適配存儲價格波動,為客戶實現(xiàn)AI推理落地的性能成本最優(yōu)解。
“可預(yù)期性”則破解了部署難題。
依托精準(zhǔn)的仿真模擬技術(shù),企業(yè)在獲取芯片前,就能通過仿真系統(tǒng)整合硬件組件并匹配網(wǎng)絡(luò)拓?fù)洌崆邦A(yù)判萬卡集群在DeepSeek、通義千問等任意模型下的性能表現(xiàn),大幅降低了決策的試錯成本,實現(xiàn)所見即所得。
“可持續(xù)性”著眼于長期價值,通過通用GPU架構(gòu)支持全類型數(shù)學(xué)運算圖譜,確保了硬件能從容應(yīng)對未來未知算法的演進(jìn),延長了硬件生命周期。這種設(shè)計哲學(xué)堅持回歸計算本質(zhì),不讓硬件成為束縛算法進(jìn)化的枷鎖,讓算力投入成為長期資產(chǎn)而非短期消耗品。
在此基礎(chǔ)上,天數(shù)智芯構(gòu)建了AI++算力系統(tǒng)新范式,讓軟件定義算力成為現(xiàn)實。
![]()
底層以AI庫、通訊庫及加速計算庫為基石,承接算法加速、集群互聯(lián)與科學(xué)計算需求;中間層作為支柱適配各類神經(jīng)網(wǎng)絡(luò)模型;上層覆蓋AI生成式應(yīng)用、科研探索及量子計算模擬等場景,形成了從底層技術(shù)到上層應(yīng)用的全棧支撐能力。
這種架構(gòu)就像一個可以自我迭代的系統(tǒng),立足AI卻不止于AI,無論用戶是需要優(yōu)化現(xiàn)有的互聯(lián)網(wǎng)業(yè)務(wù),還是在頂級院校進(jìn)行動量守恒方程等前沿科學(xué)計算,都能在天數(shù)智芯的算力底座上找到適配的加速引擎。
3.卡位物理AI的“黃金風(fēng)口”
架構(gòu)的優(yōu)勢最終需要通過產(chǎn)品落地兌現(xiàn),而全場景布局則是搶占算力市場的關(guān)鍵。
天數(shù)智芯此次發(fā)布的“彤央”系列邊端產(chǎn)品,不僅填補了國產(chǎn)高端邊端算力的空白,更標(biāo)志著其“云+邊+端”全場景算力布局的成型,精準(zhǔn)卡位物理AI爆發(fā)的黃金風(fēng)口。
彤央系列構(gòu)建了覆蓋100T至300T實測稠密算力的產(chǎn)品矩陣,四款產(chǎn)品各有側(cè)重。
TY1000算力模組采用699pin接口,小型化設(shè)計讓行業(yè)級算力實現(xiàn)便攜部署;TY1100算力模組集成ARM v9 12核CPU與自研GPU模組,提供多元算力選擇;TY1100_NX算力終端憑借大顯存優(yōu)勢成為高性價比之選;TY1200算力終端以300TOPs的極致性能,適配AIPC、具身智能等前沿場景。
![]()
在核心性能測試中,TY1000在計算機視覺、自然語言處理、DeepSeek 32B大語言模型、具身智能VLA模型及世界模型等多個場景中,實測性能優(yōu)于英偉達(dá)AGX Orin,而其標(biāo)稱的 “實測稠密算力”,區(qū)別于行業(yè)內(nèi)部分產(chǎn)品 “紙面算力虛高” 的現(xiàn)象,用透明化參數(shù)贏得市場信任,劍指 “邊端大算力國內(nèi)第一” 的地位。
全場景布局的價值在規(guī)模化落地中得到了充分驗證。
截至目前,天數(shù)智芯相關(guān)產(chǎn)品已服務(wù)超300家客戶、完成超1000次部署,數(shù)千卡集群穩(wěn)定運行超過1000天。互聯(lián)網(wǎng)AI領(lǐng)域通過架構(gòu)優(yōu)化實現(xiàn)了Token成本減半;科學(xué)探索領(lǐng)域則成為多家頂級學(xué)府的科研支撐,在海洋地質(zhì)勘探和基因測序等領(lǐng)域穩(wěn)定發(fā)揮效能。
![]()
邊端場景的算力滲透也已悄然深入產(chǎn)業(yè)。在瑞幸咖啡數(shù)千家門店中,彤央方案正處理著海量視頻流,不僅能自動監(jiān)測店員佩戴手套、口罩等SOP操作合規(guī)性,還能通過挖掘客流量與消費偏好數(shù)據(jù),為品牌的營銷決策提供實時的數(shù)據(jù)支撐。
在交通智能領(lǐng)域,天數(shù)智芯率先與20個車路云一體化頭部試點城市合作,實時聯(lián)動車、路、云數(shù)據(jù),保駕護(hù)航安全出行。具身智能機器人則在彤央模組的賦能下,具備了更高算力、低延遲的大腦支撐,讓物理AI從會說話轉(zhuǎn)向會干活。
這種規(guī)模化落地的勢能,標(biāo)志著天數(shù)智芯已形成技術(shù)、產(chǎn)品與場景的正向循環(huán)。無論是在金融領(lǐng)域?qū)⒀袌笊尚侍嵘?0%,還是在醫(yī)療領(lǐng)域?qū)⒔Y(jié)構(gòu)化病歷生成時間壓縮至30秒,天數(shù)智芯的算力正滲透進(jìn)產(chǎn)業(yè)的每一個毛細(xì)血管,推動傳統(tǒng)自動化向具備意識的物理AI轉(zhuǎn)型。
4.算力產(chǎn)業(yè)的“長期主義”
GPU行業(yè)的競爭終究是生態(tài)體系的競爭,單打獨斗難成氣候,唯有構(gòu)建起開放協(xié)同的產(chǎn)業(yè)生態(tài),才能在長期競爭中占據(jù)主動。
天數(shù)智芯深諳此道,采取硬件筑基、軟件適配、伙伴協(xié)同的三維生態(tài)策略,持續(xù)完善國產(chǎn)AI算力生態(tài)閉環(huán)。
軟件層面維持與主流編程接口的高度兼容,客戶僅需投入原計劃三分之一的精力即可完成開發(fā)調(diào)優(yōu),這種對開發(fā)者習(xí)慣的尊重,極大地降低了國產(chǎn)算力的進(jìn)入門檻。
同時,天數(shù)智芯持續(xù)迭代底層軟件棧,其天垓系列產(chǎn)品已穩(wěn)定運行400余種模型及數(shù)千種算子,國內(nèi)新發(fā)布大模型在發(fā)布當(dāng)天即可在天數(shù)平臺上跑通。
在生態(tài)協(xié)同層面,天數(shù)智芯與硬件廠商、解決方案提供商簽署戰(zhàn)略合作協(xié)議,打通了從芯片到系統(tǒng)部署的全產(chǎn)業(yè)鏈環(huán)節(jié),形成了覆蓋“芯片、模組、終端及解決方案”的完整布局。
300多家客戶、1000多次部署,數(shù)千卡集群穩(wěn)定運行已超1000天,充分體現(xiàn)了這家企業(yè)的務(wù)實與透明。天數(shù)智芯并不尋求成為第二個英偉達(dá),而是通過深耕通用算力,確保產(chǎn)品在長達(dá)十年的周期內(nèi)都能穩(wěn)定發(fā)揮價值,成為具備行業(yè)定義能力的長期主義者。
![]()
當(dāng)前,中國通用GPU市場規(guī)模已邁入千億級別,國產(chǎn)化替代需求持續(xù)釋放。天數(shù)智芯憑借技術(shù)、產(chǎn)品、生態(tài)的三重優(yōu)勢,站在行業(yè)爆發(fā)的關(guān)鍵風(fēng)口蓄勢待發(fā)。
從四代架構(gòu)的技術(shù)突圍到全場景產(chǎn)品的市場卡位,天數(shù)智芯正在走出一條自主創(chuàng)新與商業(yè)閉環(huán)共生的道路。這不僅是天數(shù)智芯的成長故事,更是國產(chǎn)AI算力產(chǎn)業(yè)的進(jìn)化縮影。
當(dāng)技術(shù)突破不再依賴跟隨式創(chuàng)新,當(dāng)產(chǎn)品性能能夠適配全場景需求,國產(chǎn)算力終將在全球市場占據(jù)一席之地,書寫屬于中國科技的新篇章。
(封面圖及文中配圖來源:天數(shù)智芯)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.