最近,AI芯片的熱點新聞接二連三,先是一批AI芯片初創公司密集宣布IPO,再是“盤古”大模型內部人員爆料“打假”,后有黃仁勛來華并宣布H20芯片恢復銷售,然后網絡消息傳出HW或將放棄深耕多年的昇騰ASIC路線,轉向GPU路線。
眾所周知,網絡上的瓜往往是空穴來風。對于當下如火如荼的AI行業而言也許影響深遠。
![]()
ASIC和GPU路線的差異
從CPU到GPU,再到DSP、AISC,芯片的通用性依次降低,但芯片在特定應用的性能依次升高。
CPU就屬于什么都能做,但各項任務都不精。
GPU的通用性比CPU差,但在科學運算、渲染等方面性能明顯強于CPU。
DSP的專用性則比GPU強,通用性則更差。
AISC則是追求特定場景專用性能犧牲通用性的典型。
打個比方,CPU就是瑞士刀,多功能,但在專業領域表現一般,上陣殺敵不如陌刀,救死扶傷不如手術刀。
AISC則像是專業刀具,廠家根據特定的應用場景,開發出手術刀、陌刀、軍刺等專業工具,但這些專用刀具基本不具備通用性。簡單來說,就是客戶不能買了陌刀拿去干手術刀的活,買了手術刀也沒法安裝在步槍上拼刺刀。
由于大陸集成電路產業在設計和制造與西方有差距,本土廠商往往選擇犧牲通用性,換取特定場景的高性能。
以昇騰而言,就不支持雙精度浮點運算,而雙精度浮點運算對科學運算至關重要。支持雙精度浮點運算會提高芯片的設計復雜度和功耗,在制造工藝落后于人的情況下,一旦支持雙精度浮點運算,必然影響整體性能和能效比。
![]()
相比之下,英偉達的計算卡就支持雙精度浮點運算。
在PPT上,國產AI芯片也習慣于拿特定場景的性能指標去對標英偉達。
其實,這里國產AI芯片廠商玩了文字游戲,那就是英偉達的參數指標高是建立在其具有較強通用性上的,而國產AI芯片在某個指標上追平英偉達。
簡言之,英偉達的計算卡是六邊形戰士,國產AI計算卡只是偏科生,在特定應用表現良好,無法適應多樣化的應用場景。
H20熱銷的根源在于生態
從參數上看,H20是H100的閹割版本,算力只有H100的三分之一,不少國產AI計算卡在PPT上的算力都遠遠比H20強。即便如此,本土互聯網公司依舊對H20產生了巨大的采購需求。
之所以如此,一方面是之前講的,英偉達的GPU是六邊形戰士之外,另外一個原因就是CUDA。
![]()
英偉達圍繞CUDA建立了一套相對豐富的軟件生態,用戶買了計算卡可以直接用,能夠節約海量時間成本和軟件開發成本。
在不久前的大模型套殼事件中,HW員工爆料即便是有自家AISC計算卡的情況下,也用英偉達的計算卡訓練。出現這種情況的根源就在于英偉達的GPU軟件生態好。
ASIC的硬件指令架構相對簡單,對高帶寬的敏感度不如GPU,這就大幅降低了硬件門檻。
不過,技術復雜度只會轉移,不會消失。
從實踐上看,AISC對軟件的要求難度大于硬件。
給AISC寫軟件的難度遠遠高于給GPU寫算子做優化。即便是一些頭部互聯網大廠,專門配備團隊寫軟件,依舊苦不堪言,因而正在測試兼容CUDA的國產GPU,尋找更合適的AI芯片供應商。
誠然,在特定應用AISC確實有優勢,但這僅僅是在特定細分市場有優勢,谷歌的TPU也只是自己用,而不是面向公開市場,在易用性方面,GPU優勢明顯。
事實上,商業競爭終究還是看易用性和全周期使用成本。
pytorch和TensorFlow之爭,盡管tensorflow局部特性可以使得性能能更好一些,但pytorch易用性的優勢足以讓其脫穎而出。GPU買來就用的易用性是ASIC不具備的。
GPU在全周期使用成本上相對于ASIC優勢明顯。購買GPU直接可用CUDA,節約了大量成本。而用AISC則需要開發深度學習引擎框架,還要專門做適配調優,資金成本和時間成本高,特別是在當下大廠技術競賽的背景下,時間和精力非常寶貴,除非買不到英偉達的GPU,否則互聯網巨頭不會買ASIC。
![]()
實踐證明GPU路線是主流
實事求是的說,AISC在特定應用是有優勢的,比如推理,但用來訓練就力所不逮了。
這幾年的實踐證明,AISC專用性強,適合細分市場,GPU通用性好,適合主流市場。特別是這幾年AI發展迅速,通用性好的硬件更適合新場景、新業態。
這也是HW擬改換技術路線,擬放棄ASIC,轉向GPU的根源。
事實上,這幾年很多地方政府受到“高層路線關系”的裹挾,用高于市場的價格購買了昇騰全棧產品,建設了大量智算中心,但業內人都知道,受限于技術體系封閉,軟件生態貧乏,智算中心的算力閑置較高,這是巨大的浪費。地方政府有苦難言,又不敢說出去顯得打臉。
在中央要求過緊日子的當下,應當把好鋼用在刀刃上,選擇更加通用、可實際跑起來的產品,提升財政資金的使用效率。特別是在HW 自己都打算放棄AISC投奔GPGPU的當下,再去花高價買昇騰就是1911年揮刀自宮當太監了。
![]()
從產業發展的角度來看,GPU必然成為主流,既有硬件上六邊形戰士的優勢,也有CUDA軟件生態上的優勢。
必須指出的是,GPU因其通用性,可以在游戲顯卡、超算、AI等行業大展拳腳,而AISC只能限定于特定應用場景,通用性差就限制了AISC的推廣,很難脫離政策建立商業上的正循環。
相比之下,GPU可以用龐大的游戲顯卡個人用戶來平攤成本,這是ASIC所不具備的。
更加龐大的用戶數量就意味著能夠更快回籠研發資金,意味著更快的技術迭代速度,意味著更快的軟件生態成熟速度,這種現象在IT發展史上已經反復出現,比如服務器淘汰小型機,PC淘汰傳統工作站。
未來,必然是GPU為主,ASIC為補充的行業格局。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.