文 | 超聚焦
為了把利潤留在自己鍋里,字節選擇下場造芯。
近日,據藍鯨科技報道,字節跳動芯片研發團隊將開始規模化招聘,具體招聘城市涵蓋北京、上海、深圳等,所需職位包括芯片架構、soc設計等。
該知情人士透露,字節跳動芯片研發團隊目前核心集中于芯片設計環節,圍繞公司自身業務開展專用硬件定制與優化,面向云端場景研發多款采用先進半導體工藝的復雜芯片,以提升性能、降低算力成本。
“目前字節芯片團隊已實現多次一版成功流片,早期多個項目進入量產部署階段,覆蓋多個主流先進工藝節點,整體研發與落地節奏穩步推進。”
而在團隊規模上面,據雷達Finance報道,字節的AI芯片團隊和CPU團隊人數較多,其中,AI芯片方向人數過半,達500人以上,CPU團隊在200人左右。
然而,千人團隊的集結僅僅是一個開始,真正的博弈才剛剛拉開序幕。
面對日益增長的AI投入,自研芯片能否幫助字節跳動徹底擺脫“給英偉達打工”的魔咒,將昂貴的算力成本轉化為火山引擎的獨家利潤?又能否復刻谷歌TPU的神話,利用極致的軟硬協同重新定義MaaS市場的定價權?
而對于寒武紀等剛剛盈利的國產芯片廠商而言,大廠的每一次流片成功,究竟是市場繁榮的信號,還是那個殘酷的“去中介化”倒計時?
01 昂貴的“過路費” 字節不得不算的千億開支賬
自研芯片,是一筆不得不算的經濟賬。
據金融時報報道,字節跳動2026年的資本開支擬達到約1600億元人民幣,高于2025年約1500億元人民幣的投入,其中約一半資金將用于采購先進半導體芯片以開發AI模型和應用,而若獲準采購更多先進芯片,還會進一步大幅增加資本開支。
如果倒退回五年前,用于AI芯片的這筆錢字節跳動花得起,也愿意花。
彼時,AI在字節的版圖中僅僅是一個“優化項”,主要用于推薦算法的提效或廣告系統的精準度提升。但隨著“豆包”大模型及豆包、即夢等AI應用的全面爆發,情況發生了根本性的逆轉。據QuestMobile數據顯示,豆包APP在2025年底的月活用戶已穩居國內AI類應用榜首,且用戶時長呈指數級增長。
與此同時,作為字節跳動B端業務全新增長極的火山引擎,也在經歷一場前所未有的算力饑渴。
在經歷了將大模型價格打入“厘時代”的激進價格戰后,火山引擎通過極致性價比策略,正在將日均處理Token推向了百萬萬億級別。這種以價換量的策略雖然搶占了MaaS的市場份額,但也讓底層的算力承壓達到了臨界點,火山不僅要支撐內部數億用戶的即時交互,還要響應外部企業客戶海量的API調用。
于是,當AI業務從“錦上添花”變成了公司的“核心增長極”,算力消耗的性質也變了:它不再是研發投入,而是每一分鐘都在流血的運營成本。
當數以十萬計的GPU在機房轟鳴,每一秒鐘流走的不僅是電費,更是被英偉達等上游硬件廠商切走的巨額利潤。對于擁有數億日活用戶的“豆包”和視頻生成模型而言,推理環節的算力消耗遠超訓練環節,這恰恰是成本失控的“重災區”。
如果繼續依賴價格昂貴的通用GPU來處理海量的用戶請求,不僅意味著持續給供應商“打工”,更意味著火山引擎在對外提供MaaS服務時,難以掌握定價的主動權。
這并非危言聳聽,看看供應商的財報就知道“打工”打得有多慘烈。
在AI芯片的賣方市場里,定價權完全掌握在上游手中。據The Information分析,英偉達高端GPU的毛利率長期維持在70%以上的高位。對于字節跳動這樣千億級采購規模的超級大客戶來說,這意味著每花100塊錢買芯片,就有70塊錢是在給黃仁勛交“過路費”。
即便是在被視為“平替”的國產芯片領域,情況也并未好轉太多。以字節跳動核心供應商之一的寒武紀為例,其2025年財報顯示,受益于互聯網大廠的瘋狂掃貨,公司不僅實現了歷史性盈利,其思元系列推理卡的毛利率也隨著規模效應開始攀升,公司毛利率也超過50%。
于是,一個很殘酷但也很清晰的邏輯浮現了:上游芯片廠商的超額利潤,本質上就是字節跳動和火山引擎的成本黑洞。
在存量競爭時代,供應商的每一分利潤,都是字節可以挖掘的降本空間。既然推理芯片并不需要像訓練芯片那樣追求極致的通用性和雙精度計算能力,那么為什么要把這幾百億的利潤拱手讓人?
更何況,在全球科技巨頭的牌桌上,“自研芯片”早已不是一道成本選擇題,而是一道能力證明題——證明你是否有資格成為真正的云巨頭。
放眼海外,谷歌早在十三年前就開啟了TPU的研發。而當外界大力爭搶英偉達顯卡時,谷歌卻默默祭出了TPU。正是憑借TPU與TensorFlow框架的軟硬一體化,谷歌在保證自家搜索、YouTube推薦等龐大業務算力需求的同時,將單位算力成本壓縮到了競爭對手的幾分之一,甚至還開始了TPU的外售,扮演起了“第二英偉達”的角色。
目光轉回國內,阿里云走的也是自研的道路。
1月底,平頭哥官網上線了最新一代AI芯片“真武810E”,性能直接對標海外芯片巨頭英偉達的H20,出貨量已達10萬片,超過寒武紀,在國產GPU廠商中屬于第一梯隊。并在阿里云實現多個萬卡集群部署,并服務了國家電網、小鵬汽車等400多家客戶。
更重要的是,阿里云也借此實現了“平頭哥+阿里云+千問模型”黃金三角的閉環。
據雷峰網溝通的推理框架優化專家張濤解析,“以DeepSeek推出大型MoE模型為例,其本質便是在云端集群場景下實現了極致的模型與硬件的co-design,以此最大化釋放算力性能,而阿里的全棧自研將是更‘激進’的原生適配方案。”
對于字節跳動而言,前有谷歌TPU的“珠玉在前”,后有阿里PPU的“近身示范”,此時下場造芯,不僅是出于成本控制的防守,更是為了在MaaS戰爭中復刻谷歌神話的進攻。當算力成本決定了模型定價的底線,沒有自研芯片的云廠商,注定只能是英偉達的“售票員”,永遠無法觸碰到商業閉環的核心利潤。
為了不當這個“售票員”,字節跳動必須掌握這種“量體裁衣”的技術。
正如張濤所言,極對于互聯網企業來說,極致的Co-design才是破局關鍵。相比于采購通用GPU,自研的ASIC芯片更像是一把精準的手術刀,它能針對字節獨有的推薦算法和Transformer架構進行深度定制,剔除所有冗余的通用功能,把每一顆晶體管都用在刀刃上。
業界估算,這種極致的專用性,能將單位算力成本降低50%以上。這不僅僅是技術指標的勝利,更是商業邏輯的質變:當采購規模突破了“自研盈虧平衡點”,下場造芯就從一種可有可無的技術儲備,變成了巨頭博弈中必須跨越的生存門檻。
只有把算力的“水龍頭”徹底掌握在自己手里,字節跳動才能在未來慘烈的模型價格戰中,擁有不用看別人臉色的底氣。
02 芯片“去中介化”誰在寒冬里發抖?
然而,商業世界的甲之蜜糖,往往是乙之砒霜。
當字節跳動決心將那幾百億的“超額利潤”留在自己鍋里時,對于剛剛在2025年嘗到甜頭的國產芯片廠商而言,這不僅僅意味著丟失了一個大客戶,更意味著一場關于“去中介化”的生命倒計時正式開啟。
回顧這段關系的起點,字節跳動與寒武紀的聯手,從一開始就帶有濃厚的“備胎”色彩。
如果將時間軸撥回兩年前,這是一場在極端外部壓力下的“抱團取暖”。彼時,受制于禁令因素,A100/H100軍無法正常供應,雖然隨后推出了H800、H20等“閹割版”的產品,但這把懸在頭頂的達摩克利斯之劍讓所有互聯網巨頭都感到脊背發涼。在供應鏈最黑暗的時刻,字節跳動急需一個“Plan B”來對沖英偉達隨時可能斷供的風險。
而作為國產AI芯片“第一股”的寒武紀,憑借其思元系列產品,成為了當時為數不多能拿出量產現貨、且軟件棧相對成熟的供應商。
這是一場典型的“基于恐懼的采購”,而非“基于性能的優選”。
據產業鏈調研數據顯示,2023年至2024年間,字節跳動在瘋狂掃貨英偉達合規芯片的同時,開始向寒武紀下達了規模可觀的意向訂單。這些芯片并沒有立刻被部署在核心的推薦算法集群中,而是主要用于部分非核心業務的推理場景測試。
這種合作在2025年達到了頂峰:隨著字節AI產品爆發,推理算力需求激增,而英偉達產能吃緊,寒武紀的思元590芯片成功切入了字節的供應鏈體系,填補了部分算力缺口。
正是得益于字節跳動、百度、阿里等互聯網大廠的這種“避險性采購”,寒武紀迎來了它成立以來的最高光時刻。
2025年,寒武紀營收實現了驚人的翻倍式增長,一舉突破60億元人民幣大關,同比增長率超過200%;更重要的是,它終于跨越了那道困擾了自身多年的財務天塹,實現了歷史性的首次年度盈利。
而在資本市場上,寒武紀的股價隨著這份“超預期”的成績單聞風起舞。從2025年初開始,其股價猶如坐上了火箭,一路擊穿各大阻力位,市值一度逼近5000億大關。那段時間,券商研報都在用最亢奮的語調高呼“中國的英偉達已經誕生”,科技股論壇都在討論思元系列如何在成為字節的“太子”,甚至還有字節入股寒武紀的小作文傳出。
投資者們篤定地認為,國產替代的終局已經到來,寒武紀將像當年的英偉達一樣,躺在互聯網巨頭的算力軍備競賽中,坐享高毛利的紅利。
然而,繁榮的表象之下,是極其脆弱的地基。
寒武紀的業績爆發,本質上是建立在“英偉達供給不足”和“巨頭自研尚未到位”這兩個時間差之上的。這是一種典型的“窗口期紅利”。對于字節跳動而言,2024年到2025年的大規模采購,更多是一場“基于恐懼的避險”和“不得不完成的任務”,而非基于技術與信任的合作。
產業鏈知情人士曾向超聚焦透露,字節跳動在彼時掃貨寒武紀思元590芯片,核心訴求非常簡單:填坑。 在英偉達高端算力受限、國產自研芯片尚未量產的空窗期,字節需要大量的現貨來維持“豆包”模型指數級增長的推理需求,并且作為互聯網第一大廠也有責任與義務扶持國產算力。
換句話說,大廠買你,不是因為你不可替代,而是因為當時只有你“有貨”。
而當時間來到2026年,當字節跳動的1000人芯片團隊完成了從架構設計到流片驗證的全部拼圖時,這個昂貴的“備胎”也將逐漸失去存在的意義。
寒武紀作為一家獨立的芯片設計公司,其產品迭代周期通常遵循傳統的硬件規律,一款芯片從定義到量產往往需要18到24個月。這意味著,當字節跳動的算法團隊在2026年提出了一個新的稀疏化注意力機制時,他們如果使用寒武紀的芯片,可能要等到2027年底才能用上硬件加速。
但在字節內部,這個邏輯被徹底重寫了。
隨著“SeedChip”項目的落地,字節的算法團隊可以直接和芯片團隊坐在同一個辦公室里。這是一種物理距離歸零帶來的化學反應: 算法工程師上午提出的算子優化需求,芯片架構師下午就能將其寫入指令集,甚至直接調整片上內存的配比。通過這種極致的Co-design,字節可以在幾個月內實現硬件層面的迭代支持。
當字節可以用更低的成本、更快的迭代速度來滿足自身需求時,繼續維持寒武紀的高毛利采購,就違背了商業的基本邏輯。
而這場危機,不僅僅屬于寒武紀。
目光放寬到整個國產芯片賽道,壁仞科技、摩爾線程等獨角獸公司,同樣面臨著被大廠“降維打擊”的風險。這些公司的商業模式,在很大程度上都是試圖成為“中國的英偉達”,即通過設計通用的高性能GPU,賣給云廠商和智算中心。
但現實是,他們最大的潛在客戶阿里云、字節跳動、騰訊云、百度智能云,無一例外都在瘋狂布局自研芯片。
阿里的PPU已經證明了這條路的可行性。其自研的AI芯片已經在阿里內部的推薦和推理業務中大面積鋪開,并且開始探索外售的道路。如果說阿里云是第一個吃螃蟹的人,那么字節跳動就是那個緊隨其后、且胃口更大的掠食者。
這便是“中間商”在巨頭博弈時代的宿命。
在云計算和AI的產業鏈條中,處于中游的第三方獨立芯片設計廠商,正面臨著前所未有的“夾層擠壓”。
向上,他們無法像英偉達那樣擁有無可撼動的CUDA生態護城河,能夠讓客戶“不得不買”;向下,他們又面臨著大廠自研芯片的極致性價比競爭。于是,當最大的客戶變成了最強的競爭對手,第三方廠商的生存空間將被壓縮到極限。
未來,以字節、阿里為代表的互聯網巨頭,絕不會僅僅將自研芯片鎖在自家的機房里做“內部特供”。商業的邏輯永遠是追求規模效應的最大化:當“SeedChip”或“真武”經過了內部數百萬卡級別的打磨驗證,良率穩定、成本極低時,它們必然會走向對外售賣。
屆時,這些互聯網巨頭將完成最可怕的跨界:它們既是最大的云服務商,也是最大的芯片供應商。而在這種降維打擊下,留給寒武紀等“特種生存派”的路,只剩下兩條。
第一條路是成為英偉達。
在這條路上,你要做的不僅僅是畫出最好的電路圖,而是要構建出像CUDA一樣堅不可摧的軟件生態護城河。放眼全球,能走通這條路的獨立廠商只有英偉達一個,這需要“天時地利人和”的極致配合。
回顧英偉達的崛起,那是建立在長達15年的“孤獨長跑”之上的。黃仁勛在AI爆發前的荒原里,每年燒掉數億美金推廣CUDA,那時沒有巨頭盯著他,沒有云廠商搶他的生意,他擁有充足的時間窗口去“猥瑣發育”,將顯卡從游戲工具一點點改造成AI引擎。
但現在,這個“天時”已經徹底消失了。
在AI已經成為全球科技軍備競賽核心的今天,任何一家初創公司想要重走一遍CUDA之路,都會發現周圍早已是巨頭環伺。你沒有十年的時間去慢慢培養開發者生態,因為字節和阿里們的自研芯片明天就會上線,直接用PyTorch/TensorFlow的底層適配繞過你的生態壁壘;你也沒有從容試錯的機會,因為資本市場和客戶不再相信長周期的神話。
這條路意味著要在巨頭的眼皮底下再造一個英偉達,但殘酷的是,這注定是一場九死一生的突圍。
第二條路,則是更現實的賣身互聯網。
對于大多數無法成為英偉達的國產芯片廠商而言,這或許是最好的歸宿。與其在巨頭的夾縫中被“去中介化”慢慢絞殺,不如在自己技術尚有價值、團隊尚有戰力的時候,選擇并入巨頭的版圖,融合成為字節或阿里內部的一個硬件部門。這并非失敗,而是另一種形式的“上岸”。
對于寒武紀而言,2025年的盈利或許是短暫輝煌的起點,但也可能是大廠“去中介化”前最后的狂歡。
在這個贏家通吃的算力時代,單純的“硬件中間商”正在失去存在的土壤。未來的牌桌上,只有兩類玩家:要么強大到能像英偉達一樣,制定規則,讓巨頭為你打工; 要么,聰明到能像Annapurna一樣,融入巨頭,成為規則的一部分。
除此之外,已無更多坦途了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.