![]()
新智元報(bào)道
編輯:犀牛
【新智元導(dǎo)讀】隨著Gemini 3模型與第七代TPU的強(qiáng)勢(shì)發(fā)布,谷歌終于打破了OpenAI與英偉達(dá)主導(dǎo)的市場(chǎng)敘事,宣告這一「沉睡的巨人」已憑借硬核實(shí)力完全醒來(lái)。
ChatGPT一轉(zhuǎn)眼已發(fā)布三年了。
過(guò)去三年,全球科技界都沉浸在一個(gè)由兩位「雙子星」所主導(dǎo)的敘事中——
英偉達(dá)負(fù)責(zé)「賣鏟子」,提供高達(dá)80%毛利的GPU硬件基石;
OpenAI則負(fù)責(zé)「挖金礦」,堅(jiān)信Scaling Law(擴(kuò)展法則),定義模型的前沿。
所有人都以為,谷歌這家一度被分析師認(rèn)為在AI競(jìng)賽中「落后」的巨頭,只能扮演一個(gè)追趕者的角色。
然而,現(xiàn)在一切都已不同。
上個(gè)月,當(dāng)谷歌推出其Gemini 3系列模型和第七代TPU Ironwood時(shí),市場(chǎng)的震撼達(dá)到了前所未有的程度。
這種震撼不是因?yàn)楣雀琛缸菲健沽藢?duì)手,而是因?yàn)樗苯?strong>重塑了游戲規(guī)則。
作為新智元ASI產(chǎn)業(yè)圖譜11月號(hào)文章,本文將深入分析谷歌是如何利用獨(dú)有的「全棧AI」戰(zhàn)略,構(gòu)建起對(duì)手難以復(fù)制的護(hù)城河并重回巔峰的。
![]()
「沉睡的巨人」已完全醒來(lái)
Gemini 3發(fā)布后,就連奧特曼都罕見發(fā)聲,承認(rèn)在某些關(guān)鍵維度上確實(shí)「落后」了。
更加戲劇性的是,英偉達(dá)股價(jià)也應(yīng)聲下挫,過(guò)去一個(gè)月跌幅約15%。
如此大的跌幅逼得公司不得不發(fā)表聲明,強(qiáng)調(diào)其GPU的通用性和CUDA生態(tài)的不可替代性。
與此同時(shí),谷歌母公司Alphabet的股價(jià)卻一路飆升,正邁向4萬(wàn)億美元的市值。
![]()
這一切都指向了同一個(gè)事實(shí):谷歌這個(gè)「沉睡的巨人」,現(xiàn)在已經(jīng)完全醒來(lái)。
而這背后的力量源泉,正是其對(duì)AI技術(shù)棧的徹底垂直整合——「全棧AI」戰(zhàn)略。
正如谷歌CEO Sundar Pichai在Gemini 3發(fā)布時(shí)所言——
也正因?yàn)槲覀冊(cè)贏I創(chuàng)新上有一套與眾不同的全棧做法——從領(lǐng)先的基礎(chǔ)設(shè)施,到世界一流的研究、模型和工具,再到觸達(dá)全球數(shù)十億人的產(chǎn)品——我們才能以前所未有的速度,把先進(jìn)的能力帶給全世界。
![]()
性能巔峰:Gemini 3
和Nano Banana的非線性突破
與Gemini 2.5 Pro相比,Gemini 3的進(jìn)步并不體現(xiàn)在「參數(shù)翻倍」上,而是在推理能力與多模態(tài)架構(gòu)上完成了一次顯著躍遷。
它被谷歌定位為一款基于最先進(jìn)推理能力的原生多模態(tài)模型:能在同一個(gè)模型里同時(shí)處理文本、圖像、音頻和視頻,在統(tǒng)一的內(nèi)部表示中做跨模態(tài)推理,并在多項(xiàng)主流基準(zhǔn)測(cè)試中取得頂尖成績(jī)。
在LMArena競(jìng)技場(chǎng)排行榜中,Gemini 3 Pro在所有項(xiàng)目中目前都排名第一。
在更強(qiáng)調(diào)綜合智能的Artificial Analysis Intelligence Index排行榜中,Gemini 3同樣以73分位居榜首。
![]()
![]()
如果說(shuō)Gemini 3是智力的巔峰,那么Nano Banana Pro就是實(shí)用性和創(chuàng)造力的狂歡。
Nano Banana Pro一經(jīng)發(fā)布,便迅速引發(fā)了一場(chǎng)「社交狂歡」,用戶僅需通過(guò)極其簡(jiǎn)單的提示詞,就能生成高質(zhì)量的戰(zhàn)力排行榜、知識(shí)繪本和各種表情包等。
![]()
谷歌CEO Sundar Pichai也提到,Nano Banana Pro在信息圖表的生成上取得了突破。
這種強(qiáng)大的應(yīng)用屬性,讓普通用戶的創(chuàng)造力得以釋放。
正如互聯(lián)網(wǎng)讓更多人成為創(chuàng)作者一樣,AI工具正讓更多人以腦海中的方式來(lái)表達(dá)自我。
![]()
Nano Banana Pro生成的信息圖
「全棧AI」的垂直整合
模型能力的突破可能僅僅是冰山一角。
要理解谷歌的強(qiáng)大,則必須深入到其底層的戰(zhàn)略本質(zhì)——全棧垂直整合。
如果將AI的進(jìn)步視為一次登月計(jì)劃,那么競(jìng)爭(zhēng)對(duì)手可能只擁有最先進(jìn)的火箭(模型)或者最有力的燃料(GPU)。
而谷歌,則建造了一座集成了燃料制造廠、火箭設(shè)計(jì)院和發(fā)射臺(tái)的全套「航天中心」。
這套「全棧AI」從底層基礎(chǔ)設(shè)施、世界級(jí)研究(模型和工具),一直延伸到面向用戶的產(chǎn)品和平臺(tái)。
換句話說(shuō),從Nano Banana這樣的應(yīng)用,到背后的模型,再到最底層的芯片,谷歌幾乎都握在自己手里。
TPU的誕生與進(jìn)化
谷歌的全棧故事,要從一場(chǎng)看似迫不得已的「自救」行動(dòng)講起。
2015年,谷歌內(nèi)部部署了TPU v1,迅速在各部門獲得熱烈反響。
這并非出于炫技,而是被逼入了一個(gè)「不自研將難以支撐未來(lái)業(yè)務(wù)規(guī)模」的現(xiàn)實(shí)。
![]()
當(dāng)時(shí),深度學(xué)習(xí)開始廣泛滲透谷歌的搜索、廣告等核心業(yè)務(wù),這讓谷歌工程團(tuán)隊(duì)意識(shí)到一個(gè)關(guān)鍵問(wèn)題:如果全面采用深度學(xué)習(xí)模型,谷歌全球數(shù)據(jù)中心的功耗將暴漲到難以承受的程度。
當(dāng)時(shí)的GPU雖然更適合訓(xùn)練大規(guī)模網(wǎng)絡(luò),但其能效并非針對(duì)實(shí)時(shí)在線推理設(shè)計(jì)的。
這讓谷歌的高層意識(shí)到,繼續(xù)依賴CPU和GPU的現(xiàn)有路線不可持續(xù)。
于是,谷歌決定自己造一塊專用芯片(ASIC)——TPU,把目標(biāo)定得非常簡(jiǎn)單粗暴:只干一件事,把訓(xùn)練和運(yùn)行AI模型需要的那些矩陣、向量運(yùn)算做到極致高效。
到了2017年,那篇著名的Transformer論文發(fā)表后,谷歌立即意識(shí)到,這個(gè)新架構(gòu)的計(jì)算模式高度規(guī)則、矩陣密度極高、并行度極高,簡(jiǎn)直是為TPU量身定做的。
于是,他們自己把軟件架構(gòu)、編譯器、芯片架構(gòu)、網(wǎng)絡(luò)拓?fù)洹⑸嵯到y(tǒng)都握在手里,形成全棧閉環(huán)。
TPU由此升級(jí)為谷歌AI基礎(chǔ)設(shè)施的底座和支柱。
![]()
如今,TPU已發(fā)展到了第七代Ironwood(鐵木)。
如果說(shuō)TPU v4/v5p是兼顧訓(xùn)練和推理的多面手,那么Ironwood就是在繼續(xù)強(qiáng)化訓(xùn)練能力的前提下,把推理放到設(shè)計(jì)核心的一代——一個(gè)為大規(guī)模推理優(yōu)先、又能承擔(dān)巨型模型訓(xùn)練的定制利器。
相較第六代TPU Trillium(v6e),Ironwood在訓(xùn)練與推理工作負(fù)載上的單芯片性能提升超過(guò)4倍;與TPU v5p相比,峰值算力最高可達(dá)10倍。
它也是谷歌迄今性能最強(qiáng)、能效最高的TPU。
Ironwood單個(gè)superpod可容納9,216顆TPU,依托9.6 Tb/s級(jí)別的芯片間互聯(lián)和約1.77 PB的共享高帶寬內(nèi)存,大幅緩解了大模型訓(xùn)練和推理中的通信瓶頸,使復(fù)雜AI模型在超大規(guī)模集群上運(yùn)行得更快、更穩(wěn)定。
它的出現(xiàn),意味著谷歌正式把資源和架構(gòu)重心從「訓(xùn)練」轉(zhuǎn)向「訓(xùn)練+大規(guī)模推理一體化」,并公開把「age of inference」(推理時(shí)代)定義為下一階段AI基礎(chǔ)設(shè)施的主戰(zhàn)場(chǎng)。
通過(guò)Ironwood+AI Hypercomputer這套系統(tǒng)級(jí)組合拳,谷歌同時(shí)在單芯片性能和整機(jī)房級(jí)算力密度兩條戰(zhàn)線對(duì)標(biāo)英偉達(dá),爭(zhēng)奪下一代AI基礎(chǔ)設(shè)施的話語(yǔ)權(quán)。
![]()
Ironwood超級(jí)機(jī)柜的一部分,直接在一個(gè)單一域內(nèi)連接了9,216個(gè)Ironwood TPU
模型與硬件的深度契合
谷歌的AI全棧戰(zhàn)略在軟硬件一體化這點(diǎn)上看得最清楚。
靠著這套從芯片、數(shù)據(jù)中心到模型架構(gòu)都自己打通的體系,谷歌把過(guò)去層層割裂的環(huán)節(jié)擰成了一根繩,性能和效率一起往上抬。
以Ironwood為例,它就是研究人員影響硬件設(shè)計(jì)、硬件反過(guò)來(lái)加速研究成果的持續(xù)閉環(huán)產(chǎn)物。
當(dāng)谷歌DeepMind團(tuán)隊(duì)需要為其頂尖模型實(shí)現(xiàn)特定架構(gòu)突破或者優(yōu)化時(shí),他們可以直接與TPU工程師團(tuán)隊(duì)緊密協(xié)同創(chuàng)新。
這種內(nèi)部協(xié)作確保了模型架構(gòu)的設(shè)計(jì)始終是基于最新代際的TPU進(jìn)行訓(xùn)練,從而相對(duì)于前代硬件實(shí)現(xiàn)顯著的性能提升和加速。
![]()
Jupiter數(shù)據(jù)中心網(wǎng)絡(luò)能夠?qū)⒍鄠€(gè)Ironwood超級(jí)莢連接成包含數(shù)十萬(wàn)個(gè)TPU的集群
現(xiàn)在,谷歌的創(chuàng)新循環(huán)更進(jìn)了一步,達(dá)到了「AI設(shè)計(jì)AI」的境界。
他們用一種名為AlphaChip的AI技術(shù)來(lái)設(shè)計(jì)下一代芯片的布局方案。
AlphaChip利用強(qiáng)化學(xué)習(xí)來(lái)生成更優(yōu)化的芯片布局。
目前,這一方法已經(jīng)成功應(yīng)用于包括Ironwood在內(nèi)的連續(xù)三代TPU的設(shè)計(jì)中。
這大大降低了谷歌對(duì)外部半導(dǎo)體設(shè)計(jì)工具和供應(yīng)商的依賴。
通過(guò)這種自研芯片+內(nèi)部?jī)?yōu)化,谷歌在算力成本上形成了天然優(yōu)勢(shì),從而避免了昂貴的「CUDA稅」。
巨頭們的「投懷送抱」
谷歌內(nèi)部實(shí)測(cè)數(shù)據(jù)顯示,Ironwood在同等負(fù)載下的推理成本較GPU旗艦系統(tǒng)低30%-40%。
有分析指出,谷歌提供同等推理服務(wù)時(shí)的底層成本可能僅為對(duì)手的兩成。
在推理時(shí)代,這樣的成本差異足以改變大客戶的架構(gòu)選擇:對(duì)每年在推理上投入數(shù)千萬(wàn)甚至上億美元的企業(yè)來(lái)說(shuō),壓縮三到五成支出,足以改寫財(cái)報(bào)。
在這一層意義上,TPU正在變成許多公司重構(gòu)推理基礎(chǔ)設(shè)施時(shí)優(yōu)先考慮的算力引擎。
谷歌自己也正在將TPU從「內(nèi)部黑科技」打造為市場(chǎng)上的「生態(tài)可選項(xiàng)」,進(jìn)而吸引像Anthropic、Meta這樣的大客戶。
僅Anthropic一家就計(jì)劃接入高達(dá)100萬(wàn)個(gè)TPU。
谷歌還順勢(shì)啟動(dòng)了TPU@Premises計(jì)劃,將TPU直接部署在企業(yè)的數(shù)據(jù)中心,使得客戶可以在本地以極低的延遲使用推理能力。
近期還有市場(chǎng)傳聞稱,Meta正評(píng)估在2027年把TPU引入自家數(shù)據(jù)中心,并最早從明年起通過(guò)谷歌云租用部分算力——無(wú)論最終如何落地,這類討論本身就說(shuō)明TPU已經(jīng)進(jìn)入一線互聯(lián)網(wǎng)公司的選項(xiàng)集。
回到更可量化的層面:根據(jù)谷歌第三季度財(cái)報(bào),谷歌云新增客戶數(shù)量同比增長(zhǎng)近34%,超過(guò)10億美元的大單規(guī)模已超過(guò)前兩年的總和,超過(guò)70%的客戶正在使用谷歌云的AI產(chǎn)品。
這些變化,在很大程度上都與谷歌在算力成本和產(chǎn)品形態(tài)上的優(yōu)勢(shì)緊密相關(guān)。
C端:全棧AI的終極引擎
正如上文谷歌CEO劈柴哥所言,谷歌的全棧AI戰(zhàn)略,是一個(gè)涵蓋AI基礎(chǔ)設(shè)施、世界級(jí)研究(包括模型和工具)以及將AI帶給全球用戶的產(chǎn)品和平臺(tái)的全面系統(tǒng)。
C端產(chǎn)品——特別是其核心業(yè)務(wù)如搜索、地圖以及Gemini app和Nano Banana Pro等新的AI應(yīng)用——不僅僅是戰(zhàn)略的最終輸出,它們更是驅(qū)動(dòng)整個(gè)全棧AI生態(tài)系統(tǒng)向前發(fā)展的核心引擎,是實(shí)現(xiàn)技術(shù)驗(yàn)證、數(shù)據(jù)積累和商業(yè)閉環(huán)的關(guān)鍵。
谷歌憑借其無(wú)可匹敵的用戶規(guī)模和數(shù)據(jù)廣度,為其定制硬件和領(lǐng)先模型提供了無(wú)與倫比的「煉丹爐」和「試驗(yàn)場(chǎng)」。
這些數(shù)據(jù)源包括谷歌搜索、Android、YouTube等,谷歌通常自己使用這些數(shù)據(jù)。
而像Gemini系列模型,則被視為是貫穿谷歌所有產(chǎn)品的主線。
在2025年第三季度,谷歌的第一方模型(如 Gemini)僅通過(guò)客戶直接API,每分鐘就處理約70億個(gè)tokens。
若把搜索、YouTube、Android等所有界面加起來(lái),每月被模型消化的tokens已超過(guò)1.3千萬(wàn)億個(gè)(quadrillion),一年內(nèi)增長(zhǎng)了20多倍。
![]()
這些數(shù)據(jù)展示了C端產(chǎn)品作為AI能力載體的恐怖規(guī)模,也使得Gemini應(yīng)用在推出后,月活躍用戶數(shù)迅速超過(guò)6.5億,形成了驅(qū)動(dòng)AI進(jìn)步的數(shù)據(jù)飛輪。
以谷歌AI Mode為例,自推出以來(lái)其在美國(guó)實(shí)現(xiàn)了強(qiáng)勁且持續(xù)的周環(huán)比增長(zhǎng),查詢量在一個(gè)季度內(nèi)翻了一番。
截至三季度,已擁有超過(guò)7500萬(wàn)的日活用戶,推廣到了全球40種語(yǔ)言。
最重要的是,AI Mode已經(jīng)為搜索帶來(lái)了增量的總查詢?cè)鲩L(zhǎng)。
12月2日,谷歌已宣布將AI Mode融入進(jìn)搜索中,給搜索用戶提供類似ChatGPT的聊天體驗(yàn)。
這種C端產(chǎn)品成功將AI技術(shù)轉(zhuǎn)化為實(shí)實(shí)在在的業(yè)務(wù)增長(zhǎng),進(jìn)一步奠定了谷歌在核心領(lǐng)域的競(jìng)爭(zhēng)優(yōu)勢(shì)。
簡(jiǎn)言之,谷歌的C端產(chǎn)品(如搜索),是其全棧AI戰(zhàn)略的需求源、數(shù)據(jù)場(chǎng)和商業(yè)出口。
這些C端產(chǎn)品一方面制造了真實(shí)的流量和使用壓力,另一方面又不斷把反饋灌回谷歌的TPU和Gemini,讓它們?cè)诟哳l迭代中越跑越省錢、越跑越高效。
全棧AI:改寫技術(shù)文明底座
在當(dāng)下這個(gè)以「推理為先」的AI時(shí)代,谷歌率先把競(jìng)爭(zhēng)從單一模型的短跑,換成了全棧系統(tǒng)的馬拉松。
至此,真正的護(hù)城河不再是誰(shuí)有更多的芯片、更先進(jìn)的模型,而是誰(shuí)掌握了「基礎(chǔ)設(shè)施-研究-產(chǎn)品-數(shù)據(jù)」的閉環(huán)。
展望未來(lái),如果說(shuō)過(guò)去互聯(lián)網(wǎng)解決的是「信息是如何被找到的」,那么全棧AI要回答的將是「世界如何被重新組織」。
以谷歌為代表的科技公司,能否將這套AI閉環(huán),轉(zhuǎn)化為更公平的教育、更高效的科研、更可持續(xù)的產(chǎn)業(yè),將在很大程度上決定下一代技術(shù)文明的形狀——
那時(shí),我們也許不再刻意談?wù)揂I,因?yàn)樗鼘⒊蔀槲拿鞯哪J(rèn)背景。
參考資料:
https://cloud.google.com/blog/products/compute/ironwood-tpus-and-new-axion-based-vms-for-your-ai-workloads
https://cloud.google.com/transform/ai-specialized-chips-tpu-history-gen-ai?utm_source=chatgpt.com
秒追ASI
?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?
點(diǎn)亮星標(biāo),鎖定新智元極速推送!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.