谷歌,除了總是被批評是大公司,已經具備了一家真正AI巨頭的全部優勢。
昨晚,谷歌站上了3萬億美元市值的高臺。如果說,當4萬億美元的時候,屬于AI推理的時代真正降臨了,那么,下一個歷史性的關鍵時刻,就是AI時代領袖地位的交接。能超越英偉達的,最有可能的正是谷歌。
谷歌最先發現了Transformer架構,也最積極地自研ASIC芯片。算法與算力,AI時代技術全棧中最核心的兩個環節,決定了每一個token的成本與價值,谷歌都緊緊抓在手里;它最懂大模型需要從硬件獲得什么。僅僅這兩項,目前就值至少9000億美元,差不多是OpenAI的兩倍。更別提谷歌還坐擁系統、應用與人才的整個生態,讓token經濟學在它手里,同時最大化規模效應和網絡效應。
推理時代已經降臨。如今,資金仍在迅速涌入賣鏟子的英偉達,但是,應用市場傳來了。OpenAI與Anthropic的年化經常性收入(ARR)正在爆發式增長;伴隨著的演進,也并非全無可能。正如進入預訓練時代,數據中心級別GPU與HBM取代了消費級GPU與DDR的市場地位,進入推理時代,市場也正尋找更適合這個時代的硬件。
在推理時代,行業都深陷token經濟學的焦慮之中。模型框架、硬件參數、工作負載,是影響推理階段決定成本、速度與性能的重要因素。但是,無論哪一場競爭,背后真正支配整個生態的,始終是大規模計算所面臨的物理極限,包括算力、內存與通信;最具長期價值的投資機會,往往屬于那些能夠為這些核心瓶頸提供解法的公司。事實上,英偉達最新的Rubin CPX,就是專門為代碼生成和視頻生成定制的。
就連黃仁勛也改變了吆喝方式,從“買得越多,賺得越多”升級為“免費的更貴”。他在“嚇唬”它的客戶,選擇那些性能只有Blackwell架構的1/4的芯片,將導致潛在收益降低3/4。但是,博通的XPU敘事則,市場正在加速走向AI定制芯片,用最合適的芯片逐步替代最強的芯片。谷歌則是其中的佼佼者。
在上個月的大會上,谷歌披露了第七代TPU Ironwood的更多細節。這是谷歌首款專為大規模AI推理設計的TPU,突破點非常多,幾乎覆蓋了“性能、擴展、能效、可靠性”所有維度。借助光路交換機(OCS),單個基于Ironwood的超節點(SuperPod)在縱向設計上最多可容納9216顆芯片,總算力達到42.5 Exaflops,并共享1.77PB可直接尋址的HBM;同時,它還能夠橫向擴展至數十個超節點。它的每瓦性能是上一代谷歌TPU Trillium的2倍,降低了推理的運營成本,以及被忽略的碳成本。
谷歌正在開放自己的TPU市場。它現在已經是除了英偉達GPU之外的硬通貨。全球最頂尖的前沿大模型廠商OpenAI與Anthropic都用上了TPU;OpenAI正在自研AI芯片,但奧特曼挖人,還是更信得過在TPU團隊干過的。蘋果也用過谷歌TPU訓練自家AI,xAI則迷上了TPU的JAX框架。還有傳言稱,谷歌正在設法接近Fluidstack等新興AI云服務商,將TPU部署到它們的數據中心里;它們此前屬于英偉達陣營。
谷歌的TPU還將持續沿著token經濟學指明的方向進化和擴展系統。決定后者成立的兩條關鍵曲線,分別是持續上升的單位token價值,以及持續下降的單位token成本。
谷歌的Gemini 2.5,象征著它;它的Gemini 3將進一步提升每一個生成的token的價值。Gemini不僅是模型,還是谷歌的超級應用,滲透進它旗下7個20億用戶規模的產品平臺,這使得它針對模型與芯片的AI基礎設施優化,甚至是模型-芯片協同設計,都能進一步通過規模效應降低單位token成本,通過網絡效應提高單位token價值,放大token經濟學的溢價。沒有人比谷歌更懂Transformer需要從硬件獲得什么了。
Gemini與它賦能的應用,正在讓它的AI工廠瘋狂地生產token。從5月的480萬億tokens,驟增至6月的980萬億,這一波是Veo 3帶來的,還沒算上Nano Banana“融化”的TPU。
谷歌已經憑借后來居上的Gemini,守住了AI技術對搜索與瀏覽器的顛覆。去年,搜索為谷歌帶去了近2000億美元的廣告收入,OpenAI與Perplexity覬覦著這個龐大的市場。這場搜索的“諸神之戰”,還為谷歌帶去了意外的收獲。針對谷歌的反壟斷案終于裁決,谷歌無需剝離Chrome瀏覽器和安卓操作系統這兩大重要業務;去年,同一位法官,還認為谷歌是“有罪”的。
盡管競爭“改變了本案的進程”,但谷歌利用AI對搜索業務的再造,包括AI Overviews搜索、AI Mode搜索、Google Lens搜索以及Circle搜索,都在創造更高的用戶黏性。AI Overviews搜索的月活用戶更是突破了20億,并且將繼續在更多國家落地。
在搜索中獲得完整的AI體驗,最終將提升每個token的價值。按照谷歌高管的說法,商業信息本身也是用戶有特定意圖時尋找的最相關信息,從第一性原理看,沒理由AI在這方面做不好。而如果問題是服務成本,那憑借基礎設施,谷歌也有信心比幾乎任何對手都做得更好;而且,更大的瓶頸可能是延遲,而不是單位查詢成本,這正是軟硬件協同可以生效的地方。谷歌的TPU,肯定比英偉達的GPU更懂廣告。
谷歌Gemini的活躍用戶,仍然低于OpenAI的ChatGPT。前者月活超4.5億,后者周活就達到了7億。但是,最近幾個月,Gemini的下載量開始激增。從5月至8月,谷歌旗下大模型應用Gemini的下載量,幾乎都在ChatGPT之上。
大模型App全球月度下載
![]()
今日,Gemini更是登頂了美國等多個國家或地區的AppStore免費榜。多虧了Nano Banana,與數月前OpenAI的GPT-4o引發“吉卜力”風格漫畫病毒式傳播相似,它在兩周內就累計完成超2億次圖像編輯,帶動超1000萬新用戶嘗試Gemini應用。與其說它的關鍵創新,在于生成酷炫圖片,還不如說是在于更低門檻的編輯能力,同時保持原始照片的風格和一致。這是攻陷了大眾市場的殺手級功能。
圖像生成技術并非新生事物,MidJourney和Stable Diffusion的誕生,比ChatGPT還早,也吸引了大量的技術的早期接受者。但它們遲遲未能“出圈”。真正將這項技術轉化為大眾產品的,是GPT-4o與Nano Banana,證明了低成本、可視化的應用,將繼續引領更大規模的消費技術市場;ChatGPT與Gemini也讓這些功能變得更為可及。
在圖像生成上的故事,也會在視頻生成領域重演。在這個夏天結束的時候,每一位YouTube Shorts的創作者,以及Google Photos的用戶,都可以采用Veo 3視頻生成功能。谷歌還特地為此新增了豎屏視頻格式支持。如果說,面向規模市場的消費者,在哪里生成就在哪里留存尤為關鍵,那么,谷歌至少比OpenAI更有優勢,讓創作者不僅只是支付了token成本,還能將token價值沉淀在自己的平臺上。
更大規模的token經濟,尚未真正成型。谷歌還儲備了世界模型Genie、具身智能模型Gemini Robotics,混合現實操作系統Android XR,并復活了自己的智能眼鏡項目。它還布局智能體之間相互通信的A2A協議,想做AI智能體網絡的中心。
而且,谷歌還有一個龐大的物理AI生態,自動駕駛、電腦手機、可穿戴、智能家居,應有盡有。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.