![]()
新智元報道
編輯:元宇 好困
【新智元導(dǎo)讀】Google憑借Gemini 3、自研芯片、強大數(shù)據(jù)與研究團隊,正在重新超越OpenAI,并帶動市占與用戶活躍度快速提升。在Google與OpenAI的雙雄之爭中,辛頓押谷歌會贏。
「我猜,谷歌一定會贏」!
剛剛,辛頓發(fā)話:
Google已經(jīng)開始超越OpenAI了。
![]()
「AI教父」辛頓(Geoffrey Hinton)
超越就算了,他還說了一句更讓OpenAI扎心的話:
我覺得更讓人意外的是,Google居然花了這么久才超越OpenAI。
3年前,ChatGPT的發(fā)布讓Google內(nèi)部拉響了「紅色警報」。
如今,拉響警報的變成了OpenAI。
Google剛發(fā)布的Gemini 3版本獲得業(yè)內(nèi)廣泛認可,有業(yè)內(nèi)人士認為其表現(xiàn)已經(jīng)超過OpenAI的GPT-5。
Nano Banana Pro圖像模型也非常受歡迎。
除了這些模型和產(chǎn)品之外,在辛頓看來,自研芯片也是Google的一個非常大的優(yōu)勢。
此外,辛頓還提到Google擁有很多非常優(yōu)秀的研究人員,以及大量數(shù)據(jù)和龐大的數(shù)據(jù)中心。
這些綜合優(yōu)勢,讓辛頓認為Google會超越OpenAI并贏得最終勝利。
從市場反應(yīng)來看,Gemini 3、Nano Banana Pro等模型的發(fā)布,AI與現(xiàn)有搜索產(chǎn)品的整合,以及TPU與Meta達成價值十億美元的訂單,這些綜合優(yōu)勢推動了谷歌母公司市值逼近4萬億美元大關(guān)。
Hinton在Google Brain任職期間幫助推動了早期的AI研究。
他提到,Google曾長期引領(lǐng)AI,但后來變得有所顧慮。
Google發(fā)明了Transformer,也比其他公司更早擁有自己的大型聊天機器人。
![]()
辛頓表示,當微軟2016年發(fā)布的「Tay」因發(fā)表極具種族歧視的推文而迅速下線后,Google開始變得格外謹慎。
Google一直有很好的品牌聲譽,他們擔心類似的事情如果發(fā)生會把名聲毀了。
此前,Google CEO Sundar Pichai也曾表示,公司之所以沒有更早推出聊天機器人,是因為當時的產(chǎn)品成熟度還不夠。
以往,Google也曾經(jīng)歷一些不太順利的產(chǎn)品發(fā)布。
就在去年,Google因用戶抱怨其AI圖像生成器產(chǎn)出的部分歷史人物膚色錯誤、顯得過度政治正確,而不得不中止該功能。
其最初的AI搜索摘要,也曾給出荒唐建議,例如為了防止披薩上的芝士掉下來,可以在披薩上抹膠水。
Gemini 3 Pro視覺推理封神
在Google的官方介紹中,將Gemini 3 Pro稱為「我們迄今為止最強大的多模態(tài)模型」。
![]()
Google在介紹Gemini 3 Pro時,提到了一個重要的改變:
從「看見」,邁向了「理解」。
Gemini 3 Pro在文檔、空間、屏幕和視頻理解方面都實現(xiàn)了驚人的表現(xiàn),實現(xiàn)了從簡單識別邁向真正視覺與空間推理的跨代提升。
Gemini 3 Pro在MMMU Pro和Video MMMU等復(fù)雜視覺推理基準上刷新紀錄,并在文檔、空間、界面以及長視頻理解等特定任務(wù)的測試中取得卓越成績。
文檔理解
現(xiàn)實世界的文檔往往混亂、缺乏結(jié)構(gòu)、難以解析,通常包含交錯的圖像、難辨認的手寫字、嵌套表格、復(fù)雜數(shù)學(xué)符號和非線性布局。
Gemini 3 Pro在文檔處理能力上實現(xiàn)重大突破,從精準OCR到復(fù)雜視覺推理,都有顯著提升。
它不僅看懂「是什么」,還能看懂「為什么」和「怎么關(guān)聯(lián)」。
谷歌的一個核心能力叫「反渲染」(derendering):能將文檔畫面還原為結(jié)構(gòu)化代碼(HTML、LaTeX、Markdown)。
例如,它能把18世紀商人日志轉(zhuǎn)換成復(fù)雜表格,也能將帶有數(shù)學(xué)標注的圖像精準恢復(fù)為LaTeX。
![]()
18世紀奧爾巴尼商人手冊中的手寫復(fù)雜表格
要真正理解一份文檔,模型需要準確識別文本、表格、數(shù)學(xué)公式、圖形和圖表,無論存在噪點還是格式混亂。
除了智能感知,還要具備高級推理能力。
Gemini 3能在長文檔中執(zhí)行跨表格與圖表的多步復(fù)雜推理。
在CharXiv基準中,它甚至以80.5%的成績超過了人類基線。
舉例來說,用戶分析美國人口普查局62頁的《Income in the United States: 2022》報告時提出以下提示詞:
「比較2021–2022年貨幣收入與稅后收入的基尼指數(shù)變化百分比;并解釋是什么導(dǎo)致了稅后收入指標的偏離。另外,就貨幣收入而言,最低收入五分位的份額是上升還是下降?」
下方圖片展示了模型的逐步推理。
![]()
空間理解
空間理解,是讓模型真正開始理解「物理世界」。
Gemini 3 Pro可結(jié)合其推理能力更好地理解物理世界。
其中一項關(guān)鍵能力是指向坐標,即通過輸出像素級坐標,模型可精確指向圖像中的某個位置。
比如,可以估計人體姿態(tài)或分析動作軌跡。
多個二維點串聯(lián)起來,就能執(zhí)行較復(fù)雜任務(wù),這是2D圖像邁向「世界模型」的關(guān)鍵一步。
此外,還有開放詞匯指代,即模型能用開放詞匯識別物體及其意圖。
例如在機器人領(lǐng)域,用戶說桌子很亂,幫我設(shè)計一個垃圾分類的整理步驟。
模型不僅可以看到「物體」,還知道什么是垃圾,哪些要分類,應(yīng)該如何整理它們。
這一能力也延伸至AR/XR設(shè)備,用戶可請求AI助手「根據(jù)用戶手冊指出螺絲的位置。」
![]()
![]()
![]()
左右滑動查看
屏幕理解
Gemini 3.0 Pro的空間能力在理解桌面與移動設(shè)備界面時表現(xiàn)尤為突出,讓計算機使用型智能體更加可靠,可自動化許多重復(fù)任務(wù)。
屏幕理解還能支持QA測試、用戶上手指導(dǎo)及UX分析。
視頻理解
視頻是最復(fù)雜的數(shù)據(jù)形式:信息密集、變化快速、多模態(tài)且背景豐富。Gemini 3 Pro在視頻理解上邁出巨大一步。
其中一個核心能力是高幀率理解,經(jīng)優(yōu)化后,模型在高于1 FPS的取樣下能更好地理解物體的快速運動。
例如以10 FPS處理視頻,Gemini 3 Pro可以捕捉每一次揮桿動作和重心轉(zhuǎn)移,從而支持深入的運動機理分析。
此外,「思考模式」下的視頻推理,能夠讓模型跟蹤復(fù)雜的因果關(guān)系。
不僅能「看到發(fā)生了什么」,還能理解「為什么發(fā)生」。
甚至能把長視頻總結(jié)成可執(zhí)行的應(yīng)用程序。
視頻不再是內(nèi)容,而是知識源。
文檔理解,讓AI不僅可以識別字,更能理解內(nèi)容;
空間理解,讓AI可以理解三維世界;
屏幕理解,讓AI可以看懂手機電腦屏幕正在發(fā)生什么;
視頻理解,讓AI看懂視頻里的動作、原因和邏輯。
Gemini 3 Pro讓AI第一次像一個「真正能看懂世界的人」一樣工作。
如果說GPT-4開啟了「語言智能」時代,那么Gemini 3 Pro正在開啟一個視覺與行動智能時代。
AI不再只會說話,而是開始理解世界。
ChatGPT增速放緩,Gemini快速追趕
在互聯(lián)網(wǎng)和AI行業(yè),同樣遵循「飛輪效應(yīng)」的經(jīng)典模型,而用戶始終居于「飛輪效應(yīng)」的核心位置。
谷歌正是靠著這個原則,才筑起了搜索帝國。
每一次搜索、每一次點擊,都會反哺它的反饋循環(huán):用戶行為改進排序系統(tǒng),排序系統(tǒng)讓結(jié)果更好,結(jié)果更好又吸引更多用戶。
時間一長,飛輪形成的正向循環(huán)就形成了難以攻破的護城河。
根據(jù)市場情報公司Sensor Tower的最新數(shù)據(jù),ChatGPT的增長勢頭正在趨緩。
盡管它仍穩(wěn)居行業(yè)第一,在移動端全球下載量中占50%,在全球月活用戶中占55%,但Gemini正在快速追趕,在下載增速、月活增速以及用戶使用時長增速方面全面超越ChatGPT。
從趨勢上看,在用戶數(shù)量和活躍度等方面,Gemini正在縮小與ChatGPT的差距。
截至2025年11月,ChatGPT的全球月活同比增長180%,而Gemini同比增長170%。
![]()
新數(shù)據(jù)顯示,ChatGPT的月活在8月到11月之間僅增長約6%,達到約8.1億。
Sensor Tower表示,這可能意味著ChatGPT正逐漸接近市場飽和。
相比之下,Gemini的全球月活在同期躍升約30%,主要受其新圖像生成模型Nano Banana推出后帶來的用戶激增影響。
報告還指出,在美國Android用戶中,通過系統(tǒng)內(nèi)置Gemini使用服務(wù)的人數(shù),是使用獨立Gemini應(yīng)用的兩倍。
這可能讓Google在全球市場形成優(yōu)勢,因為Android占據(jù)主導(dǎo)地位,意味著Gemini不再受限于移動App或網(wǎng)頁端使用。
在與ChatGPT、Copilot、Claude、Perplexity和Grok等應(yīng)用的對比中,Gemini在整個市場的月活份額也在提升。
該機構(gòu)估算,過去七個月(5月至11月),Gemini的全球月活市占率提升了3個百分點。
相比之下,ChatGPT的全球月活市占率在過去四個月(8至11月)下降了3個百分點。
來自Perplexity和Claude等競品的壓力也愈發(fā)明顯。
![]()
這兩款產(chǎn)品在2025年均迎來三位數(shù)增長:Perplexity同比上漲370%,Claude同比上漲190%。
ChatGPT截至11月的全球下載量同比增長85%,但仍落后于AI應(yīng)用整體110%的平均增長速度。
其中,Perplexity與Gemini的下載量增速最高,分別達到215%和190%的同比增長。
此外,Sensor Tower表示,Gemini用戶的日均使用時長在過去幾個月翻倍增長。
截至11月,Gemini用戶日均使用時長達到11分鐘,比3月增長120%,很可能是受9月上線的圖像生成模型Nano Banana的帶動。
同期ChatGPT用戶的日均使用時長僅增長6%,且與7月相比,11月的使用時長下降了10%。
雖然目前的數(shù)據(jù)表明Google正在逼近市場領(lǐng)頭羊,但其近期的大部分增長主要來自Nano Banana的成功。
OpenAI還有勝算嗎?
龐大的用戶基數(shù),以及對用戶心智的占領(lǐng),一直是OpenAI強大的護城河,也是它領(lǐng)先其他競爭對手的重要資本。
因此,OpenAI能否在與谷歌的競爭中取勝,一個重要的指標就是看能否守住用戶基數(shù)上的優(yōu)勢。
前段時間,OpenAI把攤子鋪得有點太大,勢必會放緩在模型產(chǎn)品上的迭代速度。
當面對Gemini 3、Claude Opus 4.5等模型在benchmark(基準測試)中突出表現(xiàn)時,必然會造成OpenAI用戶的流失。
用戶在選擇大模型時,更多是看模型的性能和體驗,而不是考慮用戶忠誠度。
前段時間,Salesforce CEO馬克·貝尼奧夫曾表示,在上手了Gemini 3兩小時后,立刻就拋棄了用了近三年的ChatGPT。
![]()
這才是真正讓奧特曼擔心的地方。
就在前幾天,奧特曼在致員工的備忘錄中發(fā)出「紅色警報」,稱要把精力拉回到提升ChatGPT上,其他優(yōu)先級不高的項目暫時往后放。
現(xiàn)在,每周有接近十億的人在使用ChatGPT,龐大的用戶規(guī)模使得OpenAI擁有了一個前所未有的窗口,去洞察人類的意圖、好奇心和決策方式。
每個提示詞、每段對話,都能被喂回模型訓(xùn)練、評估和強化學(xué)習(xí),進一步強化這個可能是全球最強的AI反饋循環(huán)。
而奧特曼的「紅色警報」核心,就是要保護這個優(yōu)勢。
如果ChatGPT變得更好用,人們用它的頻率就會更高,使用越多循環(huán)越強,循環(huán)越強產(chǎn)品又會變得更好——一個不斷自我加速的飛輪效應(yīng)。
這也是OpenAI抵御谷歌進攻的強大堡壘。
如今,Gemini 3已經(jīng)吸引了一波用戶,OpenAI強大的堡壘已經(jīng)有了一些松動的跡象。
在這個節(jié)骨眼上,如果ChatGPT的質(zhì)量有波動,或者界面變得雜亂,用戶跳去谷歌就更容易了。
此前,就不斷有用戶對OpenAI在其產(chǎn)品中推送商品信息的行為表示反感。
![]()
因此,就在外部緊盯OpenAI財務(wù)狀況的時候,奧特曼仍然決定先穩(wěn)定自己的用戶飛輪,把上線廣告和賺錢的事情先放一放。
目前,OpenAI把希望押在新模型的發(fā)布上,以推動ChatGPT再次加速增長。
但AI的投入成本極高,OpenAI已經(jīng)承諾要投入數(shù)千億美元來建設(shè)基礎(chǔ)設(shè)施,把ChatGPT推向真正的全球規(guī)模。
因此,商業(yè)化的事情也不能一直拖著。
先通過聚焦ChatGPT穩(wěn)住用戶的基本盤,然后再探索廣告商業(yè)化機會,正是奧特曼在強敵壓境之下的重要考量。
如今,相比較OpenAI,Google在模型上已經(jīng)趕上,在芯片、產(chǎn)品矩陣、商業(yè)化能力等方面不斷鞏固優(yōu)勢。
奧特曼是否能有機會讓Google再次拉響「紅色警報」,可能要看新模型「Garlic」推出后的市場反應(yīng)了。
參考資料:
https://www.businessinsider.com/ai-godfather-geoffrey-hinton-google-overtaking-openai-2025-12
https://blog.google/technology/developers/gemini-3-pro-vision/
秒追ASI
?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.