![]()
新智元報道
編輯:桃子 好困
【新智元導讀】Gemini 3 Deep Think用2.5倍的暴力性能把GPT-5.1踩在腳下,OpenAI若再不發(fā)新模型,這「推理之王」的寶座今天就正式換人了!
太勁爆了!
不過半月,谷歌DeepMind終于放出了IMO最強金牌模型——Gemini 3 Deep Think。
![]()
今年夏天,Gemini 2.5 Deep Think分別在IMO、ICPC國際大賽中,拿下了金牌的戰(zhàn)績。
這一次,谷歌為其注入了全新的血液——Gemini 3。
憑借著「并行思考」能力,Gemini 3 Deep Think可以搞定超高難度的數(shù)學、科學難題!
在基準測試中,Deep Think全面碾壓Gemini 3 Pro,尤其是在HLE上,未用工具拿下了41%高分。
同時在ARC-AGI-2上,以45.1%成績領跑全球。
![]()
下面實例中,同一個指令,讓Gemini 3 Pro和Deep Think版基于一張博物館展館屋頂?shù)牟輬D,創(chuàng)建一個精確的交互式3D場景。
顯然,后者在還原度上,與原圖幾乎是1:1復刻,并在交互上,光影變化符合物理邏輯。

今天,Gemini 3 Deep Think已在Gemini App上線,所有Ultra用戶即可體驗。
![]()
最強IMO金牌模型來了
Gemini 3 Deep Think正式開啟了「深度思考」新紀元,讓智能的邊界再次拓展。
Gemini 3 Deep Think基于上一代Gemini 2.5 Deep Think迭代而來,在推理能力上實現(xiàn)了質(zhì)的飛躍。
它專門用于攻克那些連當今最頂尖模型,都感到棘手的復雜數(shù)學、科學和邏輯難題。

在多項基準測試中,Gemini 3 Deep Think都拿下了行業(yè)領先成績。
在Humanity’s Last Exam(無工具輔助)上刷爆41%,并在ARC-AGI-2(配合代碼執(zhí)行),創(chuàng)下45.1%新紀錄。
![]()
在ARC-AGI-1和ARC-AGI-2上,Gemini 3 Deep Think實力堪稱無「模」能敵。
![]()
![]()
左右滑動查看
之所以這么強,是因為Deep Think采用了「并行推理」來同時思考,能夠同時探索多種假設。
在谷歌DeepMind放出的更多demo中,可以看出Gemini 3 Deep Think強大之處。
如下,讓它打造一款3D版多米諾骨牌游戲。在關卡設置中,Deep Think兼具創(chuàng)意與驚喜,而且還模擬出了真實的碰撞物理效果。

這個例子,是要求Gemini 3 Pro和Deep Think分別在單個HTML文件中創(chuàng)建程序化生成的地球類行星。
左右對比一眼即可看出,Deep Think更加有創(chuàng)造力。

另有開發(fā)者實測驚嘆道,Gemini 3 Deep Think具備驚人的能力。
![]()
上傳一張玻璃瓶的照片,讓它生成一個軟橡膠同款掉在地上的3D動畫。

有網(wǎng)友激動地表示,按照這個速度,我們將在2026年真正實現(xiàn)AGI!
![]()
華人科學家領銜,AGI王牌隊沖刺
同在今天,谷歌DeepMind官宣,將在新加坡組建一支全新的精英團隊。
它將由華人科學家Yi Tay率隊,專攻高級推理、LLM/RL,以及推進Gemini、Gemini Deep Think等最前沿SOTA模型的發(fā)展。
Yi Tay將向位于山景城由Quoc Le(谷歌Fellow級大佬)領導的團隊匯報。
恰好,這一團隊正是Gemini Deep Think在國際競賽中奪下金牌的核心力量之一,同時也在Gemini上取得重要進展。
![]()
Yi Tay表示,我們會從一支人不多但超強的小團隊開始。
因為在大模型的時代,「人才密度」比什么都關鍵。
關鍵是,這個團隊還能與AI領域傳奇大神聯(lián)動研究,其中就包括「推理之王」Denny Zhou、「香蕉」背后的男人Mostafa Dehghani、AI界的「GOAT」Noam Shazeer。
同時,還有很多「神仙隊友」一起加入研究,包括生成式檢索的發(fā)明人Vinh Q. Tran、IMO金牌項目總負責人Thang Luong、思維鏈開創(chuàng)者Xuezhi、日本頂尖AI大神Shane Gu等人。
過去幾個月,谷歌DeepMind便開始秘密招募全球頂尖人才。
這一項目得到了Demis Hassabis、Jeff Dean等內(nèi)部高層的大力支持。
![]()
![]()
如今,他們繼續(xù)發(fā)出英雄招募帖,有機會站上通往AGI的關鍵賽道。
用不了多久,這支新加坡團隊很快就會成為一支戰(zhàn)斗力爆表的隊伍。
![]()
Gemini 3爆沖15%流量
隨著Gemini 3 Pro的強勢發(fā)布,其網(wǎng)頁端的市占率再創(chuàng)新高,突破15%大關。
與此同時,Grok也憑借著4.1版本的發(fā)布持續(xù)增長。
ChatGPT在流量上依然斷崖式領先,但份額卻在持續(xù)下降。
![]()
![]()
Gemini延續(xù)增長勢頭,訪問量達到13.51億次,較10月增長14.3%。ChatGPT跌破60億次大關,網(wǎng)站訪問量降至58.44億次。
這是繼7月之后,ChatGPT 在 2025 年出現(xiàn)的第二次環(huán)比下滑。
![]()
盡管在11月18日(Cloudflare宕機當天),ChatGPT創(chuàng)下了單日2.33億次訪問的歷史紀錄,但這并未扭轉(zhuǎn)整體流量的跌勢。
此外,Grok網(wǎng)站訪問量達到2.344億次,創(chuàng)下歷史新高,較10月增長14.7%。
這也是該網(wǎng)站自啟用當前域名以來,首次實現(xiàn)連續(xù)兩個月的流量增長。
![]()
![]()
![]()
左右滑動查看
參考資料:
https://x.com/GoogleDeepMind/status/1996658401233842624?s=20
https://x.com/YiTayML/status/1996640869584445882?s=20
https://x.com/Similarweb/status/1995792272785310186
秒追ASI
?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.