![]()
![]()
在模型底層原理(Transformer-Difussion-Mamba等)、智能的數(shù)學(xué)世界觀等層面,以及進(jìn)一步面向以融合感知、持續(xù)學(xué)習(xí)、內(nèi)生自主為基礎(chǔ)的認(rèn)知與行為智能等方面,存在著范式變革的需求。
本文作者系
盤(pán)古智庫(kù)學(xué)術(shù)委員、
上海財(cái)經(jīng)大學(xué)特聘教授、智能科技產(chǎn)業(yè)與智能經(jīng)濟(jì)研究學(xué)者
胡延平,
文章來(lái)源于“
胡延平研思小筆記
本文大約2100字,讀完約5分鐘。
![]()
在Yann LeCun、Richard Sutton等聲稱現(xiàn)有技術(shù)方向死路一條的時(shí)候,在多方認(rèn)為范式效率陷入停滯的時(shí)候,Gemini 3以智能水準(zhǔn)的顯著躍升打臉了懷疑論。
都知道Google動(dòng)靜不會(huì)小,只是沒(méi)想到這次憋出來(lái)的有點(diǎn)大:ARC-AGI-2、Humanity’s Last Exam、ScreenSpot-Pro等新型基準(zhǔn)測(cè)試成績(jī)數(shù)倍于GPT-5.1,提升幅度之大遠(yuǎn)超擠牙膏的OpenAI,有Google提前發(fā)布了GPT-6的即視感。AIME 2025更是得到了100%的滿分。
試用和討論過(guò)程中,提煉出Gemini 3釋放的12個(gè)信號(hào):
1.代碼、視覺(jué)理解、數(shù)學(xué)、智能體、工具利用等構(gòu)成能力內(nèi)核,智能水準(zhǔn)走向可用的交付而不是尚未閉環(huán)的生成,尤其代碼通則智能通;
2.AIME 2025(美國(guó)數(shù)學(xué)邀請(qǐng)賽)是個(gè)有點(diǎn)普通的基準(zhǔn),但測(cè)試滿分可以理解為AGI的第一個(gè)預(yù)演。AGI有沒(méi)有到來(lái),關(guān)鍵看如何定義AGI。一直認(rèn)為AGI不是只有一個(gè)時(shí)點(diǎn)、一個(gè)刻度。AGI是從多方面分無(wú)數(shù)次到來(lái)的。從知識(shí)到推理,從問(wèn)答到感知和行動(dòng),從AGI到ASI,測(cè)試機(jī)構(gòu)和業(yè)界始終在前移路標(biāo),但是如果路標(biāo)一直上調(diào)標(biāo)準(zhǔn),意味著AGI始終難以到達(dá)。
3.數(shù)據(jù)-算法-算力-能源、Transformer-LLMs-MLLMs-Agent-Tools的范式即使不顛覆,漸進(jìn)發(fā)展下去也可以逐步逼近AGI。
4.芯片-操作系統(tǒng)-瀏覽器-云平臺(tái)-大模型-智能體-軟件-Apps-開(kāi)發(fā)生態(tài)-億萬(wàn)用戶,全棧-全生態(tài)能力不僅有利于競(jìng)爭(zhēng),也有利于做出更高水準(zhǔn)的智能。
5.Gemini 3在ARC-AGI-2、Humanity’s Last Exam等更具挑戰(zhàn)的創(chuàng)新基準(zhǔn)測(cè)試中,一騎絕塵的表現(xiàn)尤其增強(qiáng)了業(yè)者的信心和希望,不僅Scaling Law繼續(xù)有效,網(wǎng)絡(luò)效應(yīng)、規(guī)模奇點(diǎn)、整體最優(yōu)等生態(tài)法則也在起作用;Scaling Law不是成效顯著衰減了,而是潛力才剛開(kāi)始釋放;缺乏足夠的低成本算力、缺少用之不盡的高質(zhì)量訓(xùn)練數(shù)據(jù)以及被電力問(wèn)題搞得焦頭爛額,至少部分原因其實(shí)不是智能范式的鍋,是大模型的creator們資源實(shí)力有限的錯(cuò)。
6.超級(jí)平臺(tái)和超級(jí)智能合體對(duì)打造強(qiáng)智能來(lái)說(shuō)是好事,但是對(duì)防止生態(tài)極化和生態(tài)依附?jīng)]有好處,頭部人工智能企業(yè)的強(qiáng)者恒強(qiáng)、贏者通吃、虹吸效應(yīng)、生態(tài)失衡等發(fā)展特征越來(lái)越明顯。打造了Transformer的Google王者歸來(lái)意味著OpenAI-Microfost聯(lián)盟(超級(jí)智能+超級(jí)平臺(tái))多了一個(gè)競(jìng)爭(zhēng)對(duì)手,但Google仍然是AI極化發(fā)展趨向的一部分,超級(jí)智能和超級(jí)平臺(tái)在Google這里天然是一體的。
7.如果說(shuō)之前2和2.5版本的Gemini只是對(duì)GPT產(chǎn)生沖擊,Gemini 3意味著Google生態(tài)實(shí)力對(duì)OpenAI的地位構(gòu)成動(dòng)搖。OpenAI真正的勁敵不是Anthropic,接下來(lái)圍繞OpenAI融資、估值、上市的一系列過(guò)程,必然跌宕起伏變化多端。此前這個(gè)勢(shì)頭從原生多模態(tài)、Veo等多個(gè)技術(shù)和產(chǎn)品節(jié)點(diǎn)已經(jīng)初現(xiàn)端倪。不過(guò)試用比較Gemini 3 Pro和GPT-5.1的Deep Research,GPT-5.1還是有肉眼可見(jiàn)的優(yōu)等生即視感。模型之間真正的比拼不在常規(guī)問(wèn)答,在Deep Think、Deep Research等“深”水區(qū)域,真實(shí)水準(zhǔn)往往在200美元左右而不是20美元左右的賬戶里使用才能夠比較出來(lái)。然而即使如此,Gemini 3還是會(huì)讓OpenAI的壓力山大,GPT-5.5、GPT-6只可能加快節(jié)奏。
8.奧特曼稱GPT-6會(huì)顯著優(yōu)于GPT-5,尤其記憶方面;不過(guò)Gemini 3力證了業(yè)界的一個(gè)基本共識(shí),比較現(xiàn)實(shí)且高ROI的智能水準(zhǔn)提升途徑,是智能體、工具、代碼等方面的生態(tài)協(xié)同,模型要么將Agent與工具等能力內(nèi)化,要么對(duì)Agent與工具調(diào)用有更好的支持,而只有更好的內(nèi)化才會(huì)有更好的支持。
9.Gemini 3主要是范式的漸進(jìn),不過(guò)也有能力的突變,否則不會(huì)多項(xiàng)基準(zhǔn)表現(xiàn)大幅度躍升。更為復(fù)雜的深度推理成為亮點(diǎn),是強(qiáng)化學(xué)習(xí)、思維鏈有新進(jìn)展?還是有創(chuàng)新的方法?有待繼續(xù)觀察。
10.使用自家TPU而非GPU訓(xùn)練和推理,Gemini可以稱之為非英偉達(dá)生態(tài)也能走出來(lái)的一個(gè)成功范例,其它非英偉達(dá)生態(tài)由此增添了一些想象力。
11.題外話,DeepSeek奇跡再次復(fù)現(xiàn)的概率不大,因?yàn)锳I生態(tài)的競(jìng)爭(zhēng)游戲不再是單點(diǎn)突破,而是整體的生態(tài)推進(jìn)能力。
12.另一個(gè)題外話,去年烏鎮(zhèn)峰會(huì)期間主持AI OS討論時(shí)我曾經(jīng)問(wèn)過(guò)一個(gè)問(wèn)題,安卓生態(tài)App向鴻蒙生態(tài)的遷移主要靠堆工程師且bug比較多,是不是可以用專門訓(xùn)練的代碼能力較強(qiáng)的AI大模型來(lái)做編譯轉(zhuǎn)換。今年烏鎮(zhèn)峰會(huì)期間再次主持的時(shí)候,沒(méi)好意思再提這個(gè)問(wèn)題。走到隨Gemini 3一起發(fā)布的Antigravity開(kāi)發(fā)平臺(tái)這一步,至少大量相對(duì)簡(jiǎn)單的長(zhǎng)尾安卓App,未來(lái)通過(guò)“標(biāo)準(zhǔn)+模型+工具+人工”,一鍵遷移到鴻蒙生態(tài)其實(shí)越來(lái)越接近可行。簡(jiǎn)而言之,鴻蒙生態(tài)化出現(xiàn)的卡頓,其實(shí)也顯示了AI能力的不足。
重復(fù)之前答媒體問(wèn)時(shí)的觀點(diǎn),LeCun等所謂死路,其實(shí)不是死路,而是要走的路,至少是其中一條路,而且是必經(jīng)的路,并且是已經(jīng)走通的路。懷疑論認(rèn)為是未來(lái)之路的路,目前還沒(méi)有究竟,目前所謂世界模型其實(shí)主要是基于視覺(jué)的空間智能或時(shí)空智能,真正的世界模型還比較遙遠(yuǎn)。倒是在模型底層原理(Transformer-Difussion-Mamba等)、智能的數(shù)學(xué)世界觀等層面,以及進(jìn)一步面向以融合感知、持續(xù)學(xué)習(xí)、內(nèi)生自主為基礎(chǔ)的認(rèn)知與行為智能等方面,存在著范式變革的需求。■
![]()
![]()
![]()
文章來(lái)源于“胡延平研思小筆記”微信公眾號(hào)
圖文編輯:張洵
責(zé)任編輯:劉菁波
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.