責(zé)編 | 王啟隆
出品丨AI 科技大本營(yíng)(ID:rgznai100)
谷歌這幾天連發(fā)產(chǎn)品,Gemini 3 余溫還未消退,立刻就把 Nano Banana Pro 這一大殺器祭了出來(lái),而 OpenAI 則是反常的沒(méi)有太多動(dòng)作。
前幾天 Google DeepMind CEO Demis Hassabis 和 Gemini 團(tuán)隊(duì)副總裁 Josh Woodward 進(jìn)行了一場(chǎng)深度對(duì)話(huà),聊到了 Gemini 3 的很多細(xì)節(jié)內(nèi)容。
![]()
具體來(lái)說(shuō),谷歌這次不僅要在模型層面給大家“炫技”,還同時(shí)把重點(diǎn)放在了一個(gè)更枯燥、但對(duì)商業(yè)世界更致命的詞上:效率。
在 AI 領(lǐng)域,有一個(gè)公開(kāi)的秘密:模型越聰明,推理成本就越高。這也是為什么很多所謂的“殺手級(jí)應(yīng)用”至今還停留在 PPT 階段,因?yàn)槟銦黄鹉莻€(gè)錢(qián)。
谷歌這次干了一件很“谷歌”的事。他們通過(guò)極致的“蒸餾技術(shù)”(Distillation),硬生生把頂尖模型的運(yùn)行成本壓到了地板上。當(dāng)你能在數(shù)十億次日均搜索請(qǐng)求中調(diào)用 Gemini 3 而不破產(chǎn)時(shí),這游戲規(guī)則就變了。
Demis 在訪(fǎng)談里提到了一個(gè)很有意思的觀點(diǎn):他們?cè)诔杀九c性能的帕累托前沿(Pareto frontier)上保持領(lǐng)先。
這話(huà)翻譯成人話(huà)就是:比我聰明的沒(méi)我便宜,比我便宜的沒(méi)我聰明。
另一個(gè)很有意思的變化,是模型“人設(shè)”的調(diào)整。
過(guò)去幾年,我們見(jiàn)過(guò)太多試圖扮演“知心姐姐”的 AI 了。你問(wèn)它一個(gè)代碼問(wèn)題,它先夸你思路清奇,再給你熬一碗雞湯,最后才吞吞吐吐地給出答案。
Gemini 3 似乎正在戒掉這種“討好型人格”。
![]()
Josh Woodward 提到,新模型變得更“簡(jiǎn)潔、切中要點(diǎn)”。這甚至被認(rèn)為非常適合那些“頭腦封閉”的用戶(hù)。我覺(jué)得這才是工具該有的樣子。當(dāng)我想修水管的時(shí)候,我不需要扳手跟我談?wù)撊松芾恚抑恍枰軘Q緊螺絲。
這種“去人格化”其實(shí)是另一種形式的“極客化”。它不再試圖模仿人類(lèi)的情感交互,而是專(zhuān)注于成為一個(gè)極其高效的信息處理器和邏輯推理機(jī)。比如 Demis 提到現(xiàn)在的“氛圍編程”(vibe coding),聽(tīng)起來(lái)很玄乎,其實(shí)就是讓 AI 真正理解程序員當(dāng)下的語(yǔ)境,而不是傻乎乎地補(bǔ)全代碼。
而關(guān)于那個(gè)終極問(wèn)題——AGI(通用人工智能)到底什么時(shí)候來(lái)?
Demis 的回答很誠(chéng)實(shí),也很克制:5 到 10 年。
在這個(gè)人人都在喊“明年就實(shí)現(xiàn) AGI”的浮躁當(dāng)下,這個(gè)時(shí)間表聽(tīng)起來(lái)甚至有點(diǎn)保守。但他指出的路徑非常清晰:僅僅靠堆算力、堆數(shù)據(jù)(Scaling Laws)可能不夠了,我們需要一兩個(gè)本質(zhì)上的研究突破。
他在訪(fǎng)談中特別提到了推理(Reasoning)、記憶(Memory)以及世界模型(World Models)。這三個(gè)詞,基本上圈定了下一階段 AI 戰(zhàn)爭(zhēng)的主戰(zhàn)場(chǎng)。現(xiàn)在的模型大多還是“概率鸚鵡”,它們并不真正理解物理世界的因果律。只有當(dāng) AI 建立起對(duì)這個(gè)世界的內(nèi)在模型,知道“杯子掉在地上會(huì)碎”不僅僅是文本里的統(tǒng)計(jì)規(guī)律,而是一個(gè)物理事實(shí)時(shí),我們才算真正摸到了 AGI 的門(mén)檻。
今年年末的這一輪發(fā)布,或許標(biāo)志著谷歌在 AI 戰(zhàn)場(chǎng)上,終于結(jié)束了漫長(zhǎng)的“防御姿態(tài)”,開(kāi)始真正揮拳反擊。
以下為對(duì)話(huà)內(nèi)容:
主持人:Demis,Josh,歡迎來(lái)到 Hard Fork 節(jié)目。
Demis Hassabis:很高興來(lái)到這里。
主持人:兩年前,桑達(dá)爾·皮查伊跟我們打比方說(shuō),Bard 就像一輛經(jīng)過(guò)改裝的本田思域,正在跟一堆超跑賽車(chē)。那 Gemini 3 算是什么車(chē)?
Josh Woodward:這個(gè)問(wèn)題刁鉆。Demis,你要不來(lái)接這招?
Demis Hassabis:我敢打賭它肯定比本田思域快。其實(shí)我不太用汽車(chē)來(lái)打比方,也許它算是一輛那種超酷的直線(xiàn)加速 Top Fuel 賽車(chē)吧。
主持人:好吧。現(xiàn)在大家對(duì)這個(gè)模型都很興奮。我們聽(tīng)到一些早期測(cè)試者的反饋,顯然你們也展示了很多令人印象深刻的基準(zhǔn)測(cè)試數(shù)據(jù)。那么具體來(lái)說(shuō),Gemini 3 能做到哪些以前的 AI 模型做不到的事?
Josh Woodward:我先來(lái)吧。有幾點(diǎn)特別突出。
第一,我們開(kāi)始看到這個(gè)模型在推理能力上表現(xiàn)出色,能夠同時(shí)思考多個(gè)步驟。以前的模型有時(shí)候聊著聊著就思緒斷片了,或者跑偏了,這一個(gè)就好得多。第二點(diǎn)就是各種全新的生成式界面。這是我們?cè)趧?chuàng)建新型交互界面方面最強(qiáng)的模型,它能真正給用戶(hù)提供定制化的設(shè)計(jì)和答案。第三點(diǎn)我覺(jué)得是編程,我們?cè)诰幊瘫旧硗度肓司薮缶ΑD銜?huì)看到很多編程示例,包括像 Google Anti-Gravity 這樣即將推出的新產(chǎn)品展示。
主持人:有種觀點(diǎn)認(rèn)為,對(duì)于普通用戶(hù)來(lái)說(shuō),聊天這個(gè)場(chǎng)景已經(jīng)“解決”得差不多了。也就是說(shuō),普通用戶(hù)用 Gemini 這樣的產(chǎn)品,幾乎想不出什么問(wèn)題能問(wèn)出比上一代模型有質(zhì)的飛躍的答案。對(duì)于 Gemini 3,你們覺(jué)得這種說(shuō)法站得住腳嗎?普通人真的能感覺(jué)到差別嗎?
Josh Woodward:我們?cè)跍y(cè)試中看到的一點(diǎn)是——Demis 你也可以補(bǔ)充——這個(gè)模型更簡(jiǎn)潔、更有表現(xiàn)力。它開(kāi)始用一種更容易理解的方式呈現(xiàn)信息,我覺(jué)得這對(duì)大多數(shù)人來(lái)說(shuō)是立竿見(jiàn)影的體驗(yàn)提升。然后更有趣的是這些模型開(kāi)始與其他類(lèi)型的信息進(jìn)行交互。
我們經(jīng)常談?wù)搶W(xué)生如何用它學(xué)習(xí),或者在獲得你許可的情況下,它如何連接你其他谷歌產(chǎn)品中的數(shù)據(jù)。這些方式表明它正在超越傳統(tǒng)的文本問(wèn)答交互。
Demis Hassabis:對(duì),我想補(bǔ)充的是,你會(huì)發(fā)現(xiàn)它在通用事物的可靠性上高得驚人。而且我們?cè)谒^的“人設(shè)”(我們內(nèi)部叫 persona),也就是它的風(fēng)格上下了很大功夫。我覺(jué)得它更簡(jiǎn)練,更切中要害,很有幫助。它的風(fēng)格更好了,跟它頭腦風(fēng)暴或者使用它的時(shí)候,感覺(jué)更讓人愉悅。另外,我覺(jué)得在某些方面它實(shí)現(xiàn)了某種階梯式的跨越,比如“氛圍編程”。最近我重拾了游戲編程的愛(ài)好,我打算圣誕假期給自己定幾個(gè)小項(xiàng)目,因?yàn)槲矣X(jué)得它在前端開(kāi)發(fā)之類(lèi)的任務(wù)上已經(jīng)達(dá)到了極其有用、極其能干的程度,這可能是以前的版本不太擅長(zhǎng)的。
主持人:Demis,上次五月份你來(lái)節(jié)目的時(shí)候說(shuō),你認(rèn)為我們距離通用人工智能(AGI)還有五到十年,中間可能還需要幾次重大突破。現(xiàn)在看了 Gemini 3 的表現(xiàn),你的時(shí)間表有變化嗎?或者說(shuō)它包含了你認(rèn)為必要的那些突破嗎?
Demis Hassabis:沒(méi)有,我覺(jué)得一切都在完全按計(jì)劃進(jìn)行。我們對(duì)這一進(jìn)展非常滿(mǎn)意。這是個(gè)絕對(duì)驚艷的模型,完全符合我的預(yù)期,也延續(xù)了我們要打造 Gemini 之初設(shè)定好的軌跡——這實(shí)際上是過(guò)去幾年全行業(yè)最快的發(fā)展速度。我們會(huì)繼續(xù)保持這個(gè)軌跡。
但在那之上,我仍然認(rèn)為需要這一兩個(gè)關(guān)鍵點(diǎn),才能真正實(shí)現(xiàn)通用智能所期望的那種全面的一致性。還有在推理和記憶上的改進(jìn)。或許還需要像世界模型這樣的概念——你知道我們也在做 Simo 和 Genie 這種項(xiàng)目——它們會(huì)建立在 Gemini 之上,但在不同維度進(jìn)行擴(kuò)展。要完全解決具身智能(physical intelligence)這類(lèi)問(wèn)題,其中一些想法是必不可少的。所以我認(rèn)為兩方面都是真的:我對(duì) Gemini 3 的進(jìn)展非常滿(mǎn)意,我想大家會(huì)感到驚喜;但它也是在我們預(yù)期的進(jìn)度之內(nèi)。這意味著還要五到十年,并且可能還需要一兩項(xiàng)突破。
主持人:你提到了 Gemini 3 的風(fēng)格。最近關(guān)于 AI 伴侶以及人們與它們建立關(guān)系的討論很多。你們?nèi)绾味ㄎ?Gemini 3 的個(gè)性?你們希望用戶(hù)和它建立什么樣的關(guān)系?
Josh Woodward:我想說(shuō)在 App 里,Casey,我們團(tuán)隊(duì)真的更傾向于把它看作一個(gè)工具。它是幫你理清思路、披荊斬棘搞定日常瑣事的東西。無(wú)論是在不同類(lèi)型的問(wèn)題上協(xié)助你,還是幫你創(chuàng)作,這才是我們看到它發(fā)光發(fā)熱的地方。如果你把視野拉大,看看 Gemini 或者我們的 NotebookLM、Flow 這些項(xiàng)目,我們真的是在思考如何讓 AI 成為你工具箱里的超能力工具,不管是寫(xiě)作、研究還是做視頻。這是我們的重心。隨著時(shí)間推移,我們團(tuán)隊(duì)更感興趣的是追蹤像“我們幫你完成了多少任務(wù)”這樣的新指標(biāo)。這有點(diǎn)像最早期的谷歌搜索:你來(lái)了,找到答案或者跳到網(wǎng)頁(yè),然后繼續(xù)你的生活。
主持人:在 Gemini 3 發(fā)布前的日子里,你們的一些競(jìng)爭(zhēng)對(duì)手表現(xiàn)得很緊張。我覺(jué)得他們也聽(tīng)到了同樣的風(fēng)聲,說(shuō)這模型相當(dāng)厲害。輿論可能正在從谷歌在 AI 領(lǐng)域苦苦追趕,轉(zhuǎn)變?yōu)楝F(xiàn)在處于領(lǐng)跑地位,或者至少是領(lǐng)導(dǎo)者之一。你們覺(jué)得谷歌現(xiàn)在在 AI 競(jìng)賽中領(lǐng)先嗎?
Demis Hassabis:聽(tīng)著,你們很清楚,這是一個(gè)極其慘烈的競(jìng)爭(zhēng)環(huán)境,可能是史上最激烈的。所以,唯一重要的事情就是你自己的進(jìn)步速度。這是我們關(guān)注的焦點(diǎn),我們對(duì)此很滿(mǎn)意。
我其實(shí)不把它看作什么“重奪領(lǐng)先”之類(lèi)的。我們一直都是這項(xiàng)研究的先驅(qū)。現(xiàn)在的關(guān)鍵是要找到節(jié)奏,確保這些研究成果能轉(zhuǎn)化到下游的所有產(chǎn)品中。我覺(jué)得我們已經(jīng)漸入佳境了。不論是作為谷歌“動(dòng)力核心”的 DeepMind,還是 Gemini App、NotebookLM 這些 AI 原生產(chǎn)品,亦或是為地圖、YouTube、安卓、搜索這些現(xiàn)有的谷歌產(chǎn)品注入 AI 動(dòng)力,甚至是以 AI 為先的視角重新構(gòu)想它們。這進(jìn)展得非常順利。我覺(jué)得我們?cè)谶@場(chǎng)進(jìn)化中才走到一半,但看到用戶(hù)對(duì)這些新功能——比如 Workspace 和 Gmail 里的功能——表現(xiàn)出的價(jià)值感和興奮感,真的很令人激動(dòng)。那里幾乎有無(wú)限的可能性。所以,我們對(duì)這些以及我們正在構(gòu)想和原型的 AI 原生產(chǎn)品都感到非常興奮。
主持人:上周我們節(jié)目請(qǐng)了一位歷史學(xué)家,他用了 AI Studio 里一個(gè)未發(fā)布的谷歌模型,結(jié)果被震撼到了,因?yàn)槟P湍苻D(zhuǎn)錄非常古老的文件,還能正確推理出——你知道的——19 世紀(jì)加拿大皮毛貿(mào)易里的食糖計(jì)量單位。你能明確告訴我們,這哥們兒用的是 Gemini 3 嗎?
Josh Woodward:這個(gè)我不確定。不過(guò)我得說(shuō),這模型在建立這類(lèi)關(guān)聯(lián)上確實(shí)神了。我不知道那位歷史學(xué)家是不是用了舊文檔的照片或者日記之類(lèi)的……
主持人:對(duì),他就是這么干的。
Josh Woodward:它確實(shí)很擅長(zhǎng)這個(gè)。像我這種字跡潦草的人,拍一張筆記照片給它,它處理起來(lái)毫不費(fèi)力,簡(jiǎn)直小菜一碟。
主持人:你剛才提到會(huì)把這個(gè)集成到搜索旁邊的 AI 模式里。這是否意味著你們找到了一種比以前更高效、更便宜的方法來(lái)運(yùn)行這個(gè)模型?
Demis Hassabis:我覺(jué)得除了模型本身的性能不斷提升外,我們做得特別好的一點(diǎn)就是模型的效率。我們開(kāi)創(chuàng)并率先使用的模型蒸餾技術(shù)以及其他許多技術(shù),現(xiàn)在都派上了用場(chǎng)。這顯然是必須的,因?yàn)槲覀冇邢瘛癆I 概覽”這樣極端的應(yīng)用場(chǎng)景,必須服務(wù)數(shù)十億用戶(hù)。當(dāng)然,我們的云客戶(hù)和企業(yè)客戶(hù)也非常看重這種成本效益。我們一直努力在成本與性能的帕累托前沿(Pareto frontier)上保持領(lǐng)先。無(wú)論你在乎性能還是在乎成本,在這個(gè)模型家族里總有一款適合你。當(dāng)然今天我們只發(fā)布了 Pro,但我們?cè)?3.0 時(shí)代還有其他系列的型號(hào)在開(kāi)發(fā)中,很快大家就會(huì)看到了。
主持人:好像每次發(fā)新模型,我們都要重新討論一遍 Scaling Laws,以及是不是開(kāi)始出現(xiàn)邊際收益遞減了。我都能猜到接下來(lái)幾天推特上那幾個(gè)賬號(hào)會(huì)說(shuō)什么。所以在他們開(kāi)噴之前,我想問(wèn)問(wèn)你們針對(duì) Gemini 3 是怎么看這個(gè)問(wèn)題的?
Demis Hassabis:我們對(duì) Gemini 3 相比 2.5 的進(jìn)步非常滿(mǎn)意。正如前面所說(shuō),這個(gè)進(jìn)步基本符合預(yù)期,完全按計(jì)劃進(jìn)行。但這并不意味著就不存在某種邊際收益遞減。人們聽(tīng)到“遞減”就覺(jué)得要么是零,要么是指數(shù)級(jí)增長(zhǎng),其實(shí)中間還有個(gè)過(guò)渡。可能它不會(huì)每個(gè)時(shí)代都指數(shù)級(jí)翻倍,但它依然是穩(wěn)賺不賠的投資,回報(bào)極高。我們正處于這個(gè)階段。正如我所說(shuō),雖然還要看后續(xù)發(fā)展,但我懷疑要通往 AGI 還需要一兩個(gè)研究突破。但在此期間,你顯然需要這種規(guī)模化的基礎(chǔ)模型,也就是我們今天正在構(gòu)建并不斷看到進(jìn)步的多模態(tài)基礎(chǔ)模型。
主持人:在你們今天展示的眾多基準(zhǔn)測(cè)試中,哪一個(gè)對(duì)普通用戶(hù)來(lái)說(shuō)最重要?
Josh Woodward:這個(gè)問(wèn)題很好。我覺(jué)得大多數(shù)人不會(huì)像我們這樣盯著基準(zhǔn)測(cè)試看,但基準(zhǔn)測(cè)試始終是一個(gè)代理指標(biāo)。比如突破 LM Arena 的 1500 分大關(guān),這很棒。但真正重要的是產(chǎn)品中的用戶(hù)滿(mǎn)意度。令人鼓舞的是,這兩者是同向發(fā)展的,互為良好的印證。所以最終我們會(huì)公布所有基準(zhǔn)測(cè)試數(shù)據(jù),我們?yōu)榇烁械阶院溃@代表了驚人的進(jìn)步,但你也必須把它轉(zhuǎn)化為有意義的產(chǎn)品體驗(yàn)。我們?cè)诿看伟l(fā)布中都試圖兼顧這兩點(diǎn)。
主持人:模型能力增強(qiáng)后,有沒(méi)有出現(xiàn)什么新的危險(xiǎn)能力或者安全隱患?
Demis Hassabis:我們?cè)诎l(fā)布這個(gè)模型上花了很長(zhǎng)時(shí)間,因?yàn)樗乔把啬P停幸恍┬履芰Α>拖衲銖幕鶞?zhǔn)測(cè)試看到的,它非常強(qiáng)悍。正如 Josh 所說(shuō),我們?cè)趦?nèi)部不僅僅盯著這些基準(zhǔn)分看,它們只是整體性能的代理指標(biāo),所以我們關(guān)注的是全方位的表現(xiàn)以及用戶(hù)的最終體驗(yàn)。我們?cè)诎踩珳y(cè)試的各個(gè)維度上投入了大量時(shí)間,與安全研究所合作,也找了外部測(cè)試人員,當(dāng)然還有大量的內(nèi)部測(cè)試。可以說(shuō),這是我們迄今為止測(cè)試得最徹底的一個(gè)模型。
主持人:你想提一下那些冒出來(lái)的“新能力”嗎?不管是安全方面的還是別的?有沒(méi)有什么讓你覺(jué)得:“好吧,我們必須得把這個(gè)送給外部研究人員好好查查”?
Demis Hassabis:怎么說(shuō)呢,我們只是在工具調(diào)用、函數(shù)調(diào)用這些事情上下了很大功夫。顯然這些對(duì)編程能力極其重要,開(kāi)發(fā)者也需要,對(duì)推理能力也很關(guān)鍵。但也正是這些能力讓它在更具風(fēng)險(xiǎn)的領(lǐng)域——比如網(wǎng)絡(luò)攻防——變得更強(qiáng)了。所以當(dāng)我們?yōu)榱撕玫挠美ヌ嵘@些維度時(shí),必須加倍小心,持續(xù)檢查各種指標(biāo),確保它們不被濫用。
主持人:我們現(xiàn)在處于 AI 泡沫中嗎?
Demis Hassabis:這個(gè)問(wèn)題的答案太非黑即白了。我個(gè)人的觀點(diǎn)是,AI 行業(yè)的某些部分可能確實(shí)有泡沫。比如有些種子輪融資,光靠幾頁(yè) PPT 什么都沒(méi)有,就能融個(gè)上百億,這看起來(lái)確實(shí)像是泡沫初現(xiàn)的跡象。
但另一方面,我們也看到了大量驚人的工作和價(jià)值。不僅僅是像 Gemini App、NotebookLM 這些新產(chǎn)品領(lǐng)域,往遠(yuǎn)了看還有機(jī)器人、游戲。我是做游戲出身的,想到這兒我就手癢。還有我們和 Isomorphic 以及 Waymo 在做的藥物研發(fā),這些都是全新的藍(lán)海領(lǐng)域。它們可能需要一段時(shí)間才能成熟為數(shù)千億規(guī)模的產(chǎn)業(yè),但我認(rèn)為其中有半打到一打的機(jī)會(huì),Alphabet 會(huì)參與其中,這讓我很興奮。
至于眼前的回報(bào),我們有“動(dòng)力核心”這部分,把 AI 推送到數(shù)十億人每天使用的產(chǎn)品中。點(diǎn)子多到簡(jiǎn)直執(zhí)行不過(guò)來(lái)。怎么重構(gòu) Workspace?怎么搞安卓、YouTube?潛力太大了,這將帶來(lái)近期的收入和直接回報(bào),同時(shí)我們?cè)谕顿Y未來(lái)。更別提云收入和 TPU 那些了,那也將是巨大的。所以不管有沒(méi)有泡沫,我對(duì) Alphabet 的處境感覺(jué)很好。我們的工作就是在兩種情況下都贏。如果沒(méi)有泡沫,大家繼續(xù)嗨,那我們抓住機(jī)會(huì);如果有泡沫,出現(xiàn)回調(diào),我覺(jué)得我們也處于最有利的位置去應(yīng)對(duì)那種局面。
主持人:如果有人問(wèn):“嘿,聽(tīng)說(shuō) Gemini 3 剛出,它到底能干啥?”你會(huì)建議聽(tīng)眾掏出手機(jī)或電腦演示什么例子?
Josh Woodward:Gemini 的圖像模型(Nano banana)依然是世界頂尖的。我會(huì)建議你就掏出手機(jī)——iPhone、安卓都行——拍張自拍,把自己放進(jìn)畫(huà)面里編輯一下。大家依然很熱衷于玩這個(gè),特有意思。然后再給他們展示 Gemini 3 的其他新功能。我們發(fā)現(xiàn)很多人就是沖著這些有趣的用例來(lái)的,然后才開(kāi)始嘗試 App 的其他部分。
原視頻鏈接:https://youtu.be/rq-2i1blAlU?si=7LtLg4_0NGbsNATU
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.