網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

還是谷歌懂程序員？Demis 采訪(fǎng)首提“氛圍編程”，Gemini 3 徹底戒掉“爹味”說(shuō)教

2025-11-21 18:51:45　來(lái)源: AI科技大本營(yíng)

北京舉報(bào)

分享至

責(zé)編 | 王啟隆

出品丨AI 科技大本營(yíng)（ID：rgznai100）

谷歌這幾天連發(fā)產(chǎn)品，Gemini 3 余溫還未消退，立刻就把 Nano Banana Pro 這一大殺器祭了出來(lái)，而 OpenAI 則是反常的沒(méi)有太多動(dòng)作。

前幾天 Google DeepMind CEO Demis Hassabis 和 Gemini 團(tuán)隊(duì)副總裁 Josh Woodward 進(jìn)行了一場(chǎng)深度對(duì)話(huà)，聊到了 Gemini 3 的很多細(xì)節(jié)內(nèi)容。

具體來(lái)說(shuō)，谷歌這次不僅要在模型層面給大家“炫技”，還同時(shí)把重點(diǎn)放在了一個(gè)更枯燥、但對(duì)商業(yè)世界更致命的詞上：效率。

在 AI 領(lǐng)域，有一個(gè)公開(kāi)的秘密：模型越聰明，推理成本就越高。這也是為什么很多所謂的“殺手級(jí)應(yīng)用”至今還停留在 PPT 階段，因?yàn)槟銦黄鹉莻€(gè)錢(qián)。

谷歌這次干了一件很“谷歌”的事。他們通過(guò)極致的“蒸餾技術(shù)”（Distillation），硬生生把頂尖模型的運(yùn)行成本壓到了地板上。當(dāng)你能在數(shù)十億次日均搜索請(qǐng)求中調(diào)用 Gemini 3 而不破產(chǎn)時(shí)，這游戲規(guī)則就變了。

Demis 在訪(fǎng)談里提到了一個(gè)很有意思的觀點(diǎn)：他們?cè)诔杀九c性能的帕累托前沿（Pareto frontier）上保持領(lǐng)先。

這話(huà)翻譯成人話(huà)就是：比我聰明的沒(méi)我便宜，比我便宜的沒(méi)我聰明。

另一個(gè)很有意思的變化，是模型“人設(shè)”的調(diào)整。

過(guò)去幾年，我們見(jiàn)過(guò)太多試圖扮演“知心姐姐”的 AI 了。你問(wèn)它一個(gè)代碼問(wèn)題，它先夸你思路清奇，再給你熬一碗雞湯，最后才吞吞吐吐地給出答案。

Gemini 3 似乎正在戒掉這種“討好型人格”。

Josh Woodward 提到，新模型變得更“簡(jiǎn)潔、切中要點(diǎn)”。這甚至被認(rèn)為非常適合那些“頭腦封閉”的用戶(hù)。我覺(jué)得這才是工具該有的樣子。當(dāng)我想修水管的時(shí)候，我不需要扳手跟我談?wù)撊松芾恚抑恍枰軘Q緊螺絲。

這種“去人格化”其實(shí)是另一種形式的“極客化”。它不再試圖模仿人類(lèi)的情感交互，而是專(zhuān)注于成為一個(gè)極其高效的信息處理器和邏輯推理機(jī)。比如 Demis 提到現(xiàn)在的“氛圍編程”（vibe coding），聽(tīng)起來(lái)很玄乎，其實(shí)就是讓 AI 真正理解程序員當(dāng)下的語(yǔ)境，而不是傻乎乎地補(bǔ)全代碼。

而關(guān)于那個(gè)終極問(wèn)題——AGI（通用人工智能）到底什么時(shí)候來(lái)？

Demis 的回答很誠(chéng)實(shí)，也很克制：5 到 10 年。

在這個(gè)人人都在喊“明年就實(shí)現(xiàn) AGI”的浮躁當(dāng)下，這個(gè)時(shí)間表聽(tīng)起來(lái)甚至有點(diǎn)保守。但他指出的路徑非常清晰：僅僅靠堆算力、堆數(shù)據(jù)（Scaling Laws）可能不夠了，我們需要一兩個(gè)本質(zhì)上的研究突破。

他在訪(fǎng)談中特別提到了推理（Reasoning）、記憶（Memory）以及世界模型（World Models）。這三個(gè)詞，基本上圈定了下一階段 AI 戰(zhàn)爭(zhēng)的主戰(zhàn)場(chǎng)。現(xiàn)在的模型大多還是“概率鸚鵡”，它們并不真正理解物理世界的因果律。只有當(dāng) AI 建立起對(duì)這個(gè)世界的內(nèi)在模型，知道“杯子掉在地上會(huì)碎”不僅僅是文本里的統(tǒng)計(jì)規(guī)律，而是一個(gè)物理事實(shí)時(shí)，我們才算真正摸到了 AGI 的門(mén)檻。

今年年末的這一輪發(fā)布，或許標(biāo)志著谷歌在 AI 戰(zhàn)場(chǎng)上，終于結(jié)束了漫長(zhǎng)的“防御姿態(tài)”，開(kāi)始真正揮拳反擊。

以下為對(duì)話(huà)內(nèi)容：

主持人：Demis，Josh，歡迎來(lái)到 Hard Fork 節(jié)目。

Demis Hassabis：很高興來(lái)到這里。

主持人：兩年前，桑達(dá)爾·皮查伊跟我們打比方說(shuō)，Bard 就像一輛經(jīng)過(guò)改裝的本田思域，正在跟一堆超跑賽車(chē)。那 Gemini 3 算是什么車(chē)？

Josh Woodward：這個(gè)問(wèn)題刁鉆。Demis，你要不來(lái)接這招？

Demis Hassabis：我敢打賭它肯定比本田思域快。其實(shí)我不太用汽車(chē)來(lái)打比方，也許它算是一輛那種超酷的直線(xiàn)加速 Top Fuel 賽車(chē)吧。

主持人：好吧。現(xiàn)在大家對(duì)這個(gè)模型都很興奮。我們聽(tīng)到一些早期測(cè)試者的反饋，顯然你們也展示了很多令人印象深刻的基準(zhǔn)測(cè)試數(shù)據(jù)。那么具體來(lái)說(shuō)，Gemini 3 能做到哪些以前的 AI 模型做不到的事？

Josh Woodward：我先來(lái)吧。有幾點(diǎn)特別突出。

第一，我們開(kāi)始看到這個(gè)模型在推理能力上表現(xiàn)出色，能夠同時(shí)思考多個(gè)步驟。以前的模型有時(shí)候聊著聊著就思緒斷片了，或者跑偏了，這一個(gè)就好得多。第二點(diǎn)就是各種全新的生成式界面。這是我們?cè)趧?chuàng)建新型交互界面方面最強(qiáng)的模型，它能真正給用戶(hù)提供定制化的設(shè)計(jì)和答案。第三點(diǎn)我覺(jué)得是編程，我們?cè)诰幊瘫旧硗度肓司薮缶ΑＤ銜?huì)看到很多編程示例，包括像 Google Anti-Gravity 這樣即將推出的新產(chǎn)品展示。

主持人：有種觀點(diǎn)認(rèn)為，對(duì)于普通用戶(hù)來(lái)說(shuō)，聊天這個(gè)場(chǎng)景已經(jīng)“解決”得差不多了。也就是說(shuō)，普通用戶(hù)用 Gemini 這樣的產(chǎn)品，幾乎想不出什么問(wèn)題能問(wèn)出比上一代模型有質(zhì)的飛躍的答案。對(duì)于 Gemini 3，你們覺(jué)得這種說(shuō)法站得住腳嗎？普通人真的能感覺(jué)到差別嗎？

Josh Woodward：我們?cè)跍y(cè)試中看到的一點(diǎn)是——Demis 你也可以補(bǔ)充——這個(gè)模型更簡(jiǎn)潔、更有表現(xiàn)力。它開(kāi)始用一種更容易理解的方式呈現(xiàn)信息，我覺(jué)得這對(duì)大多數(shù)人來(lái)說(shuō)是立竿見(jiàn)影的體驗(yàn)提升。然后更有趣的是這些模型開(kāi)始與其他類(lèi)型的信息進(jìn)行交互。

我們經(jīng)常談?wù)搶W(xué)生如何用它學(xué)習(xí)，或者在獲得你許可的情況下，它如何連接你其他谷歌產(chǎn)品中的數(shù)據(jù)。這些方式表明它正在超越傳統(tǒng)的文本問(wèn)答交互。

Demis Hassabis：對(duì)，我想補(bǔ)充的是，你會(huì)發(fā)現(xiàn)它在通用事物的可靠性上高得驚人。而且我們?cè)谒^的“人設(shè)”（我們內(nèi)部叫 persona），也就是它的風(fēng)格上下了很大功夫。我覺(jué)得它更簡(jiǎn)練，更切中要害，很有幫助。它的風(fēng)格更好了，跟它頭腦風(fēng)暴或者使用它的時(shí)候，感覺(jué)更讓人愉悅。另外，我覺(jué)得在某些方面它實(shí)現(xiàn)了某種階梯式的跨越，比如“氛圍編程”。最近我重拾了游戲編程的愛(ài)好，我打算圣誕假期給自己定幾個(gè)小項(xiàng)目，因?yàn)槲矣X(jué)得它在前端開(kāi)發(fā)之類(lèi)的任務(wù)上已經(jīng)達(dá)到了極其有用、極其能干的程度，這可能是以前的版本不太擅長(zhǎng)的。

主持人：Demis，上次五月份你來(lái)節(jié)目的時(shí)候說(shuō)，你認(rèn)為我們距離通用人工智能（AGI）還有五到十年，中間可能還需要幾次重大突破。現(xiàn)在看了 Gemini 3 的表現(xiàn)，你的時(shí)間表有變化嗎？或者說(shuō)它包含了你認(rèn)為必要的那些突破嗎？

Demis Hassabis：沒(méi)有，我覺(jué)得一切都在完全按計(jì)劃進(jìn)行。我們對(duì)這一進(jìn)展非常滿(mǎn)意。這是個(gè)絕對(duì)驚艷的模型，完全符合我的預(yù)期，也延續(xù)了我們要打造 Gemini 之初設(shè)定好的軌跡——這實(shí)際上是過(guò)去幾年全行業(yè)最快的發(fā)展速度。我們會(huì)繼續(xù)保持這個(gè)軌跡。

但在那之上，我仍然認(rèn)為需要這一兩個(gè)關(guān)鍵點(diǎn)，才能真正實(shí)現(xiàn)通用智能所期望的那種全面的一致性。還有在推理和記憶上的改進(jìn)。或許還需要像世界模型這樣的概念——你知道我們也在做 Simo 和 Genie 這種項(xiàng)目——它們會(huì)建立在 Gemini 之上，但在不同維度進(jìn)行擴(kuò)展。要完全解決具身智能（physical intelligence）這類(lèi)問(wèn)題，其中一些想法是必不可少的。所以我認(rèn)為兩方面都是真的：我對(duì) Gemini 3 的進(jìn)展非常滿(mǎn)意，我想大家會(huì)感到驚喜；但它也是在我們預(yù)期的進(jìn)度之內(nèi)。這意味著還要五到十年，并且可能還需要一兩項(xiàng)突破。

主持人：你提到了 Gemini 3 的風(fēng)格。最近關(guān)于 AI 伴侶以及人們與它們建立關(guān)系的討論很多。你們?nèi)绾味ㄎ?Gemini 3 的個(gè)性？你們希望用戶(hù)和它建立什么樣的關(guān)系？

Josh Woodward：我想說(shuō)在 App 里，Casey，我們團(tuán)隊(duì)真的更傾向于把它看作一個(gè)工具。它是幫你理清思路、披荊斬棘搞定日常瑣事的東西。無(wú)論是在不同類(lèi)型的問(wèn)題上協(xié)助你，還是幫你創(chuàng)作，這才是我們看到它發(fā)光發(fā)熱的地方。如果你把視野拉大，看看 Gemini 或者我們的 NotebookLM、Flow 這些項(xiàng)目，我們真的是在思考如何讓 AI 成為你工具箱里的超能力工具，不管是寫(xiě)作、研究還是做視頻。這是我們的重心。隨著時(shí)間推移，我們團(tuán)隊(duì)更感興趣的是追蹤像“我們幫你完成了多少任務(wù)”這樣的新指標(biāo)。這有點(diǎn)像最早期的谷歌搜索：你來(lái)了，找到答案或者跳到網(wǎng)頁(yè)，然后繼續(xù)你的生活。

主持人：在 Gemini 3 發(fā)布前的日子里，你們的一些競(jìng)爭(zhēng)對(duì)手表現(xiàn)得很緊張。我覺(jué)得他們也聽(tīng)到了同樣的風(fēng)聲，說(shuō)這模型相當(dāng)厲害。輿論可能正在從谷歌在 AI 領(lǐng)域苦苦追趕，轉(zhuǎn)變?yōu)楝F(xiàn)在處于領(lǐng)跑地位，或者至少是領(lǐng)導(dǎo)者之一。你們覺(jué)得谷歌現(xiàn)在在 AI 競(jìng)賽中領(lǐng)先嗎？

Demis Hassabis：聽(tīng)著，你們很清楚，這是一個(gè)極其慘烈的競(jìng)爭(zhēng)環(huán)境，可能是史上最激烈的。所以，唯一重要的事情就是你自己的進(jìn)步速度。這是我們關(guān)注的焦點(diǎn)，我們對(duì)此很滿(mǎn)意。

我其實(shí)不把它看作什么“重奪領(lǐng)先”之類(lèi)的。我們一直都是這項(xiàng)研究的先驅(qū)。現(xiàn)在的關(guān)鍵是要找到節(jié)奏，確保這些研究成果能轉(zhuǎn)化到下游的所有產(chǎn)品中。我覺(jué)得我們已經(jīng)漸入佳境了。不論是作為谷歌“動(dòng)力核心”的 DeepMind，還是 Gemini App、NotebookLM 這些 AI 原生產(chǎn)品，亦或是為地圖、YouTube、安卓、搜索這些現(xiàn)有的谷歌產(chǎn)品注入 AI 動(dòng)力，甚至是以 AI 為先的視角重新構(gòu)想它們。這進(jìn)展得非常順利。我覺(jué)得我們?cè)谶@場(chǎng)進(jìn)化中才走到一半，但看到用戶(hù)對(duì)這些新功能——比如 Workspace 和 Gmail 里的功能——表現(xiàn)出的價(jià)值感和興奮感，真的很令人激動(dòng)。那里幾乎有無(wú)限的可能性。所以，我們對(duì)這些以及我們正在構(gòu)想和原型的 AI 原生產(chǎn)品都感到非常興奮。

主持人：上周我們節(jié)目請(qǐng)了一位歷史學(xué)家，他用了 AI Studio 里一個(gè)未發(fā)布的谷歌模型，結(jié)果被震撼到了，因?yàn)槟Ｐ湍苻D(zhuǎn)錄非常古老的文件，還能正確推理出——你知道的——19 世紀(jì)加拿大皮毛貿(mào)易里的食糖計(jì)量單位。你能明確告訴我們，這哥們兒用的是 Gemini 3 嗎？

Josh Woodward：這個(gè)我不確定。不過(guò)我得說(shuō)，這模型在建立這類(lèi)關(guān)聯(lián)上確實(shí)神了。我不知道那位歷史學(xué)家是不是用了舊文檔的照片或者日記之類(lèi)的……

主持人：對(duì)，他就是這么干的。

Josh Woodward：它確實(shí)很擅長(zhǎng)這個(gè)。像我這種字跡潦草的人，拍一張筆記照片給它，它處理起來(lái)毫不費(fèi)力，簡(jiǎn)直小菜一碟。

主持人：你剛才提到會(huì)把這個(gè)集成到搜索旁邊的 AI 模式里。這是否意味著你們找到了一種比以前更高效、更便宜的方法來(lái)運(yùn)行這個(gè)模型？

Demis Hassabis：我覺(jué)得除了模型本身的性能不斷提升外，我們做得特別好的一點(diǎn)就是模型的效率。我們開(kāi)創(chuàng)并率先使用的模型蒸餾技術(shù)以及其他許多技術(shù)，現(xiàn)在都派上了用場(chǎng)。這顯然是必須的，因?yàn)槲覀冇邢瘛癆I 概覽”這樣極端的應(yīng)用場(chǎng)景，必須服務(wù)數(shù)十億用戶(hù)。當(dāng)然，我們的云客戶(hù)和企業(yè)客戶(hù)也非常看重這種成本效益。我們一直努力在成本與性能的帕累托前沿（Pareto frontier）上保持領(lǐng)先。無(wú)論你在乎性能還是在乎成本，在這個(gè)模型家族里總有一款適合你。當(dāng)然今天我們只發(fā)布了 Pro，但我們?cè)?3.0 時(shí)代還有其他系列的型號(hào)在開(kāi)發(fā)中，很快大家就會(huì)看到了。

主持人：好像每次發(fā)新模型，我們都要重新討論一遍 Scaling Laws，以及是不是開(kāi)始出現(xiàn)邊際收益遞減了。我都能猜到接下來(lái)幾天推特上那幾個(gè)賬號(hào)會(huì)說(shuō)什么。所以在他們開(kāi)噴之前，我想問(wèn)問(wèn)你們針對(duì) Gemini 3 是怎么看這個(gè)問(wèn)題的？

Demis Hassabis：我們對(duì) Gemini 3 相比 2.5 的進(jìn)步非常滿(mǎn)意。正如前面所說(shuō)，這個(gè)進(jìn)步基本符合預(yù)期，完全按計(jì)劃進(jìn)行。但這并不意味著就不存在某種邊際收益遞減。人們聽(tīng)到“遞減”就覺(jué)得要么是零，要么是指數(shù)級(jí)增長(zhǎng)，其實(shí)中間還有個(gè)過(guò)渡。可能它不會(huì)每個(gè)時(shí)代都指數(shù)級(jí)翻倍，但它依然是穩(wěn)賺不賠的投資，回報(bào)極高。我們正處于這個(gè)階段。正如我所說(shuō)，雖然還要看后續(xù)發(fā)展，但我懷疑要通往 AGI 還需要一兩個(gè)研究突破。但在此期間，你顯然需要這種規(guī)模化的基礎(chǔ)模型，也就是我們今天正在構(gòu)建并不斷看到進(jìn)步的多模態(tài)基礎(chǔ)模型。

主持人：在你們今天展示的眾多基準(zhǔn)測(cè)試中，哪一個(gè)對(duì)普通用戶(hù)來(lái)說(shuō)最重要？

Josh Woodward：這個(gè)問(wèn)題很好。我覺(jué)得大多數(shù)人不會(huì)像我們這樣盯著基準(zhǔn)測(cè)試看，但基準(zhǔn)測(cè)試始終是一個(gè)代理指標(biāo)。比如突破 LM Arena 的 1500 分大關(guān)，這很棒。但真正重要的是產(chǎn)品中的用戶(hù)滿(mǎn)意度。令人鼓舞的是，這兩者是同向發(fā)展的，互為良好的印證。所以最終我們會(huì)公布所有基準(zhǔn)測(cè)試數(shù)據(jù)，我們?yōu)榇烁械阶院溃@代表了驚人的進(jìn)步，但你也必須把它轉(zhuǎn)化為有意義的產(chǎn)品體驗(yàn)。我們?cè)诿看伟l(fā)布中都試圖兼顧這兩點(diǎn)。

主持人：模型能力增強(qiáng)后，有沒(méi)有出現(xiàn)什么新的危險(xiǎn)能力或者安全隱患？

Demis Hassabis：我們?cè)诎l(fā)布這個(gè)模型上花了很長(zhǎng)時(shí)間，因?yàn)樗乔把啬Ｐ停幸恍┬履芰Α＞拖衲銖幕鶞?zhǔn)測(cè)試看到的，它非常強(qiáng)悍。正如 Josh 所說(shuō)，我們?cè)趦?nèi)部不僅僅盯著這些基準(zhǔn)分看，它們只是整體性能的代理指標(biāo)，所以我們關(guān)注的是全方位的表現(xiàn)以及用戶(hù)的最終體驗(yàn)。我們?cè)诎踩珳y(cè)試的各個(gè)維度上投入了大量時(shí)間，與安全研究所合作，也找了外部測(cè)試人員，當(dāng)然還有大量的內(nèi)部測(cè)試。可以說(shuō)，這是我們迄今為止測(cè)試得最徹底的一個(gè)模型。

主持人：你想提一下那些冒出來(lái)的“新能力”嗎？不管是安全方面的還是別的？有沒(méi)有什么讓你覺(jué)得：“好吧，我們必須得把這個(gè)送給外部研究人員好好查查”？

Demis Hassabis：怎么說(shuō)呢，我們只是在工具調(diào)用、函數(shù)調(diào)用這些事情上下了很大功夫。顯然這些對(duì)編程能力極其重要，開(kāi)發(fā)者也需要，對(duì)推理能力也很關(guān)鍵。但也正是這些能力讓它在更具風(fēng)險(xiǎn)的領(lǐng)域——比如網(wǎng)絡(luò)攻防——變得更強(qiáng)了。所以當(dāng)我們?yōu)榱撕玫挠美ヌ嵘@些維度時(shí)，必須加倍小心，持續(xù)檢查各種指標(biāo)，確保它們不被濫用。

主持人：我們現(xiàn)在處于 AI 泡沫中嗎？

Demis Hassabis：這個(gè)問(wèn)題的答案太非黑即白了。我個(gè)人的觀點(diǎn)是，AI 行業(yè)的某些部分可能確實(shí)有泡沫。比如有些種子輪融資，光靠幾頁(yè) PPT 什么都沒(méi)有，就能融個(gè)上百億，這看起來(lái)確實(shí)像是泡沫初現(xiàn)的跡象。

但另一方面，我們也看到了大量驚人的工作和價(jià)值。不僅僅是像 Gemini App、NotebookLM 這些新產(chǎn)品領(lǐng)域，往遠(yuǎn)了看還有機(jī)器人、游戲。我是做游戲出身的，想到這兒我就手癢。還有我們和 Isomorphic 以及 Waymo 在做的藥物研發(fā)，這些都是全新的藍(lán)海領(lǐng)域。它們可能需要一段時(shí)間才能成熟為數(shù)千億規(guī)模的產(chǎn)業(yè)，但我認(rèn)為其中有半打到一打的機(jī)會(huì)，Alphabet 會(huì)參與其中，這讓我很興奮。

至于眼前的回報(bào)，我們有“動(dòng)力核心”這部分，把 AI 推送到數(shù)十億人每天使用的產(chǎn)品中。點(diǎn)子多到簡(jiǎn)直執(zhí)行不過(guò)來(lái)。怎么重構(gòu) Workspace？怎么搞安卓、YouTube？潛力太大了，這將帶來(lái)近期的收入和直接回報(bào)，同時(shí)我們?cè)谕顿Y未來(lái)。更別提云收入和 TPU 那些了，那也將是巨大的。所以不管有沒(méi)有泡沫，我對(duì) Alphabet 的處境感覺(jué)很好。我們的工作就是在兩種情況下都贏。如果沒(méi)有泡沫，大家繼續(xù)嗨，那我們抓住機(jī)會(huì)；如果有泡沫，出現(xiàn)回調(diào)，我覺(jué)得我們也處于最有利的位置去應(yīng)對(duì)那種局面。

主持人：如果有人問(wèn)：“嘿，聽(tīng)說(shuō) Gemini 3 剛出，它到底能干啥？”你會(huì)建議聽(tīng)眾掏出手機(jī)或電腦演示什么例子？

Josh Woodward：Gemini 的圖像模型（Nano banana）依然是世界頂尖的。我會(huì)建議你就掏出手機(jī)——iPhone、安卓都行——拍張自拍，把自己放進(jìn)畫(huà)面里編輯一下。大家依然很熱衷于玩這個(gè)，特有意思。然后再給他們展示 Gemini 3 的其他新功能。我們發(fā)現(xiàn)很多人就是沖著這些有趣的用例來(lái)的，然后才開(kāi)始嘗試 App 的其他部分。

原視頻鏈接：https://youtu.be/rq-2i1blAlU?si=7LtLg4_0NGbsNATU

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.