網易首頁 > 網易號 > 正文申請入駐

Andrej Karpathy 2小時訪談：未來十年，沒有 AGI，只有 Agent ｜附：中文版音頻

2025-10-19 21:27:35　來源: 賽博禪心

北京舉報

分享至

看了 Andrej Karpathy 的播客，信息量巨大

開篇潑冷水：
未來十年沒有 AGI，只有 Agent

這里說一下，Karpathy 是 OpenAI 早期成員，參與過 GPT 背后的技術路線，在一線干了 15 年
同時，Karpathy 也是前特斯拉 AI 總監

原始視頻在這里

同時，我制作了一份中文版音頻
使用的工具，是
（我弄了一整個周日，非常良心）

這里，我還準備了一份文字實錄，中英雙語

中英雙語，非常貼心

在 Andrej Karpathy 眼中，當前的 AI Agent，核心問題有三個：

?continual learning：你告訴它一個事，它記不住
?multimodal：真正的多模態還沒做到
?computer use：不能像人一樣操作電腦

這三個問題，每一個都得花好幾年解決

AGI 還要十年

有人說今年是 Agent 之年
Karpathy 表示：應該叫「agents 的十年」

在他的觀點里
我們未來十年沒有 AGI，只有 Agent
業界有很多 over-prediction
對于 AGI 大家都太樂觀了

Andrej Karpathy：AGI 需要十年

他舉了個例子
你現在有 Claude、有 Codex，對吧，很厲害
但你會讓它們替你干活嗎？不會

為什么？
因為它們就是不行

智能不夠、多模態不夠、記不住東西、不能操作電腦
這些問題，每一個都是硬骨頭
要花時間一個個啃

continual learning 這個事，很多人可能沒意識到有多重要

現在的 LLM，你跟它聊天
它看起來「記住」了你說的話
但那只是因為對話歷史還在 context window 里
你關掉窗口，重新開一個對話，它什么都不記得

這不是 bug，這是設計就這樣
要讓它真的「學習」新知識
不只是記住，而是真正理解并融入已有知識體系

目前沒有好辦法
你可能會想，那就擴大 context window 不就行了

問題是這治標不治本，學習不能只是把內容簡單地塞進上下文
真正的學習，是要把新知識整合到模型的參數里
這需要重新訓練，或者找到新的架構，成本高得嚇人

當前的AI，無法真正學習新知識強化學習：terrible, but everything else is worse

播客里有個特別有意思的部分

Karpathy 說：
強化學習是個糟糕的選擇

但緊接著他又說：
但其他方法更糟糕

這話聽著矛盾，但其實是對現狀最準確的描述
RL 的問題主要是數據效率太低
你想讓模型學會一個東西，得讓它試錯無數次

AlphaGo 下圍棋，self-play 了幾百萬局
才達到世界冠軍水平

這種訓練方式，放在真實世界根本不現實
你不可能讓自動駕駛撞車幾百萬次來學習
你也不可能讓醫療 AI 誤診幾百萬次來進步
所以：RL 在真實世界的應用，始終受限于數據效率

強化學習，需要海量試錯

但為什么還要用 RL？

因為supervised learning也有問題：
需要大量標注數據
而真正難的任務，根本標注不出來

比如「寫一個好的代碼」、「做一個好的決策」
什么叫「好」
人類自己都說不清楚

你讓標注員去標注什么是「好代碼」
每個人的標準都不一樣
有人覺得簡潔就是好，有人覺得性能高就是好
這種主觀性太強的任務，標注成本高得離譜
而且質量還沒保證
所以最后還是得回到 RL，讓模型自己在反饋中學
通過獎勵信號，而不是人工標注，是目前唯一可行的路

Karpathy 的判斷是：
未來會是 SL + RL 的混合
先用 supervised learning 學個大概，建立基礎能力
再用 RL 精調，在具體任務上優化

但這條路，還有很長的路要走
需要解決的技術問題一堆
比如怎么設計好的獎勵函數，怎么平衡探索和利用
每一個都不容易

未來的訓練方式：監督學習 + 強化學習人類怎么學習，AI 為什么學不會

播客里有一段特別精彩

主持人問：
人類是怎么學習的，為什么 AI 學不會

Karpathy 給了個很有意思的觀點
人類的學習，是多模態 + embodied + continual 的

什么意思？
對于一個蘋果，在人類的認識中：

? 視覺上看到紅色、圓形
? 觸覺上感受到光滑、硬度
? 味覺上嘗到甜味
? 聽覺上聽到咬下去聲音

這些信息是同時發生的，互相強化的
而且你一輩子都在學，不斷更新認知

你小時候對「蘋果」的理解
和你現在對「蘋果」的理解
肯定不一樣

正如...
小時候對「絡腮胡」的理解
和你現在對「絡腮胡」的理解
也不一樣（霧

這種持續的、多模態的學習方式，是人類智能的基礎

人的學習能力，很牛逼

但 LLM 呢？它只有文本
雖然現在有了 vision model，但那還不是真正的 multimodal
真正的 multimodal，是所有模態在同一個 latent space 里
信息是融合的，不是翻譯的

現在的做法，更像是把圖片翻譯成文本描述，再喂給 LLM
這不是真正的融合
就像你把一個視頻的每一幀都寫成文字描述
這個描述再詳細，也不等于你真的看了視頻
丟失的信息太多了

而且，LLM 不能 continual learning
你今天告訴它一個新知識，明天它就忘了
除非你重新訓練整個模型，但那成本太高

一個模型訓練一次，可能要花幾百萬美元
你不可能每次有新知識就重新訓練一遍

Karpathy 說：
這是個根本性的架構問題
當前的 transformer 架構，就不是為 continual learning 設計的

它的參數是固定的，訓練完就凍結了
要解決這個問題，可能需要新的架構
能夠動態更新參數，而不影響已有知識
這是一個很難的問題

學術界在研究，但還沒有成熟的方案

Transformer 架構不支持持續學習 model collapse：AI 不能吃自己

播客里還提到一個很有意思的概念：
model collapse

什么意思？
就是 AI 生成的數據，不能用來訓練 AI
為什么？
因為會越來越糟

人類可以從人類寫的東西里學習，對吧
你讀別人寫的書，你變聰明了
代際之間互相學習，知識不斷積累

但 AI 不行
如果你用 AI 生成的文本，再去訓練下一代 AI，模型就會越來越偏
最后輸出變得越來越單調、越來越重復

打個比喻...算了，不解釋了...

這個問題其實挺嚴重的
現在網上越來越多 AI 生成的內容
文章、代碼、圖片、視頻
如果下一代 AI 訓練的時候，把這些內容也當成「真實數據」
那就完了

模型會學到 AI 的偏見和錯誤
然后放大這些偏見和錯誤
循環往復，越來越糟

這就是為什么 AI 不能像人類那樣自我學習
人類可以互相學習、代際傳承
但 AI 必須依賴人類產生的真實數據
這是個很大的瓶頸

而且隨著 AI 生成內容越來越多
「干凈」的人類數據會越來越少
將來怎么辦？值得思考

有人提出：
可以標注 AI 生成的內容，訓練時過濾掉

但這也不容易
AI 生成的內容越來越逼真，很難區分
而且標注成本也很高

這個問題，目前還沒有好的解決方案

AI 生成內容，正在污染整個互聯網 AGI 會是什么樣：融入 2% 的 GDP 增長

很多人對 AGI 有個幻想
覺得會有個奇點，突然爆炸
某一天，AGI 出現了，然后世界完全變了

Karpathy 說：不會的

他的判斷是：
AGI 會融入過去 2.5 個世紀的 2% GDP 增長

什么意思？
過去 250 年，人類社會一直在以每年 2% 的速度增長
蒸汽機來了，2%
電力來了，2%
互聯網來了，2%

為什么？
因為技術革命不是一瞬間的
它需要時間擴散、需要基礎設施、需要人適應

蒸汽機發明了，不是第二天所有工廠都換成蒸汽動力
需要幾十年時間，建鐵路、建工廠、培訓工人

互聯網也一樣
1990 年代就有了，但真正普及到每個人手機上，用了 20 多年

windows xp，發布于 2001 年

AGI 也一樣
它會逐漸滲透到各行各業
但不會在某一天突然改變一切
先是一些簡單的任務被自動化
然后是復雜的任務
一步步來

期間會有陣痛，會有失業，會有適應期
但不會是突然的、劇烈的

Karpathy 說
他不相信「hard takeoff」

他相信的是：
AGI 會像之前所有技術革命一樣，緩慢、漸進地改變世界

這個判斷，其實挺重要的
如果 AGI 真的是這樣，那我們有時間準備
不用擔心明天醒來世界就變了
可以慢慢調整教育體系、社會保障、法律法規

這是一個好消息
當然，2% 的增長也不是絕對的
可能某些年份會高一些，某些年份低一些
但長期來看，會是一個相對穩定的、可預測的過程
而不是指數爆炸式的奇點

自動駕駛：為什么花了這么久

播客里還聊了自動駕駛
Karpathy 在特斯拉干了 5 年 Autopilot，他太清楚這里面的坑了

主持人問：
為什么自動駕駛這么難，為什么花了這么久

Karpathy 給了幾個理由

第一個，是 long tail problem

你以為自動駕駛就是識別車道線、識別紅綠燈
太天真了，真實世界有無數種情況
施工路段、臨時路牌、突然竄出的小孩、逆行的瘋子、路上的大坑、掉落的貨物

這些「長尾情況」，占比很小，但每一個都可能致命
你必須把它們全部解決
不能說「我 99% 的情況都能處理」，剩下的 1% 就會是事故

而且這個長尾，真的很長
你以為處理完 100 種情況就夠了
結果發現還有 1000 種
處理完 1000 種，還有 10000 種
永遠有新的邊緣情況
這就是為什么自動駕駛這么難

第二個，是 safety bar

自動駕駛不是「比人類平均水平好」就行
它必須遠好于人類

為什么？
人們對機器的容忍度，遠低于對人的容忍度

人類司機每天撞車，大家習慣了
美國每年 4 萬人死于車禍，大家也接受了
但如果是自動駕駛撞了一次
新聞頭條、國會聽證、股價暴跌
所以 safety bar 特別高
（所以... AGI Bar 呢？）

不是做到人類水平就行，要做到遠超人類水平
這個標準，其實挺不公平的
但現實就是這樣
技術要被接受，必須遠好于現狀
不能只是「稍微好一點」

第三個，是 data problem

自動駕駛，需要海量的真實駕駛數據
再次劃重點：真實世界的

這需要時間積累
特斯拉為什么現在做得好
因為它有幾百萬輛車在路上跑，每天收集數據
這是花錢買不來的

你可以造一個很貴的實驗室，雇一堆博士
但你造不出幾百萬輛車在路上跑的數據
這個優勢，其他公司很難追上

Karpathy 說：
自動駕駛花了這么久，其實是給 AGI 的一個預警
AGI 會遇到同樣的問題

long tail、safety、data
每一個都需要時間
不是說模型做出來就完事了
還要在真實世界里打磨，處理各種邊緣情況
這個過程，可能比模型訓練本身還要長

教育的未來：untangling knowledge

播客最后聊了教育

Karpathy 現在在做 Eureka Labs，一個 AI 教育公司
他對教育有個很有意思的理解
好的教育，是 untangling knowledge

什么意思？
知識本身是一團亂麻
所有概念互相纏繞、互相依賴
但學習需要一個線性的路徑
你得先學 A，才能學 B

好的老師，就是把這團亂麻理清楚
讓學生按照一個清晰的順序，一步步往上爬
每一步都只依賴前面學過的東西
不會突然冒出一個新概念，讓你措手不及

Karpathy 舉了個例子
他的 transformer 教程，為什么大家覺得好
因為他從 bigram 開始

bigram 是什么？
就是個 lookup table：上一個詞是 A，下一個詞是 B
就這么簡單
一個 2 維表格，誰都能看懂
然后一步步加東西
加 embedding、加 attention、加 layer norm

好的教育，每一步都會解釋：為什么要加東西，這是在解決什么問題這就是 untangling
比如，把復雜的 transformer 拆成一步步的演進，每一步都有章可循

emmmmm...

他還說了個特別重要的教育原則：
present the pain before you present the solution
別上來就告訴學生答案，先讓他們感受到問題，然后再給解決方案，這樣學得才深

為什么？
因為如果你直接給答案，學生不知道這個答案解決了什么問題

就像你告訴學生「attention 機制是這樣的」
學生學會了公式，但不知道為什么需要 attention

如果你先展示問題：
之前的模型處理長序列有這個問題

先讓學生自己思考怎么解決
然后你再給出 attention 這個方案
學生會恍然大悟：原來是這樣解決的
這種學習，才是深刻的，才能記得住

這個原則，其實不只適用于技術教育
任何教育都一樣
先讓學生感受到問題的存在，再給解決方案，這樣學習效果最好

最后說兩句

這個播客值得一看
Karpathy 是一個在一線干了 15 年的人
很誠實地說出他看到的東西

在 Karpaty 眼中，AGI 還需要十年
不是因為技術不行，而是因為問題太多、太難

continual learning、multimodal、safety、long tail、data
每一個都是硬骨頭，需要時間一個個啃，但也不是遙不可及

十年，聽起來很長
但 iPhone 發布到現在，也就 17 年

不用焦慮，也不用盲目樂觀
踏踏實實做事就好

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

AI 大神 Karpathy 2025 年度總結刷屏：AI 既是天才也是智障，這 6 個轉折最關鍵

愛范兒 2025-12-20 12:52:18
3 跟貼 3
日耗50萬億Token，火山引擎的AI消費品戰事

36氪 2025-12-19 19:18:42
0 跟貼 0

諾獎得主Hassabis：5-10年AGI將至，沖擊力將是工業革命10倍！

新智元 2025-12-20 09:21:27
0 跟貼 0

王曉剛和他的“世界模型”：一人管十狗，先讓四足機器人上街干活｜智能涌現專訪

36氪 2025-12-21 12:40:09
0 跟貼 0
「不僅會想，還能準確去做」VLA-R1把「推理+行動」帶進真實世界

機器之心Pro 2025-10-27 19:12:41
0 跟貼 0

景不動人動，OST-Bench揭示多模態大模型在線時空理解短板

機器之心Pro 2025-10-14 16:42:00
0 跟貼 0

LLM把簡單任務復雜化，Karpathy無語：有些任務無需那么多思考

機器之心Pro 2025-08-12 11:16:52
0 跟貼 0
天才還是賭徒？23歲的Aschenbrenner與AI的終極博弈

虎嗅APP 2025-08-22 02:32:22
0 跟貼 0

今日頭條劇透新風向！AI內容過剩時代，“深度”反而更稀缺

雷科技 2025-12-21 12:12:19
0 跟貼 0
深度｜AGI是不是一個陰謀論？

DeepTech深科技 2025-12-08 15:01:46
0 跟貼 0
使用AI推動業務增長荔枝集團入選廣州文化企業30強

財聯社 2025-12-19 18:12:07
0 跟貼 0
一場千萬美元的賭注：造一個替你賺錢的“分身”

虎嗅APP 2025-12-20 04:56:07
3 跟貼 3
AI生成操作系統新突破！上海交大提出文件系統開發新范式

量子位 2025-12-21 22:37:54
0 跟貼 0
a16z年度重磅報告：OpenAI艱難守擂，谷歌火力全開，用戶只選一個

華爾街見聞官方 2025-12-21 19:36:02
2 跟貼 2
摩爾線程的野心，不藏了

量子位 2025-12-21 22:23:24
0 跟貼 0
話說這么翻譯，不會挨打嘛

大金看記錄片 2025-12-21 10:16:51
3 跟貼 3
洪晃最新播客爆出的大料真是震碎我的三觀！無以言說無以言表！

聽樂芝生活 2025-12-20 02:12:57
52 跟貼 52
大鵬原來是被張朝陽辭退且沒任何補償，14年服務終究分道揚鑣

影視地平線 2025-12-18 23:51:01
0 跟貼 0
臺灣桃園人連線主播柳杰克：別被我這犀利風格嚇到

金日視界 2025-12-20 09:04:44
2 跟貼 2
翻譯被人設計不料女下屬是英語八級總裁都驚呆了

酒酒愛追劇 2025-12-19 07:19:58
20 跟貼 20
他發明了價值萬億的AGI，如今窮困潦倒

新智元 2025-11-04 20:19:19
101 跟貼 101
館長：25號去直播，26號直播帶貨預演，27號大決戰！真的緊張啊

長腿嗑嘰君 2025-12-18 09:21:40
7 跟貼 7
不愧是冠軍文本！何廣智開口就是核彈級別包袱，惹全場瘋狂爆燈！

阿笎評論哥 2025-12-21 01:20:21
2 跟貼 2
26歲鄭州小伙倫敦鬧市開店賣胡辣湯：一碗售價130元

極目新聞 2025-12-19 21:19:26
6022 跟貼 6022
吃中國飯，砸中國鍋！央視點名全程打碼，這位700萬網紅人設崩塌

劉鑫染 2025-12-21 20:33:27
1 跟貼 1
財經調查丨新買的衣服有刺鼻味要警惕！大量翻新舊衣流入直播間

央視財經 2025-12-21 20:57:43
0 跟貼 0
AI時代的堅實一步：從鴻蒙星光盛典看HarmonyOS 6小藝的進階之路

IT之家 2025-12-21 15:05:08
3 跟貼 3
館長12.19直播（10），臺灣人應該學習一下大陸人家的安檢

胡萊克修斯 2025-12-20 03:58:43
0 跟貼 0
歷史哥也準備來內地直播

事件的看法哦 2025-12-18 03:24:27
9 跟貼 9
海南封關第一天！西門子入駐只是信號，普通人的機會不在樓市

大國知識局 2025-12-21 20:39:18
1 跟貼 1
唇語是看懂了，但翻譯對不對就不知道了

愛豆觀影 2025-12-21 16:32:21
1 跟貼 1
告別抽卡！一手實測字節剛放出的視頻模型Seedance 1.5 pro

機器之心Pro 2025-12-18 17:49:18
0 跟貼 0
景區翻譯太離譜：“小心碰頭”譯成“請小心會面”，老外看懵了

舊鐵皮往南開 2025-12-21 04:40:28
0 跟貼 0
5歲萌娃“翻譯”加密式反省信，媽媽調侃沒一個字多余，太可愛了

星視頻 2025-12-19 16:42:40
0 跟貼 0
男子的車凌晨狂奔到外地 "好心人"收800元稱愿幫送回

環球網 2025-12-21 18:15:48
848 跟貼 848
英語應該早日取消主科地位，成為選修課，這樣才能真正減負

狐貍先森講升學規劃 2025-12-21 21:47:51
0 跟貼 0
小趙不是去越南打擾紫霞母女的生活，是去給女兒送撫養費

小新在大連 2025-12-21 08:46:58
0 跟貼 0
“古董界北瘋碰撞才女，鑒寶直播誰能翻盤，笑點重重待揭曉！”

伴你終老n 2025-12-20 06:14:11
1 跟貼 1
翻譯的對錯放一邊，就問你翻沒翻譯吧

小狗旅行記vlog 2025-12-21 00:13:18
0 跟貼 0
高一是轉折點，也可能是斷裂點

教育思享 2025-12-21 22:14:14
0 跟貼 0

賽博禪心

拜AI古佛，修賽博禪心

218文章數 12關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

房產

本地

公開課

軍事航空

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
明末究竟有多難，無法阻止的歷史進程
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

Andrej Karpathy 2小時訪談：未來十年，沒有 AGI，只有 Agent ｜附：中文版音頻

生態適配已超95% 鴻蒙下一關：十萬個應用

美國外交系統現重大調整 約有24名駐外大使被要求離任

美國外交系統現重大調整 約有24名駐外大使被要求離任

勇士火箭贏球：王牌之外的答案？

星光大賞太尷尬！搶話擋鏡頭，場地還小

老房子“強制體檢”，政府出手了

-30℃，標致508L&凡爾賽C5 X冰雪"大考"

態度原創

曝折疊屏iPhone嘗試 UFG 玻璃，明年九月發

中交·藍色港灣一周年暨藍調生活沙龍圓滿舉行

云游安徽｜訪黃山云海古村，讀一城山水風骨

石破茂：擁核絕不會給日本帶來正面影響

美國外交系統現重大調整約有24名駐外大使被要求離任

美國外交系統現重大調整約有24名駐外大使被要求離任