<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Ilya重新定義AGI: 為什么ChatGPT離真正的AGI還很遠(yuǎn)

      0
      分享至

      從OpenAI離開后,Ilya Sutskever從公眾視野中消失了許久。

      前段時間,他終于上了個視頻播客節(jié)目,和主播Dwarkesh Patel聊了1小時36分鐘,把他現(xiàn)在對AGI的看法完整表述了一遍。


      如果你不知道Ilya是誰的話,簡單介紹下,他是OpenAI前首席科學(xué)家,GPT系列的核心設(shè)計者,現(xiàn)在創(chuàng)辦了SSI(Safe Superintelligence Inc.)。

      我關(guān)注Ilya很久了。從ChatGPT發(fā)布起,他的每一次公開發(fā)言,我都會仔細(xì)看。這個人對AI的理解,比大多數(shù)人深太多。

      這次訪談更狠。他提出了一個顛覆性的觀點(diǎn):

      我們對AGI的理解,可能從一開始就錯了。

      AI行業(yè)的大轉(zhuǎn)折:規(guī)模時代結(jié)束了

      在講AGI之前,Ilya先說了一個更大的背景。

      他說了一句讓我印象很深的話:

      "2020到2025,是規(guī)模時代(Age of Scaling)。但現(xiàn)在規(guī)模已經(jīng)夠大了。我們回到了研究時代(Age of Research)——只不過這次有大算力支持。"

      什么意思?

      過去5年,AI公司都在做一件事:堆數(shù)據(jù)、堆算力、堆參數(shù)。

      規(guī)模定律(Scaling Law)吸走了所有空氣。所有人都在做同樣的事:

      • 2020:GPT-3,175B參數(shù)

      • 2021-2024:所有公司瘋狂擴(kuò)大預(yù)訓(xùn)練規(guī)模

      • 數(shù)據(jù)從TB級到PB級

      • 算力從百GPU到萬GPU

      Ilya甚至說了一句狠話:

      "Scaling sucked out all the air in the room. Everyone started to do the same thing. We got to the point where there are more companies than ideas by quite a bit."

      公司數(shù)量比想法還多。這話太準(zhǔn)了。

      但現(xiàn)在呢?

      規(guī)模已經(jīng)足夠大了。再100x也不會帶來質(zhì)變。數(shù)據(jù)快耗盡了,算力再堆10倍,能力提升可能只是邊際改善。

      接下來拼什么?拼想法。拼對AI本質(zhì)的理解。

      這也是為什么SSI才有機(jī)會——不再是純拼預(yù)算,而是拼研究深度。

      說實(shí)話,這個判斷如果是對的,對整個AI行業(yè)的影響會很大。意味著小團(tuán)隊、研究驅(qū)動的公司,又有機(jī)會了。

      模型很強(qiáng),但經(jīng)濟(jì)影響很弱——為什么?

      Ilya提出了一個讓所有人困惑的問題:

      "現(xiàn)在的模型在評測(evals)上表現(xiàn)驚人。但經(jīng)濟(jì)影響遠(yuǎn)遠(yuǎn)落后。怎么解釋這個矛盾?"

      你看各種benchmark:

      • 代碼競賽:超過人類平均水平

      • 數(shù)學(xué)問題:接近IMO金牌選手

      • 復(fù)雜推理:能解決博士級別的題目

      但實(shí)際用起來呢?

      會在兩個bug之間循環(huán)。會重復(fù)說同樣的話。前一句話和后一句話自相矛盾。

      為什么會這樣?

      Ilya給出了一個絕妙的類比。

      學(xué)生A vs 學(xué)生B:AI過度訓(xùn)練的陷阱

      想象兩個學(xué)生:

      學(xué)生A: 要成為競賽編程冠軍。于是瘋狂練習(xí)10,000小時,刷了所有競賽題,背下所有算法,成為頂尖競賽選手。

      學(xué)生B: 也覺得競賽編程挺有意思,練了100小時,也做得不錯。

      問題來了:誰在以后的職業(yè)生涯中會更成功?

      十有八九是學(xué)生B。

      為什么?

      因為學(xué)生A只會做競賽題。遇到實(shí)際項目,遇到?jīng)]見過的問題,就懵了。

      學(xué)生B雖然練得少,但他有"那個東西"——學(xué)習(xí)能力、舉一反三的能力、解決新問題的能力。

      現(xiàn)在的AI就是學(xué)生A。

      我們怎么訓(xùn)練大模型的?

      1. 預(yù)訓(xùn)練: 喂給它所有能找到的數(shù)據(jù)——所有書、所有代碼、所有網(wǎng)頁。就像讓學(xué)生A刷遍所有競賽題。

      2. 強(qiáng)化學(xué)習(xí)(RL): 針對特定任務(wù)瘋狂訓(xùn)練。想讓它在編程評測上表現(xiàn)好?那就專門訓(xùn)練編程任務(wù),訓(xùn)練到評測分?jǐn)?shù)爆表。

      結(jié)果呢?評測上確實(shí)表現(xiàn)驚人。但真實(shí)場景一塌糊涂。

      Ilya說了一個觀察:

      現(xiàn)在所有AI公司都有專門的團(tuán)隊,不停地設(shè)計新的RL訓(xùn)練環(huán)境。這些環(huán)境怎么設(shè)計的?

      很多時候是從評測中找靈感。

      "我希望模型在發(fā)布時評測成績好看,那我就專門訓(xùn)練它做這類任務(wù)。"

      這就是為什么模型能在評測上做很難的題,卻在實(shí)際使用中會犯低級錯誤。

      它沒有真的理解,只是記住了而已。

      Ilya甚至說了一句狠話:

      "The real reward hacking is the human researchers who are too focused on the evals."

      真正的獎勵破解(reward hacking),是研究人員太關(guān)注評測分?jǐn)?shù)了。

      人類的秘密武器:泛化能力

      這是整個訪談中最讓我震撼的部分。

      Ilya說:人類用更少的數(shù)據(jù),學(xué)得更好。

      他提到了一個他自己的例子:

      "我5歲的時候,超級喜歡汽車。那時候我對汽車的識別能力,已經(jīng)足夠支撐開車了——雖然我還沒法開,但我能認(rèn)出所有車型。"

      想想看,一個5歲小孩:

      • 見過的世界很小(大部分時間在家)

      • 數(shù)據(jù)多樣性極低(每天看到的東西差不多)

      • 訓(xùn)練數(shù)據(jù)量只是大模型的零頭

      但人類學(xué)到的東西,理解得更深。

      15歲的人類,學(xué)習(xí)的數(shù)據(jù)量只是GPT預(yù)訓(xùn)練數(shù)據(jù)的千分之一。

      但人類不會犯AI犯的那些低級錯誤:

      • 不會在兩個bug之間循環(huán)

      • 不會重復(fù)說同樣的話

      • 不會前一句話和后一句話自相矛盾

      那人類靠什么做到的?

      價值函數(shù):人類內(nèi)置的"對錯感"

      Ilya提到了一個神經(jīng)科學(xué)案例:

      有個人大腦的情緒處理中樞受損了。他不再有情緒——不會難過、不會憤怒、不會興奮。

      在測試中,他依然能說話、能做智力題,看起來一切正常。

      但他完全喪失了決策能力。

      選穿哪雙襪子,能糾結(jié)好幾個小時。做財務(wù)決策,完全一團(tuán)糟。

      這說明什么?

      情緒系統(tǒng)是人類的內(nèi)置"價值函數(shù)"(Value Function)。

      它告訴我們:什么是好的,什么是壞的,什么事情值得做,什么事情不值得。

      沒有這個系統(tǒng),即使智力正常,也無法在真實(shí)世界中運(yùn)作。

      那什么是價值函數(shù)?

      Ilya給了個很清楚的解釋:

      "你下棋,丟了一個子,你不用下完整盤棋就知道自己犯錯了。價值函數(shù)能讓你提前知道:這步是好是壞。"

      現(xiàn)在的AI怎么訓(xùn)練的?

      你讓它寫1000行代碼,等它寫完,你告訴它"對"或"錯"。它學(xué)不到中間過程哪一步走錯了。

      如果有價值函數(shù)呢?

      AI寫到第100行,價值函數(shù)就能判斷:"這個方向不對,應(yīng)該換思路。"不用等到寫完1000行才發(fā)現(xiàn)。

      人類就是這么學(xué)的。

      你編程時寫了幾行代碼,感覺"不對勁",就會停下來重新思考。這就是你的價值函數(shù)在起作用。

      AI現(xiàn)在缺的,可能就是這個。

      Ilya說他對怎么解決有想法,但"由于種種原因,無法詳細(xì)討論"。(這個有點(diǎn)神秘,估計是SSI的核心競爭力)

      新定義: AGI不是"全知全能",而是"能學(xué)會任何事"

      說了這么多,終于到了核心:Ilya對AGI的重新定義。

      什么是AGI(通用人工智能)?

      問十個人,九個會說:能做所有工作的AI。

      OpenAI的定義就是這樣——"能勝任人類所有經(jīng)濟(jì)價值工作的系統(tǒng)"。

      聽起來很合理對吧?

      但I(xiàn)lya說:等等,這個定義好像哪里不對。

      為什么?

      他給了個很直接的理由:人類自己都不是AGI啊。

      你想想,一個普通人知道多少東西?

      你會編程嗎?不一定。會做心臟手術(shù)嗎?肯定不會。會設(shè)計芯片嗎?更不可能。

      人類缺少大量的知識。我們不是"什么都會"。

      那為什么人類是"通用智能"?

      很簡單——我們能學(xué)。

      你不會編程?給你幾個月時間,你能學(xué)會。你不懂醫(yī)學(xué)?讓你去醫(yī)學(xué)院學(xué)幾年,你能成為醫(yī)生。

      人類的"通用"體現(xiàn)在哪?不在"已經(jīng)會了",在"能學(xué)會"。

      所以,Ilya給出了新的AGI定義:

      AGI不是"已經(jīng)會做所有工作",而是"能學(xué)會做所有工作"。

      他給了一個很形象的比喻:

      "想象我造出了一個15歲的超級智能學(xué)生。他非常聰明,學(xué)習(xí)能力極強(qiáng),但知識儲備幾乎為零。" "你讓他去當(dāng)程序員,他會去學(xué)編程。" "你讓他去當(dāng)醫(yī)生,他會去學(xué)醫(yī)。" "這就是AGI。"

      這個定義的核心是什么?

      持續(xù)學(xué)習(xí)能力(Continual Learning)。

      不是一次性訓(xùn)練好,然后什么都知道。

      而是:

      • 快速學(xué)習(xí): 比人類更快掌握新技能

      • 深度理解: 真正理解,不只是記住

      • 靈活遷移: 一個領(lǐng)域?qū)W到的東西,能用到其他領(lǐng)域

      這才是真正的"通用"。

      SSI的戰(zhàn)略調(diào)整:從"直擊超級智能"到漸進(jìn)式部署

      這個新定義,改變了SSI的整個戰(zhàn)略。

      SSI最初的計劃是"straight-shot superintelligence"——直擊超級智能。

      什么意思?就是不發(fā)布中間產(chǎn)品,埋頭研究,直到造出真正的超級智能才發(fā)布。

      好處是:避免市場競爭的各種權(quán)衡和壓力,專注研究。

      但I(xiàn)lya說,這個計劃可能會調(diào)整。

      為什么?

      因為AI的部署本身就是學(xué)習(xí)過程。

      你想想,人類的很多系統(tǒng)是怎么變安全的?

      • 飛機(jī)為什么現(xiàn)在這么安全?不是因為設(shè)計師一開始就想清楚了所有問題,而是通過事故、改進(jìn)、再事故、再改進(jìn),迭代了幾十年。

      • Linux為什么bug這么少?不是因為Linus一開始就寫出了完美代碼,而是無數(shù)人在實(shí)際使用中發(fā)現(xiàn)問題、修復(fù)問題。

      AI可能也需要這樣。

      Ilya說:

      "很難想象有哪個工程領(lǐng)域,是純靠思考就能做到安全的,而不需要實(shí)際部署和反饋。"

      所以,即使是"直擊超級智能",也需要漸進(jìn)式發(fā)布。

      更重要的是:展示AI的價值。

      Ilya說了一句很有意思的話:

      "你寫一篇文章說'AI會怎樣怎樣',別人看了會說'挺有意思的'。" "但當(dāng)你讓別人看到AI實(shí)際在做這個、做那個——那完全不一樣。"

      看到 vs 聽說,天壤之別。

      這也是為什么SSI可能會改變策略,在中間階段就發(fā)布產(chǎn)品。(這個轉(zhuǎn)變挺關(guān)鍵的,說明Ilya也在務(wù)實(shí)地思考商業(yè)化)

      對我個人的啟示

      這個新定義,不只是對AI行業(yè)的顛覆。

      對我個人也有深刻觸動。

      我做了5年產(chǎn)品、開發(fā)、內(nèi)容創(chuàng)作。如果按傳統(tǒng)思路,我應(yīng)該選一個方向深挖,成為某個領(lǐng)域的專家。

      但在AI時代,這個策略好像不太對了。

      為什么?我最近一直在想這個問題。

      你看:

      • 我2023年研究的Prompt技巧,很多現(xiàn)在不需要了

      • 我半年前用的AI工具,現(xiàn)在又出了更好的

      我有段時間很焦慮。總覺得自己在追,但永遠(yuǎn)追不上。

      直到聽完Ilya這次訪談,我突然想明白了:

      如果我只是積累知識,我永遠(yuǎn)追不上。

      但如果我培養(yǎng)的是學(xué)習(xí)能力——快速上手新工具、快速理解新概念、快速應(yīng)用到實(shí)際問題——那我永遠(yuǎn)不會過時。

      這就是為什么Ilya說,AGI的本質(zhì)是學(xué)習(xí)能力,而不是知識儲備。

      人類在這方面還有巨大優(yōu)勢。我們可以:

      • 快速切換領(lǐng)域

      • 從失敗中學(xué)習(xí)

      • 舉一反三

      • 在不確定中探索

      這些,AI還做不好。但差距在縮小。

      當(dāng)AI也有了真正的持續(xù)學(xué)習(xí)能力,當(dāng)它也能像15歲的天才學(xué)生一樣,快速學(xué)會任何新技能...那時候,競爭會更激烈。

      所以,現(xiàn)在就該問自己:

      我的學(xué)習(xí)能力,夠強(qiáng)嗎?

      我能多快掌握一個新領(lǐng)域?

      我能不能在AI的幫助下,學(xué)得更快?

      這些問題的答案,決定了你在AI時代能走多遠(yuǎn)。

      Ilya的這次訪談,還談了很多其他內(nèi)容:

      • 為什么強(qiáng)化學(xué)習(xí)現(xiàn)在花的算力已經(jīng)超過預(yù)訓(xùn)練

      • SSI怎么用30億美元跟OpenAI的百億預(yù)算競爭(這個數(shù)據(jù)挺有意思,OpenAI年研究支出50-60億,但大部分分散在產(chǎn)品、銷售等方向。SSI只做研究,實(shí)際研究算力差距沒那么大)

      • 怎么讓超級智能"關(guān)心所有有感知能力的生命"

      • 為什么AI對齊比想象中難

      每一個都值得單獨(dú)寫一篇文章。

      但這篇文章,我想聚焦在這個核心洞察上:

      AGI不是"什么都會",而是"什么都能學(xué)"。

      這個定義,改變了我對AI的理解。也改變了我對自己的期待。

      在AI時代,知識不再是護(hù)城河。學(xué)習(xí)能力才是。

      : Ilya完整訪談在這里 → https://www.youtube.com/watch?v=aR20FWCCjAs

      • 時長: 1小時36分鐘

      • 嘉賓: Ilya Sutskever (SSI創(chuàng)始人, 前OpenAI首席科學(xué)家)

      • 主持: Dwarkesh Patel

      • 發(fā)布時間: 2025年12月

      強(qiáng)烈推薦完整看一遍。這是今年必看的訪談之一。(我看了兩遍,第二遍才真正理解他說的價值函數(shù)那段)

      你覺得現(xiàn)在的AI,離Ilya說的"15歲天才學(xué)生"還有多遠(yuǎn)?

      歡迎評論區(qū)聊聊。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      高鐵時代,綠皮車卻火了,大巴車都要起死回生了

      高鐵時代,綠皮車卻火了,大巴車都要起死回生了

      歷史總在押韻
      2026-02-12 23:53:10
      李亞鵬突然提到十年前最難時給黃曉明發(fā)短信,不到一分鐘收到回復(fù)

      李亞鵬突然提到十年前最難時給黃曉明發(fā)短信,不到一分鐘收到回復(fù)

      百態(tài)人間
      2026-02-10 15:25:10
      浙江省稅務(wù)局黨委書記、局長孟軍:堅定扛起經(jīng)濟(jì)大省挑大梁的稅務(wù)擔(dān)當(dāng)

      浙江省稅務(wù)局黨委書記、局長孟軍:堅定扛起經(jīng)濟(jì)大省挑大梁的稅務(wù)擔(dān)當(dāng)

      新浪財經(jīng)
      2026-02-13 11:11:38
      不能錯過!2月13日晚19:00比賽!中央5套CCTV5、CCTV5+直播節(jié)目表

      不能錯過!2月13日晚19:00比賽!中央5套CCTV5、CCTV5+直播節(jié)目表

      林子說事
      2026-02-13 14:54:46
      中央軍委全力反腐敗,說明中國人民解放軍將要擔(dān)大任,干大事!

      中央軍委全力反腐敗,說明中國人民解放軍將要擔(dān)大任,干大事!

      安安說
      2026-01-29 09:33:17
      大年三十除夕必吃的3道菜,好吃吉利,吃完馬年旺,快收藏起來!

      大年三十除夕必吃的3道菜,好吃吉利,吃完馬年旺,快收藏起來!

      江江食研社
      2026-02-12 18:30:07
      恒基太子爺李家誠入稟高等法院,控告藝人周秀娜誹謗及騷擾

      恒基太子爺李家誠入稟高等法院,控告藝人周秀娜誹謗及騷擾

      TVB劇評社
      2026-02-13 16:22:16
      金融戰(zhàn)已經(jīng)打響

      金融戰(zhàn)已經(jīng)打響

      白淺娛樂聊
      2026-02-12 19:39:55
      退休14年被查!中國人壽原總裁楊超案:投資領(lǐng)域腐敗典型,退休非安全港

      退休14年被查!中國人壽原總裁楊超案:投資領(lǐng)域腐敗典型,退休非安全港

      聽楓觀瀾
      2025-12-28 23:13:23
      霍勒迪31分9板7助開拓者戰(zhàn)勝爵士,克林根23分18板楊瀚森2分

      霍勒迪31分9板7助開拓者戰(zhàn)勝爵士,克林根23分18板楊瀚森2分

      湖人崛起
      2026-02-13 12:33:42
      慘敗仍有收獲!U18國青2將被張博源主帥看中 除張懿趙杰還有1人

      慘敗仍有收獲!U18國青2將被張博源主帥看中 除張懿趙杰還有1人

      大嘴爵爺侃球
      2026-02-13 18:21:14
      消失的彭加木:一場精心計劃的逃亡?隱藏在羅布泊中的離奇秘密

      消失的彭加木:一場精心計劃的逃亡?隱藏在羅布泊中的離奇秘密

      史之銘
      2026-02-10 15:35:39
      媽媽嫁給爸爸的理由有多簡單粗暴?網(wǎng)友:我爹圖我姥爺是縣委書記

      媽媽嫁給爸爸的理由有多簡單粗暴?網(wǎng)友:我爹圖我姥爺是縣委書記

      帶你感受人間冷暖
      2026-02-11 12:27:35
      當(dāng)?shù)谝淮螏ο蠡厣嚼锢霞視r!我要笑死在評論區(qū)

      當(dāng)?shù)谝淮螏ο蠡厣嚼锢霞視r!我要笑死在評論區(qū)

      另子維愛讀史
      2026-02-13 19:35:51
      震撼!國家投超3000億建新藏鐵路,1980公里每公里造價近2億

      震撼!國家投超3000億建新藏鐵路,1980公里每公里造價近2億

      有書
      2026-02-12 21:00:08
      Coco直播自曝經(jīng)濟(jì)不好,謝賢沒給她2000萬分手費(fèi),遺憾沒能結(jié)婚

      Coco直播自曝經(jīng)濟(jì)不好,謝賢沒給她2000萬分手費(fèi),遺憾沒能結(jié)婚

      離離言幾許
      2026-02-11 12:44:06
      驚喜連連!18歲全紅嬋強(qiáng)勢歸隊,4大好消息藏不住了

      驚喜連連!18歲全紅嬋強(qiáng)勢歸隊,4大好消息藏不住了

      卿子書
      2026-02-12 08:15:51
      《生命樹》大結(jié)局:邵云飛被逼跳樓,馮克清入獄,孟耀輝中槍身亡

      《生命樹》大結(jié)局:邵云飛被逼跳樓,馮克清入獄,孟耀輝中槍身亡

      小娛樂悠悠
      2026-02-13 13:22:35
      男子辭北京公務(wù)員,照顧非親非故老太太9年,網(wǎng)友:報恩還是犯傻

      男子辭北京公務(wù)員,照顧非親非故老太太9年,網(wǎng)友:報恩還是犯傻

      一絲不茍的法律人
      2026-02-13 13:29:56
      印度2nm成功流片!

      印度2nm成功流片!

      中國半導(dǎo)體論壇
      2026-02-11 22:26:02
      2026-02-13 22:23:00
      AI進(jìn)化論花生 incentive-icons
      AI進(jìn)化論花生
      AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
      140文章數(shù) 61關(guān)注度
      往期回顧 全部

      科技要聞

      獨(dú)家探訪蔡磊:答不完的卷子 死磕最后一程

      頭條要聞

      浙江"一人公司"興起 前大廠程序員靠AI直接月入200萬

      頭條要聞

      浙江"一人公司"興起 前大廠程序員靠AI直接月入200萬

      體育要聞

      這張照片背后,是米蘭冬奧最催淚的故事

      娛樂要聞

      大衣哥女兒風(fēng)光出嫁,農(nóng)村婚禮超樸素

      財經(jīng)要聞

      華萊士母公司退市 瘋狂擴(kuò)張下的食安隱憂

      汽車要聞

      探秘比亞迪巴西工廠 居然是這個畫風(fēng)!

      態(tài)度原創(chuàng)

      旅游
      房產(chǎn)
      家居
      親子
      公開課

      旅游要聞

      向前向海 前海石公園新春“漫”游指南

      房產(chǎn)要聞

      三亞新機(jī)場,又傳出新消息!

      家居要聞

      中古雅韻 樂韻伴日常

      親子要聞

      看看后媽是怎么做的

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版