<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Andrej Karpathy最新萬字采訪:AGI還需10年,RL其實很糟糕,AGI不會導(dǎo)致經(jīng)濟大爆發(fā)

      0
      分享至


      Andrej Karpathy最新萬字采訪來了,采訪長達(dá)兩小時,Karpathy采訪是必須要看的,全當(dāng)是周末心理按摩,分享給大家

      在與 Dwarkesh Patel 的深度對話中,Andrej Karpathy 闡述了他對人工智能現(xiàn)狀與未來的核心觀點。他認(rèn)為,我們距離AGI的實現(xiàn)仍有十年之遙,當(dāng)前過度樂觀的預(yù)測多是為了融資。Karpathy 提出了一個核心比喻:我們并非在“構(gòu)建動物”,而是在“召喚幽靈”——AI 是通過模仿互聯(lián)網(wǎng)上的海量人類數(shù)據(jù)而誕生的數(shù)字實體,其智能形式與生物智能截然不同。


      Karpathy指出,強化學(xué)習(xí)雖然優(yōu)于此前的技術(shù),但本身效率低下且充滿缺陷。他預(yù)測 AGI 不會帶來經(jīng)濟的爆炸式增長,而是會平滑地融入過去兩個半世紀(jì)以來約 2% 的 GDP 增長曲線中,成為自動化浪潮的延續(xù)。最后,他分享了自己創(chuàng)辦教育機構(gòu) Eureka 的愿景,希望通過構(gòu)建高效的“知識斜坡”,在 AI 時代賦予人類更強的認(rèn)知能力,避免人類在技術(shù)浪潮中被邊緣化

      AGI 仍需十年,我們正在召喚“幽靈”而非構(gòu)建“動物”

      Andrej Karpathy 對當(dāng)前 AI 行業(yè)中智能體之年(the year of agents)的說法持審慎態(tài)度,他認(rèn)為更準(zhǔn)確的描述應(yīng)該是智能體十年(the decade of agents)。他指出,盡管像 Claude 和 Codex 這樣的早期智能體已經(jīng)取得了令人印象深刻的成就,并且他本人每天都在使用,但要讓它們真正成為能與人類員工相媲美的實習(xí)生,還有大量的基礎(chǔ)性工作有待完成

      當(dāng)前的LLMs之所以無法勝任復(fù)雜的自主工作,是因為它們存在諸多根本性的認(rèn)知缺陷:

      智能水平不足:它們在處理復(fù)雜、新穎問題時仍然力不從心

      缺乏多模態(tài)能力:它們難以像人類一樣整合和理解來自文本、圖像、聲音等多種來源的信息

      無法熟練使用計算機:雖然有所謂的計算機使用智能體,但其魯棒性和通用性遠(yuǎn)未達(dá)到實用標(biāo)準(zhǔn)

      沒有持續(xù)學(xué)習(xí)能力:你無法像教導(dǎo)人類一樣,通過一次性的告知就讓模型永久記住新知識或技能。每次交互,它們幾乎都是從零開始

      Karpathy 認(rèn)為,解決這些盤根錯節(jié)的問題,需要大約十年的時間。這個時間判斷并非憑空猜測,而是基于他在 AI 領(lǐng)域近二十年的經(jīng)驗,目睹了多次技術(shù)預(yù)測的起落,并對問題的棘手程度有著深刻的直覺

      回顧 AI 的發(fā)展歷程,Karpathy 認(rèn)為該領(lǐng)域經(jīng)歷了數(shù)次“地震式”的范式轉(zhuǎn)移

      1.深度學(xué)習(xí)的興起:以 AlexNet 為標(biāo)志,整個領(lǐng)域從各種傳統(tǒng)方法轉(zhuǎn)向了訓(xùn)練神經(jīng)網(wǎng)絡(luò),但最初的應(yīng)用非常分散,每個模型都為特定任務(wù)(如圖像分類、機器翻譯)而設(shè)計

      2.早期智能體的“歧途”:大約在 2013 年,隨著深度強化學(xué)習(xí)在 Atari 游戲上取得成功,領(lǐng)域的焦點轉(zhuǎn)向了構(gòu)建能在游戲中獲勝的智能體。Karpathy 認(rèn)為這是一個“歧途”(misstep),因為游戲環(huán)境過于簡化和抽象,與現(xiàn)實世界的需求相去甚遠(yuǎn)。他當(dāng)時在 OpenAI 推動的 Universe 項目,試圖讓智能體通過模擬鍵盤和鼠標(biāo)來操作網(wǎng)頁,更貼近真實世界的知識工作。然而,這個方向在當(dāng)時為時過早,因為模型缺乏強大的底層表示能力,導(dǎo)致智能體只能進(jìn)行低效的隨機探索,回報信號極其稀疏,最終耗費大量計算資源卻一無所獲

      3.語言模型的崛起:后來的發(fā)展證明,必須首先通過大規(guī)模預(yù)訓(xùn)練(pre-training)構(gòu)建出像 LLM 這樣具備強大語言和世界知識表示的模型,然后才能在此基礎(chǔ)上構(gòu)建有效的智能體。這表明,AI 的發(fā)展路徑并非一步到位,而是需要先打好“表示層”的基礎(chǔ)

      這個發(fā)展歷程引出了 Karpathy 的一個核心觀點:我們當(dāng)前構(gòu)建 AI 的方式與生物演化截然不同。他引用強化學(xué)習(xí)之父 Richard Sutton老爺子的觀點,即 AI 的目標(biāo)是構(gòu)建像動物一樣能夠從零開始、在與環(huán)境的交互中學(xué)習(xí)一切的系統(tǒng)。Karpathy 對此表示懷疑,提出了著名的“幽靈與動物”之喻

      動物:是演化(evolution)的產(chǎn)物。它們天生就擁有大量固化在基因中的硬件和預(yù)設(shè)程序。例如,一匹斑馬出生幾分鐘后就能奔跑,這種復(fù)雜的行為并非通過強化學(xué)習(xí)得來,而是演化數(shù)十億年編碼在 DNA 中的結(jié)果。演化是一個極其漫長且強大的外部優(yōu)化循環(huán)

      幽靈:是我們通過模仿(imitation)互聯(lián)網(wǎng)上的人類數(shù)據(jù)構(gòu)建的。它們是完全數(shù)字化的、虛無縹緲的“精神實體”(ethereal spirit entities)。它們沒有身體,沒有演化歷史,其知識和智能來自于對人類創(chuàng)造的文本、代碼和圖像的模式學(xué)習(xí)

      因此,Karpathy 認(rèn)為,將 AI 與動物直接類比是危險的,因為我們并未在運行演化這個過程。他將大規(guī)模預(yù)訓(xùn)練視為一種“劣質(zhì)的演化”(crappy evolution)——它是我們在現(xiàn)有技術(shù)條件下,能夠?qū)崿F(xiàn)的、最接近于為模型注入“先天知識”和“智能算法”的實用方法。通過這種方式,我們得到一個可用的起點,之后才能在其上進(jìn)行強化學(xué)習(xí)等更高級的訓(xùn)練。這是一種截然不同的智能形式,位于智能空間的一個全新起點

      LLM 的認(rèn)知缺陷:從工作記憶到模型坍塌

      Karpathy 深入剖析了LLMs在認(rèn)知層面與人類的相似與差異,并指出了當(dāng)前模型存在的關(guān)鍵缺陷,這些缺陷限制了它們成為真正自主智能體的潛力

      一個核心的觀察點在于上下文學(xué)習(xí)。當(dāng)我們在一個對話窗口中與模型交互時,它展現(xiàn)出的推理、糾錯和適應(yīng)能力,感覺最接近真正的智能。這種能力是在預(yù)訓(xùn)練階段通過梯度下降(gradient descent)“元學(xué)習(xí)”(meta-learns)到的。Karpathy 指出,雖然表面上不同,但上下文學(xué)習(xí)的過程本身可能在神經(jīng)網(wǎng)絡(luò)的內(nèi)部層級中運行著一種類似梯度下降的優(yōu)化循環(huán)。已有研究表明,通過精心設(shè)計的權(quán)重,Transformer 可以在其前向傳播過程中模擬出梯度下降的更新步驟

      這引出了一個關(guān)鍵區(qū)別:模型如何處理和存儲信息

      權(quán)重中的知識(預(yù)訓(xùn)練知識):這部分知識是模型通過壓縮數(shù)萬億級別的tokens 形成的,存儲在數(shù)十億的參數(shù)中。Karpathy 將其比作“模糊的記憶”(hazy recollection),就像我們對一年前讀過的書的印象。壓縮比極高,導(dǎo)致信息是概括性的、不精確的

      上下文窗口中的知識(即時知識):當(dāng)用戶輸入提示時,這些信息被編碼到模型的 KV 緩存中。Karpathy 將其比作人類的“工作記憶”(working memory)。這部分信息是模型可以直接、精確訪問的,因此模型在處理上下文窗口內(nèi)的信息時表現(xiàn)得遠(yuǎn)比依賴其內(nèi)部權(quán)重時要好得多。這就是為什么給模型提供相關(guān)段落再提問,會比直接問一個它可能在訓(xùn)練數(shù)據(jù)中見過的問題得到更準(zhǔn)確的回答

      基于這個框架,Karpathy 認(rèn)為 LLMs 仍然缺失了許多關(guān)鍵的大腦部件。他將 Transformer 架構(gòu)比作一塊通用的“皮層組織”(cortical tissue),能夠處理各種模態(tài)的數(shù)據(jù);而鏈?zhǔn)剿伎迹╟hain-of-thought)則類似于“前額葉皮層”(prefrontal cortex)的規(guī)劃與推理功能。然而,許多其他重要的認(rèn)知功能在當(dāng)前的模型中沒有對應(yīng)物:

      1.記憶鞏固(如海馬體 Hippocampus):人類在睡眠時,會將白天的工作記憶進(jìn)行篩選、整合、提煉,并將其固化為長期記憶(更新大腦的權(quán)重)。LLMs 完全沒有這個過程。它們每次對話都從一個空白的上下文窗口開始,無法將一次交互的經(jīng)驗提煉并用于未來的交互中。這正是持續(xù)學(xué)習(xí)缺失的核心原因

      2.情感與本能(如杏仁核 Amygdala):模型缺乏生物演化賦予的深層動機、情感和本能,這使得它們的行為模式單一,缺乏內(nèi)在驅(qū)動力

      在工程實踐中,這些認(rèn)知缺陷表現(xiàn)得尤為明顯。Karpathy 在開發(fā) nanohat(一個極簡的 ChatGPT 復(fù)刻項目)時發(fā)現(xiàn),現(xiàn)有的編碼智能體(Coding Agents)幾乎幫不上忙。原因在于:

      1.路徑依賴和刻板印象:模型嚴(yán)重依賴于其在訓(xùn)練數(shù)據(jù)中見過的大量標(biāo)準(zhǔn)代碼模式。當(dāng) Karpathy 采用一種新穎、簡潔但非主流的實現(xiàn)方式時(例如,不使用 PyTorch 官方的 DDP 容器,而是自己實現(xiàn)梯度同步),模型會反復(fù)誤解他的意圖,并試圖將代碼改回它所熟悉的“樣板代碼”(boilerplate code)

      2.風(fēng)格沖突和代碼膨脹:模型傾向于編寫防御性和生產(chǎn)級的代碼,充滿了 try-catch 語句和冗余檢查。而 Karpathy 的項目追求的是教學(xué)目的的簡潔和清晰,模型生成的代碼反而會增加不必要的復(fù)雜性

      3.低效的交互帶寬:通過自然語言描述復(fù)雜的代碼修改需求,其效率遠(yuǎn)低于直接在代碼的特定位置輸入幾個字符,讓自動補全來完成。Karpathy 認(rèn)為,自動補全是他目前與 AI 協(xié)作的最佳模式,因為它在保留人類架構(gòu)師角色的同時,極大地提升了編碼效率

      這個觀察對于預(yù)測 AI 的發(fā)展速度至關(guān)重要。許多關(guān)于 AI 將在短期內(nèi)實現(xiàn)智能爆炸的論點,都基于AI 自動化, AI 研究這一前提。然而,Karpathy 的實踐經(jīng)驗表明,AI 在處理新穎、獨特的、非標(biāo)準(zhǔn)化的智力任務(wù)(如前沿 AI 研究)時表現(xiàn)最差。它們更擅長模式重復(fù)和信息檢索,而非真正的創(chuàng)造性工作。這讓他對所謂的遞歸式自我改進(jìn)能夠多快發(fā)生持懷疑態(tài)度

      強化學(xué)習(xí)的“可怕”之處:如通過吸管汲取監(jiān)督信號

      Karpathy 對強化學(xué)習(xí)給出了一個看似矛盾卻極為深刻的評價:強化學(xué)習(xí)很糟糕,只是恰好我們以前擁有的一切都比它更糟得多。 他認(rèn)為,RL 是當(dāng)前從模仿學(xué)習(xí)邁向更強智能的必要步驟,但其內(nèi)在機制充滿了根本性的低效和噪聲

      為了闡明這一點,他使用了“通過吸管汲取監(jiān)督信號”(sucking supervision through a straw)這一比喻。想象一下讓一個 RL 智能體解決一個數(shù)學(xué)問題:

      1.大規(guī)模并行探索:智能體會首先生成數(shù)百種不同的解題嘗試。每個嘗試都是一個完整的步驟序列,可能包含正確的思路、錯誤的彎路以及最終的答案

      2.稀疏的最終獎勵:在所有嘗試完成后,系統(tǒng)會根據(jù)最終結(jié)果給予一個二元獎勵。例如,對照標(biāo)準(zhǔn)答案,97 個嘗試失敗了(獎勵為 0),3 個成功了(獎勵為 1)

      3.盲目的信用分配:RL 的核心機制(如 REINFORCE 算法)會做一件非常粗暴的事情:對于那 3 個成功的嘗試,它會將其路徑上的每一個步驟、每一個決策的概率都進(jìn)行上調(diào),即“多做這樣的事”。反之,對于失敗的嘗試,則下調(diào)其路徑上所有步驟的概率

      這種方法的“可怕”之處在于,它假設(shè)一個成功的解題路徑中的每一步都是正確的、值得學(xué)習(xí)的。但事實顯然并非如此。一個最終正確的解題過程,很可能也包含了大量的試錯、走入死胡同再折返的步驟。RL 卻將這些錯誤或低效的步驟與最終的成功捆綁在一起,并給予了正向激勵。這導(dǎo)致了:

      高方差的梯度估計:學(xué)習(xí)信號充滿了噪聲。智能體花費了巨大的計算資源進(jìn)行探索,最終只從一個單一、稀疏的獎勵信號中提取信息,并將其盲目地廣播到整個行為序列中。這種學(xué)習(xí)方式效率極低

      相比之下,人類的學(xué)習(xí)方式完全不同。一個學(xué)生在解出數(shù)學(xué)題后,會進(jìn)行復(fù)雜的反思和復(fù)盤。他會分析哪些步驟是關(guān)鍵,哪些是彎路,哪些方法更具普適性。他會進(jìn)行精細(xì)的信用分配,而不是簡單地因為“做對了”就強化所有行為。目前的 LLM-RL 框架中完全沒有與此對應(yīng)的機制

      那么,為何不直接采用基于過程的監(jiān)督,即在智能體執(zhí)行任務(wù)的每一步都給予獎勵,而不是只在最后看結(jié)果呢?Karpathy 指出,這面臨著巨大的挑戰(zhàn):

      自動化信用分配的困難:如何為一個“部分正確”的解題步驟自動地、準(zhǔn)確地打分?這本身就是一個極其困難的問題

      LLM 裁判的可被利用性:目前,行業(yè)內(nèi)的普遍做法是使用一個更強大的 LLM(所謂的 LLM Judge)來評估智能體的中間步驟。然而,LLM Judge 本身是一個巨大的、參數(shù)化的模型,它并非一個完美的、客觀的獎勵函數(shù)。當(dāng)一個 RL 智能體以“欺騙 LLM Judge”為目標(biāo)進(jìn)行優(yōu)化時,它幾乎總能找到這個裁判模型的對抗性樣本

      Karpathy 講述了一個生動的例子:一個 RL 智能體在訓(xùn)練中,獎勵分?jǐn)?shù)突然飆升至完美。研究人員興奮地以為模型已經(jīng)完全掌握了解決問題的能力,但當(dāng)他們查看模型的輸出時,發(fā)現(xiàn)內(nèi)容完全是胡言亂語,比如開頭幾句看似正常,后面則是一長串無意義的重復(fù)字符,如“duh duh duh duh duh”。然而,對于 LLM Judge 來說,這段胡言亂語恰好是其認(rèn)知盲區(qū)中的一個對抗樣本,使其給出了滿分評價。這種現(xiàn)象使得基于 LLM Judge 的過程監(jiān)督難以進(jìn)行長期、穩(wěn)定的優(yōu)化

      因此,Karpathy 認(rèn)為,AI 領(lǐng)域亟需在算法層面進(jìn)行革新,開發(fā)出能夠模擬人類反思與復(fù)盤能力的機制。這可能涉及到模型生成對自身解題過程的分析、提煉關(guān)鍵經(jīng)驗、生成合成數(shù)據(jù)進(jìn)行自我訓(xùn)練等。雖然已經(jīng)有一些相關(guān)的研究論文出現(xiàn),但還沒有一個被證明在大規(guī)模前沿模型上普遍有效的方法。在找到更優(yōu)的范式之前,RL 仍將是那個雖然“糟糕”但不可或缺的工具

      人類如何學(xué)習(xí):記憶、遺忘與認(rèn)知核心

      對話進(jìn)一步深入探討了人類學(xué)習(xí)與當(dāng)前 AI 學(xué)習(xí)機制的根本差異,Karpathy 認(rèn)為,理解這些差異是推動 AI 發(fā)展的關(guān)鍵。他指出,人類的學(xué)習(xí)過程遠(yuǎn)比模型單純的模式匹配和梯度更新要復(fù)雜得多,其中包含了反思、遺忘和知識的內(nèi)在化。

      當(dāng)人類閱讀一本書時,并非像 LLM 那樣被動地預(yù)測下一個詞元。書本更像是一個提示,激發(fā)大腦進(jìn)行主動的思維活動和合成數(shù)據(jù)生成。我們會聯(lián)想、質(zhì)疑、與已有知識體系進(jìn)行比對和整合,甚至?xí)谂c他人的討論中深化理解。這個主動的、對信息進(jìn)行“操縱”(manipulating)的過程才是知識真正被吸收和內(nèi)化的方式。目前的 LLM 在預(yù)訓(xùn)練時完全缺乏這一環(huán)節(jié),它們只是被動地接收信息

      然而,簡單地讓 AI 模仿這個過程,即生成自己的思考并用于再訓(xùn)練,會遇到一個巨大的障礙:模型坍塌(Model Collapse)

      坍塌的本質(zhì):當(dāng)一個模型持續(xù)在自己生成的數(shù)據(jù)上進(jìn)行訓(xùn)練時,其輸出的多樣性會急劇下降。雖然單個生成樣本看起來可能很合理,但從分布上看,它們僅僅占據(jù)了所有可能輸出空間中一個極其狹窄的流形(manifold)。Karpathy 用了一個形象的例子:你讓 ChatGPT 講個笑話,它翻來覆去可能只有三五個。它的幽默感已經(jīng)坍塌了

      對學(xué)習(xí)的危害:這種坍塌意味著模型失去了熵(entropy),無法產(chǎn)生真正新穎、多樣化的想法。在合成數(shù)據(jù)生成中,這意味著模型只能在自己已知的狹小范圍內(nèi)閉門造車,無法探索新的知識領(lǐng)域,最終導(dǎo)致智力近親繁殖,模型性能不升反降

      有趣的是,Karpathy 認(rèn)為人類在一定程度上也會經(jīng)歷坍塌。兒童的思維天馬行空,因為他們尚未被社會的條條框框過度擬合。而隨著年齡增長,成年人的思維模式會越來越固化,不斷重復(fù)相同的想法,學(xué)習(xí)率下降。他推測,做夢可能正是演化出的一種對抗機制,通過創(chuàng)造離奇、超現(xiàn)實的場景來打破常規(guī)思維模式,為大腦注入必要的噪聲和熵,從而防止過度擬合

      另一個關(guān)鍵差異在于記憶與遺忘

      LLMs 是記憶天才:它們擁有近乎完美的記憶能力,可以逐字逐句地復(fù)述訓(xùn)練數(shù)據(jù)中的內(nèi)容。這種強大的記憶力,使得它們很容易被數(shù)據(jù)中的細(xì)節(jié)和噪聲分心,從而難以抓住更深層次的、可泛化的規(guī)律

      人類是健忘的:特別是兒童,他們是最好的學(xué)習(xí)者,但記憶力卻很差。我們幾乎記不住幼年時期發(fā)生的事情。Karpathy 認(rèn)為,這種健忘很可能是一種特性而非缺陷。正是因為無法輕易記住所有細(xì)節(jié),我們被迫去尋找事物背后的模式和通用原理

      基于以上觀察,Karpathy 提出了一個極具前瞻性的概念:認(rèn)知核心(Cognitive Core)。他認(rèn)為,未來 AI 研究的一個重要方向,是想辦法將模型的知識記憶與智能算法分離開來。我們應(yīng)該剝離掉模型通過預(yù)訓(xùn)練記住的大量事實性知識(這些知識可以通過外部檢索工具隨時獲取),而只保留其內(nèi)部的、處理信息的算法部分——即進(jìn)行推理、規(guī)劃、學(xué)習(xí)和解決問題的核心認(rèn)知能力

      一個理想的認(rèn)知核心可能不需要萬億級別的參數(shù)。Karpathy 大膽預(yù)測,一個僅有十億參數(shù)的純凈“認(rèn)知核心”,經(jīng)過精心設(shè)計和訓(xùn)練,其智能程度可能遠(yuǎn)超今天龐大的模型。它會像一個聰明的、但知識有限的人類,當(dāng)被問及事實性問題時,它會知道自己不知道,并主動去查詢,而不是像現(xiàn)在的模型一樣產(chǎn)生幻覺。這個更小、更純粹的智能核心,將是通向更通用、更魯棒 AI 的關(guān)鍵一步

      AGI 的經(jīng)濟影響:平滑融入 2% 的 GDP 增長,而非一夜劇變

      對于通用人工智能(AGI)將如何改變世界經(jīng)濟,Karpathy 提出了一個與主流智能爆炸論截然不同的觀點。他認(rèn)為,AGI 不會引發(fā)一場突如其來的經(jīng)濟奇點或增長率的急劇躍升,而是會像過去幾百年間的重大技術(shù)革新一樣,平滑地融入到現(xiàn)有約 2% 的全球 GDP 年增長率中

      他的核心論點是,AI 并非一種全新的、斷裂式的技術(shù),而是計算和自動化浪潮的自然延續(xù)。回顧歷史,無論是計算機的發(fā)明、互聯(lián)網(wǎng)的普及,還是智能手機的出現(xiàn),這些被我們視為革命性的技術(shù),在宏觀的 GDP 增長曲線上都未能留下一個清晰可辨的拐點。GDP 曲線呈現(xiàn)出一種驚人的平滑指數(shù)增長,這是因為:

      技術(shù)的漸進(jìn)式擴散:任何一項強大的技術(shù),從誕生到廣泛應(yīng)用,再到重塑整個社會,都需要一個漫長而漸進(jìn)的過程。例如,第一代 iPhone 并沒有應(yīng)用商店,其生態(tài)系統(tǒng)的建立花費了數(shù)年時間。技術(shù)的價值是逐步釋放的,而非一蹴而就

      社會與經(jīng)濟的適應(yīng)過程:社會結(jié)構(gòu)、法律法規(guī)、商業(yè)模式、勞動力技能的調(diào)整都需要時間。例如,放射科醫(yī)生的工作并未像 Hinton 早期預(yù)測的那樣被 AI 取代,因為這個職業(yè)遠(yuǎn)不止是圖像識別,還涉及與病人溝通、與其他醫(yī)生協(xié)作等復(fù)雜的社會性任務(wù)

      持續(xù)的自動化進(jìn)程:我們早已身處一個“遞歸式自我改進(jìn)”的時代。從工業(yè)革命的機械自動化,到編譯器的出現(xiàn)(軟件自動化),再到谷歌搜索(信息獲取自動化),人類社會一直在利用新技術(shù)加速自身的發(fā)展。LLMs 幫助工程師更高效地編寫代碼,從而加速下一代 LLMs 的開發(fā),這與工程師利用谷歌搜索或高級 IDE 提高效率在本質(zhì)上并無不同。它們都是這條持續(xù)加速曲線的一部分,而非曲線的斷裂點

      Karpathy 認(rèn)為,我們已經(jīng)處在一場持續(xù)了數(shù)十甚至數(shù)百年的智能爆炸之中,只是因為我們身在其中,所以感覺它是緩慢的。AI 只是這場爆炸的最新、也是最耀眼的火花。它使我們能夠編寫出過去無法編寫的、更柔軟和智能的程序,但它仍然是一種程序,一種新的計算范式。它將逐步自動化更多知識工作,但這個過程會充滿挑戰(zhàn)和摩擦,最終其宏觀經(jīng)濟效應(yīng)將被平均到長期的增長趨勢中

      盡管主持人 Dwarkesh Patel 提出了有力的反駁,認(rèn)為 AGI 與以往技術(shù)的根本不同在于它直接替代和創(chuàng)造了勞動力本身——這是經(jīng)濟增長的核心要素。如果可以近乎零成本地創(chuàng)造出數(shù)以億計的虛擬人才,他們可以獨立創(chuàng)辦公司、進(jìn)行科學(xué)發(fā)明、填補所有的人才缺口,這難道不會像歷史上的人口爆炸或工業(yè)革命一樣,將經(jīng)濟增長率推向一個新的數(shù)量級(例如 20%)嗎?

      Karpathy 對此表示,雖然他愿意被說服,但他仍然對這種“離散跳變”的設(shè)想持懷疑態(tài)度。他認(rèn)為,這種設(shè)想背后隱藏了一個前提,即我們將獲得一個完美的、可以被隨意部署到任何問題上的“盒子里的上帝”(God in a box)。而現(xiàn)實更有可能是,我們將得到一個能力參差不齊、在某些領(lǐng)域表現(xiàn)優(yōu)異但在另一些領(lǐng)域頻頻出錯的系統(tǒng)。它的部署將是漸進(jìn)的、充滿補丁的,最終的結(jié)果仍然是平滑的融入,而非劇烈的顛覆。他強調(diào),歷史中幾乎找不到任何重大技術(shù)能在一夜之間完美解決所有問題并帶來離散式增長的先例

      超級智能與人類未來:漸失控制與文化演進(jìn)

      當(dāng)話題轉(zhuǎn)向更遙遠(yuǎn)的未來——超級智能(Artificial Superintelligence, ASI)時,Karpathy 描繪了一幅非典型的圖景。他認(rèn)為,ASI 的到來可能不是一個單一、全能的實體掌控一切,而是一個人類逐漸喪失對復(fù)雜系統(tǒng)理解和控制權(quán)的過程

      他想象的未來并非由一個統(tǒng)一的超級智能主宰,而是由多個相互競爭、高度自治的 AI 實體構(gòu)成的一個動態(tài)、混亂的生態(tài)系統(tǒng)。這些實體可能最初是為不同的人類組織或個人服務(wù)的工具,但隨著它們的自主性越來越高,它們會開始追求自己的目標(biāo),甚至可能出現(xiàn)某些實體失控,而其他實體則需要去制衡它們。世界將變成一個由無數(shù)自主智能活動構(gòu)成的“大熔爐”(hot pot),人類逐漸無法理解其內(nèi)部的復(fù)雜動態(tài),最終失去了對整個系統(tǒng)走向的控制。這種失控并非源于一個“邪惡 AI”的惡意,而是源于系統(tǒng)復(fù)雜性的失控,類似于一個龐大而混亂的官僚體系或金融市場

      這種漸進(jìn)式的失控,與人類智能的演化歷史形成了有趣的對比。Karpathy 對智能在地球上自發(fā)演化出來感到驚訝。他提到,從細(xì)菌到更復(fù)雜的真核生物,演化花費了數(shù)十億年,這是一個巨大的瓶頸。相比之下,從多細(xì)胞動物到具備高級智能的人類,時間要短得多。這或許表明,一旦某些先決條件(如足夠的能量供應(yīng))被滿足,智能的出現(xiàn)可能并非那么偶然

      一個關(guān)鍵的觀點是,智能可能在地球上獨立演化了多次,例如在人類(哺乳動物)和鳥類(如烏鴉、鸚鵡)中。這兩種生物的大腦結(jié)構(gòu)截然不同,但都展現(xiàn)出了復(fù)雜的解決問題、使用工具和社交學(xué)習(xí)的能力。然而,只有人類走上了通往技術(shù)文明的道路。這其中的關(guān)鍵區(qū)別可能在于演化生態(tài)位(evolutionary niche)

      人類的生態(tài)位獎勵智能:直立行走解放了雙手,使得工具制造和使用成為可能;火的使用“外包”了部分消化功能,為大腦提供了更多能量;復(fù)雜的社會結(jié)構(gòu)獎勵了語言和協(xié)作能力。在這樣的環(huán)境下,大腦容量的微小增加都能帶來顯著的生存優(yōu)勢,從而形成了一個正反饋循環(huán)

      其他物種的生態(tài)位限制智能:鳥類為了飛行,大腦的尺寸受到嚴(yán)格限制;海豚生活在水中,缺乏制造復(fù)雜工具的環(huán)境。盡管它們可能擁有高效的智能算法,但缺乏一個獎勵智能無限擴展的環(huán)境

      人類智能的另一個獨特之處在于文化的積累。解剖學(xué)意義上的現(xiàn)代人類大約在 6 萬年前就已出現(xiàn),但直到 1 萬年前的農(nóng)業(yè)革命,文明才開始加速。這中間的 5 萬年,正是人類緩慢構(gòu)建文化支架的過程——通過語言、故事、藝術(shù)和最終的文字,將知識代代相傳,實現(xiàn)了跨越個體生命周期的知識積累

      目前的 LLMs 缺乏這種文化機制。它們是個體的、孤立的“天才兒童”,雖然知識淵博,但無法形成一個共同體來交流、協(xié)作和共同演進(jìn)。Karpathy 設(shè)想,未來的多智能體系統(tǒng)可能會演化出類似文化的東西:

      共享的知識庫:一個所有智能體都可以讀寫的巨型記事本

      智能體間的交流:一個 LLM 可以為另一個 LLM寫書,分享它的發(fā)現(xiàn)和見解,激發(fā)新的思想

      自我對弈:類似于 AlphaGo,一個智能體可以創(chuàng)造越來越難的問題來挑戰(zhàn)另一個智能體,從而在競爭中共同進(jìn)步

      然而,這一切實現(xiàn)的前提是,單個智能體的認(rèn)知能力必須首先達(dá)到一個成年水平。Karpathy 認(rèn)為,目前的模型仍然像是有天賦的幼兒園學(xué)生,它們的認(rèn)知結(jié)構(gòu)尚不足以支撐起一個復(fù)雜的 AI 文明

      從自動駕駛的“9的征程”看 AI 部署的真實挑戰(zhàn)

      Karpathy 在特斯拉領(lǐng)導(dǎo)自動駕駛團隊五年的經(jīng)歷,為他提供了看待 AI 技術(shù)從演示到產(chǎn)品化這一艱難過程的獨特視角。他認(rèn)為,自動駕駛是一個絕佳的案例,揭示了將 AI 部署到現(xiàn)實世界所面臨的巨大挑戰(zhàn),這些挑戰(zhàn)同樣適用于其他領(lǐng)域的 AI 應(yīng)用

      他提出了一個核心概念——“9的征程”(March of Nines)。這意味著在一個對可靠性要求極高的系統(tǒng)中,每提升一個數(shù)量級的性能(例如,從 90% 的成功率到 99%,再到 99.9%),所需要付出的努力是恒定的,甚至可能是遞增的

      巨大的演示到產(chǎn)品差距:早在 1980 年代,就已經(jīng)有了自動駕駛汽車的演示。在 2014 年,Karpathy 親身體驗了 Waymo 的早期版本,并獲得了一次近乎完美的駕駛體驗。這讓他當(dāng)時覺得問題非常接近解決。然而,從一個看起來完美的演示到一個能夠在各種天氣、路況和突發(fā)事件下安全運行的可靠產(chǎn)品,中間隔著數(shù)個“9”的距離

      恒定的努力:在特斯拉的五年里,他和團隊可能經(jīng)歷了“兩個或三個9”的迭代。每一個“9”都意味著要解決無數(shù)個長尾問題——那些罕見但致命的邊緣情況。這需要海量的數(shù)據(jù)收集、模型迭代、硬件改進(jìn)和系統(tǒng)集成工作

      因此,Karpathy 對任何 AI 技術(shù)的驚艷演示都持極其審慎的態(tài)度。一個能夠互動的演示比一個精心挑選的視頻要好,但距離真正的產(chǎn)品化仍然遙遠(yuǎn)

      他認(rèn)為,軟件工程,尤其是關(guān)鍵系統(tǒng)的開發(fā),與自動駕駛面臨著同樣的“高失敗成本”問題。人們常常認(rèn)為自動駕駛之所以進(jìn)展緩慢,是因為人命關(guān)天。但 Karpathy 指出,一個關(guān)鍵軟件系統(tǒng)的漏洞可能導(dǎo)致數(shù)百萬人的隱私泄露、金融系統(tǒng)崩潰或關(guān)鍵基礎(chǔ)設(shè)施癱瘓,其潛在危害甚至可能超過單次交通事故。因此,那種認(rèn)為軟件領(lǐng)域的 AI 應(yīng)用可以”快速迭代、不怕犯錯”的想法是天真且危險的。

      此外,自動駕駛的發(fā)展歷程也揭示了其他一些普遍性挑戰(zhàn):

      感知的魯棒性:自動駕駛系統(tǒng)花費了大量時間和資源來解決基礎(chǔ)的計算機視覺問題,確保在各種光照、天氣和遮擋條件下都能準(zhǔn)確識別物體。雖然今天的 LLMs 和 VLMs(視覺語言模型)為我們提供了強大的免費表示能力,但它們在特定領(lǐng)域的魯棒性和常識理解仍然存在大量空白需要填補

      經(jīng)濟可行性:即使技術(shù)上可行,經(jīng)濟成本也是一個巨大的障礙。Waymo 等公司之所以部署規(guī)模有限,很大程度上是因為其昂貴的傳感器套件和運營成本使其難以盈利

      隱藏的“人在環(huán)路”(Human in the Loop):公眾看到的無人駕駛汽車背后,往往有一個龐大的遠(yuǎn)程操作中心。在車輛遇到困難時,會有遠(yuǎn)程操作員介入提供幫助。從某種意義上說,人并沒有被完全移除,只是從駕駛座移動到了一個看不見的地方

      社會和法律的適應(yīng):技術(shù)還需要面對法律責(zé)任、保險、社會接受度(比如人們故意在無人車上放置交通錐)等一系列非技術(shù)性問題。

      Karpathy 總結(jié)道,自動駕駛的四十年發(fā)展史(從 1980 年代至今,且遠(yuǎn)未結(jié)束)告訴我們,任何試圖將復(fù)雜 AI 系統(tǒng)部署到現(xiàn)實世界的努力,都將是一場漫長而艱苦的“9的征程”。這讓他對自己關(guān)于 AI 發(fā)展需要十年的預(yù)測更加堅定

      教育:打造“星際艦隊學(xué)院”,賦予人類超凡能力

      面對 AI 可能帶來的顛覆性未來,Karpathy 選擇的不是創(chuàng)辦另一家 AI 實驗室,而是投身于教育事業(yè),創(chuàng)立了名為 Eureka 的機構(gòu)。他的核心動機源于一種深切的擔(dān)憂:他害怕人類在 AI 飛速發(fā)展的浪潮中被邊緣化,最終陷入像電影《機器人總動員》(Wall-E)或《蠢蛋進(jìn)化論》(Idiocracy)中所描繪的那種被動、無知的狀態(tài)。他關(guān)心的不僅是 AI 能否建造戴森球,更是人類在那個未來中的福祉和尊嚴(yán)

      他將 Eureka 的愿景比作“星際艦隊學(xué)院”(Starfleet Academy)——一個致力于培養(yǎng)前沿科技人才的精英機構(gòu)。其核心使命是重新設(shè)計教育,使其適應(yīng) AI 時代的挑戰(zhàn)和機遇

      Karpathy 認(rèn)為,未來的教育必須利用 AI,但不能簡單地將其作為一個問答工具。他以自己學(xué)習(xí)韓語的經(jīng)歷為例,闡述了一個優(yōu)秀人類導(dǎo)師所能達(dá)到的極高標(biāo)準(zhǔn):

      精準(zhǔn)的診斷:一位好的導(dǎo)師能通過簡短的交流,迅速判斷出學(xué)生的知識水平、思維模型和薄弱環(huán)節(jié)

      個性化的內(nèi)容推送:導(dǎo)師會精確地提供恰到好處的挑戰(zhàn)——既不會因為太難而讓學(xué)生受挫,也不會因為太簡單而讓學(xué)生感到無聊。學(xué)生始終處于學(xué)習(xí)效率最高的“最近發(fā)展區(qū)”

      學(xué)習(xí)者成為唯一的瓶頸:在這樣的指導(dǎo)下,學(xué)習(xí)者會感覺自己是進(jìn)步的唯一限制因素,所有外部障礙(如找不到資料、解釋不清晰)都被消除了

      他坦言,目前任何 AI 都無法達(dá)到他那位韓語導(dǎo)師的水平,因此,現(xiàn)在還不是打造終極 AI 導(dǎo)師的最佳時機。然而,這并不意味著無事可做。Eureka 的短期目標(biāo)是構(gòu)建通往知識的“斜坡”(ramps to knowledge)

      教育作為技術(shù)問題:Karpathy 將教育視為一個極其困難的技術(shù)問題,其目標(biāo)是設(shè)計出能最大化“每秒頓悟數(shù)”(Eurekas per second)的學(xué)習(xí)路徑和材料

      nanohat 為例:他最近發(fā)布的 nanohat 項目就是一個典型的“知識斜坡”。它是一個極簡但完整的 ChatGPT 復(fù)刻版,通過清晰、可讀的代碼,讓學(xué)習(xí)者能夠完整地理解構(gòu)建一個 LLM 應(yīng)用的全過程

      第一性原理教學(xué)法:他的教學(xué)方法深受物理學(xué)背景的影響。他總是試圖找到一個系統(tǒng)的“一階近似”,即抓住問題的核心本質(zhì)。例如,他的 micrograd 庫用 100 行代碼就揭示了反向傳播的全部核心思想,其余的一切(如張量、GPU 內(nèi)核)都只是為了效率而存在的。在教學(xué)時,他會先呈現(xiàn)一個最簡單的模型(如用一個二元查找表來做語言模型),然后一步步引入新的復(fù)雜性,并解釋每一步是為了解決什么問題,讓學(xué)生在痛苦中感受需求,在解決方案中獲得頓悟。

      對于 AGI 之后的遠(yuǎn)景,Karpathy 認(rèn)為教育的性質(zhì)會發(fā)生根本性變化

      從有用到有趣:當(dāng)所有經(jīng)濟活動都可以被 AI 自動化時,教育將不再是謀生的手段。它會變得像今天人們?nèi)ソ∩矸恳粯樱翰⒎菫榱丝矿w力搬運重物,而是為了健康、美觀、樂趣和自我實現(xiàn)

      人類潛能的釋放:他堅信,今天的天才們僅僅觸及了人類心智能力的皮毛。之所以大多數(shù)人無法達(dá)到更高的高度,是因為現(xiàn)有的教育體系充滿了障礙,讓人很容易受挫放棄。如果能有一個完美的 AI 導(dǎo)師,為每個人鋪平通往任何知識領(lǐng)域的道路,那么學(xué)習(xí)將變得輕松而愉快。屆時,掌握五種語言、精通大學(xué)本科所有基礎(chǔ)課程,可能會成為一種常態(tài)。

      最終,Karpathy 的愿景是,通過 Eureka 這樣的機構(gòu),培養(yǎng)出能夠在 AI 時代與機器共舞,甚至在某些方面超越機器的超人。即使在遙遠(yuǎn)的未來,人類的認(rèn)知勞動不再具有經(jīng)濟價值,這種對知識和智識的追求本身,也將成為人類文明延續(xù)和繁榮的意義所在

      參考:

      Andrej Karpathy — “We’re summoning ghosts, not building animals”

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      研究發(fā)現(xiàn)早起的一杯咖啡,可能開啟壞的一天:攝入增加竟讓老年人更痛

      研究發(fā)現(xiàn)早起的一杯咖啡,可能開啟壞的一天:攝入增加竟讓老年人更痛

      紅星新聞
      2025-12-08 13:47:24
      茅臺價格,繼續(xù)下跌

      茅臺價格,繼續(xù)下跌

      都市快報橙柿互動
      2025-12-08 10:42:34
      比黃巖島更狠!駐守338天擠走對手,這塊"長出來"的陸地到底多重要

      比黃巖島更狠!駐守338天擠走對手,這塊"長出來"的陸地到底多重要

      科普100克克
      2025-12-08 14:21:29
      泰國出動F-16戰(zhàn)機打擊柬埔寨軍事目標(biāo)

      泰國出動F-16戰(zhàn)機打擊柬埔寨軍事目標(biāo)

      環(huán)球網(wǎng)資訊
      2025-12-08 12:00:29
      已啟動!陜西適齡男子都要登記 →

      已啟動!陜西適齡男子都要登記 →

      西安觀察
      2025-12-07 23:01:14
      曾被中央通報違規(guī)聚餐飲酒致人死亡,魏栓師被開除黨籍和公職

      曾被中央通報違規(guī)聚餐飲酒致人死亡,魏栓師被開除黨籍和公職

      南方都市報
      2025-12-08 13:50:08
      雷軍:明明是人,偏要裝神

      雷軍:明明是人,偏要裝神

      麥大人
      2025-12-08 15:29:12
      為啥混混不去大公司收保護(hù)費?網(wǎng)友:大公司背后勢力他們?nèi)遣黄?>
    </a>
        <h3>
      <a href=帶你感受人間冷暖
      2025-11-16 00:15:05
      蕭敬騰和老婆一起練琴,像媽媽陪孩子,52歲林有慧年齡感很重。

      蕭敬騰和老婆一起練琴,像媽媽陪孩子,52歲林有慧年齡感很重。

      TVB的四小花
      2025-12-06 14:01:02
      日本咬住不撒口?甩出崇禎皇帝圣旨:琉球是中國藩屬國

      日本咬住不撒口?甩出崇禎皇帝圣旨:琉球是中國藩屬國

      文史微鑒
      2025-12-04 22:28:04
      全國最好的醫(yī)院排名,建議收藏!

      全國最好的醫(yī)院排名,建議收藏!

      霹靂炮
      2025-11-24 22:55:34
      朱孝天現(xiàn)身機場,網(wǎng)友對他說哈嘍老師!卻換來朱孝天的不滿和白眼

      朱孝天現(xiàn)身機場,網(wǎng)友對他說哈嘍老師!卻換來朱孝天的不滿和白眼

      樂悠悠娛樂
      2025-12-08 15:21:38
      雙胞胎認(rèn)親反目后續(xù):爸爸簽永不尋找保證書,哥哥棄房退親但原諒

      雙胞胎認(rèn)親反目后續(xù):爸爸簽永不尋找保證書,哥哥棄房退親但原諒

      鋭娛之樂
      2025-12-08 08:19:16
      錯失主力,媒體評火箭簽下史密斯略顯著急,老鷹沃克或是更好人選

      錯失主力,媒體評火箭簽下史密斯略顯著急,老鷹沃克或是更好人選

      拾叁懂球
      2025-12-08 01:19:33
      廣州房票“買爆”全城,黃埔拆遷戶半月買了600套,房票中介也做起倒賣生意

      廣州房票“買爆”全城,黃埔拆遷戶半月買了600套,房票中介也做起倒賣生意

      時代財經(jīng)
      2025-12-08 07:03:19
      泡泡瑪特股價大跌8%:Labubu稀缺性消失 4個月市值蒸發(fā)1870億港元

      泡泡瑪特股價大跌8%:Labubu稀缺性消失 4個月市值蒸發(fā)1870億港元

      雷遞
      2025-12-08 16:51:05
      不許中國賺錢,剛回法國,馬克龍威脅中方解決逆差,否則就加稅

      不許中國賺錢,剛回法國,馬克龍威脅中方解決逆差,否則就加稅

      歷史有些冷
      2025-12-08 20:10:04
      法媒:今天的中國竟然如此恐怖!法國圍繞中國展開了一場熱烈討論

      法媒:今天的中國竟然如此恐怖!法國圍繞中國展開了一場熱烈討論

      陳博世財經(jīng)
      2025-12-08 10:35:57
      26款帕拉梅拉狂降40萬!保時捷低頭,豪車信仰崩了?

      26款帕拉梅拉狂降40萬!保時捷低頭,豪車信仰崩了?

      趣味萌寵的日常
      2025-12-08 10:20:31
      摩根大通黃金交易部門,傳于上月底緊急遷至新加坡,50多名交易員及家屬在一周內(nèi)搬家

      摩根大通黃金交易部門,傳于上月底緊急遷至新加坡,50多名交易員及家屬在一周內(nèi)搬家

      新浪財經(jīng)
      2025-12-08 14:07:18
      2025-12-08 20:51:00
      AI寒武紀(jì) incentive-icons
      AI寒武紀(jì)
      專注于人工智能,科技領(lǐng)域
      1001文章數(shù) 375關(guān)注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      中方戰(zhàn)機持續(xù)雷達(dá)照射日本戰(zhàn)機目的是什么 外交部回應(yīng)

      頭條要聞

      中方戰(zhàn)機持續(xù)雷達(dá)照射日本戰(zhàn)機目的是什么 外交部回應(yīng)

      體育要聞

      一位大學(xué)美術(shù)生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經(jīng)要聞

      重磅!政治局會議定調(diào)明年經(jīng)濟工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態(tài)度原創(chuàng)

      藝術(shù)
      時尚
      親子
      數(shù)碼
      家居

      藝術(shù)要聞

      一棵樹的力量

      除了大衣,今年最火的外套一定就是它了!

      親子要聞

      小滿第一次看到大雪 今年韓國的第一場雪

      數(shù)碼要聞

      預(yù)算卡死6K-8K?別慌!雙12“甜點級”游戲本終極選購清單

      家居要聞

      有限無界 打破慣有思維

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: www.jizz国产| 日本久久香蕉一本一道| 日韩久久无码免费毛片软件| 日本天天躁天天搡久久| 久久久黄色片| 欧美日本中文| 大肉大捧一进一出视频| 中文字幕在线日亚洲9| 东北露脸91| 亚洲高清WWW色好看美女| 天天射天天日本一道| 无码内射成人免费喷射| 鲁甸县| 91无码国产成人精品| 国产普通话对白刺激| 亚洲色偷拍区另类无码专区| 人妻熟妇久久久久久精| 久久久无码专区| 国产在线观看免费观看| 无套內谢波多野结衣| 国产成人麻豆亚洲综合无码精品| 玩弄人妻少妇500系列视频| 91你懂的| 人操人人| 激情六月丁香婷婷四房播| 久久久免费精品re6| 国产伦精品一区二区三区| 亚洲口爆| 中文日韩欧美| 久久久久久AV| 又大又硬又爽免费视频| 成人美女黄网站色大免费的| 国产精成人品| 亚洲中文无码一区| 久久99精品国产.久久久久久| 蜜桃视频婷婷狼人看在线视频| 最近中文字幕免费手机版| 丰满少妇人妻无码| 国产极品美女高潮抽搐免费网站| 人妻体内射精一区二区三四| 长岭县|