<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI 大神 Karpathy 2025 年度總結刷屏:AI 既是天才也是智障,這 6 個轉折最關鍵

      0
      分享至


      最近各種年度回顧陸續上線, OpenAI 的前聯合創始人 Andrej Karpathy 也交出了自己對大模型的年度總結

      就在今年早些時候,他在 YC 的一場演講刷爆了全網,提出了不少新的觀點:

      • 軟件 3.0 已來: 從最初的人寫代碼(1.0),到喂數據訓練模型(2.0),現在我們進入了直接對模型「念咒語」(Prompt)的 3.0 時代。
      • LLM 是新操作系統: 它不是像自來水一樣的普通商品,而是一個負責調度內存(Context Window)和 CPU(推理算力)的復雜 OS。
      • Agent 的十年: 別指望 AI Agent 一年就成熟,從 99% 到 99.999% 的可靠性,我們需要走上十年。

      Karpathy 今天這篇《2025 年度總結》,他再次向我我們剖析了這一年 AI 究竟長出了什么樣的「腦子」。

      以下是對 Karpathy 年度總結的精譯,APPSO 在不改變原意的基礎上做了更多通俗解讀。

      如果想看原文可以點擊 https://karpathy.bearblog.dev/year-in-review-2025/

      2025 年是 LLM(大語言模型)發展強勁且充滿變數的一年。以下是我列出的幾點個人認為值得注意且稍感意外的「范式轉變」——這些變化不僅重塑了行業版圖,更在概念層面上狠狠地沖擊了我的認知。

      太長不看版:

      2025 年既讓人興奮,又有點讓人措手不及。

      LLM 正在作為一種新型智能涌現,它同時比我預期的要聰明得多,也比我預期的要笨得多。

      無論如何,它們極其有用。我認為即使以目前的能力,行業甚至還沒挖掘出其潛力的 10%。同時,還有太多的想法可以嘗試,從概念上講,這個領域感覺依然廣闊。正如我今年早些時候提到的,我同時(表面上矛盾地)相信:我們將看到持續快速的進步,但前方仍有大量艱苦的工作要做。

      系好安全帶,我們要發車了。

      1. RLVR:教 AI 像做奧數題一樣「思考」

      在解釋這個復雜的基礎概念之前,先看看以前是大模型訓練是怎么做的?

      在 2025 年初,各大實驗室訓練 LLM 的「老三樣」配方非常穩定:

      1. 預訓練(Pretraining):像 GPT-3 那樣,讓 AI 讀遍全網文章,學會說話。

      2. 監督微調(SFT):找人寫好標準答案,教 AI 怎么回答問題。

      3. 人類反饋強化學習(RLHF):讓 AI 生成幾個答案,人來打分,教它討人喜歡。

      現在發生了什么變化?

      2025 年,我們在這個配方里加了一味猛藥:RLVR(從可驗證獎勵中進行強化學習)。

      這是什么意思?

      簡單來說,就是不再讓人來打分(人太慢且主觀),而是讓 AI 去做那些「有標準答案」的任務,比如數學題或寫代碼。對就是對,錯就是錯,機器能自動驗證。

      在數百萬次的自我博弈和試錯中,模型自發地演化出了看似「推理」的策略。它們學會了先把大問題拆解成小步驟,甚至學會了「回過頭來檢查」這種高級技巧(參考 DeepSeek R1 論文)。

      核心對比:

      • 舊范式(RLHF): 像是教小孩寫作文。因為沒有標準答案,AI 很難知道自己哪一步想錯了,只能模仿人類的語氣。
      • 新范式(RLVR): 像是把 AI 關進奧數訓練營。不用教它具體怎么想,只要給它足夠多的題和對錯反饋,它自己就能摸索出解題套路。

      這一招太好用了,以至于 2025 年大部分算力都被這只「吞金獸」吃掉了。結果就是:模型并沒有變大,但訓練時間變長了。 我們還獲得了一個新旋鈕:讓 AI 思考得久一點。OpenAI 的 o1 是開端,而 o3 則是真正的拐點。

      2. 幽靈 vs 動物:AI 不是「電子寵物」

      2025 年,我和整個行業終于從直覺上理解了 LLM 智能的「形狀」。

      一個驚悚的比喻:我們不是在像養寵物一樣「進化/養育動物」,我們是在「召喚幽靈」

      為什么這么說?

      因為 AI 的一切都和生物不同。人類的大腦是為了在叢林里活下來、為了繁衍后代而優化的;而 LLM 的大腦是為了模仿人類文字、在數學題里拿分、在競技場里騙贊而優化的。

      參差不齊的智能(Jagged Intelligence):

      正是因為 RLVR(可驗證獎勵)的存在,AI 的能力在某些領域(如數學、編程)會突然飆升成刺狀。這就導致了一種極其滑稽的現象:

      • 它同時是一個絕世天才(秒解高數題);
      • 又是一個智障小學生(會被簡單的邏輯陷阱騙得團團轉)。


      ▲這里 Karpathy 引用了一張梗圖:人類智能是圓潤的藍色圓圈,AI 智能是像海膽一樣滿是尖刺的紅色圖形。這很形象.

      這也解釋了為什么我對現在的「跑分榜單」(Benchmarks)失去了信任。

      什么是「刷榜」的本質?

      既然榜單是可驗證的,那就可以用 RLVR 針對性訓練。現在的實驗室都在搞「應試教育」,把 AI 的能力尖刺專門往考題上長。「在測試集上訓練」已經不僅僅是作弊,而成了一門新的藝術形式。

      3. Cursor:不僅是編輯器,更是「包工頭」


      Cursor 今年的爆火,揭示了一個新真相:LLM 應用層比我們想象的要厚。

      大家開始談論「醫療界的 Cursor」、「法律界的 Cursor」。這些應用到底做了什么?

      • 「上下文工程師」: 幫你整理好所有背景資料喂給 AI。
      • 「工頭」: 在后臺偷偷指揮多個 LLM 干活,把復雜任務拆解,還要幫你省錢。
      • 「遙控器」: 給你一個調節「自主性」的滑塊,決定放手讓 AI 干多少。

      預測:大模型實驗室(如 OpenAI)會負責培養「全科大學生」;而應用開發商(如 Cursor)則負責給這些學生提供私有數據和工具,把他們組建成「專業施工隊」

      4. Claude Code:住在你電腦里的「賽博幽靈」


      Claude Code (CC) 的出現讓我眼前一亮。它不僅僅是一個能寫代碼的 Agent(智能體),更重要的是:它活在你的電腦里

      對比來看,我認為OpenAI 搞錯了方向。

      OpenAI 早期的 Agent 都在云端跑(ChatGPT),離你的真實環境太遠。雖然云端智能體聽起來像是 AGI 的終局,但在當前這個「參差不齊」的過渡階段,本地才是王道。

      為什么本地很重要?

      因為你的代碼、你的配置、你的密鑰、你的混亂環境,都在本地。Anthropic(Claude 的母公司)搞對了優先級,他們把 AI 塞進了一個小小的命令行界面(CLI)里。

      它不再是你瀏覽器里的一個網頁(像 Google 那樣),它變成了一個寄宿在你電腦里的「賽博幽靈」,隨時準備幫你干活。這才是未來 AI 交互的樣子。

      5. Vibe Coding

      什么是 Vibe Coding?

      這是我在推特上隨口造的一個詞(居然火了):意思是寫代碼不再需要你真的懂語法,你只需要用英語描述你的「意圖」和「感覺」,剩下的交給 AI。

      這帶來了什么改變?

      • 對于普通人: 編程的門檻徹底消失了。
      • 對于專家: 代碼變得像紙巾一樣「廉價、一次性、用完即棄」。

      舉個例子,我為了找一個 Bug,可能會讓 AI 現場寫一個專門的 App 來測試,測完就刪。放在以前,為了找個 Bug 專門寫個 App?瘋了吧!但在 2025 年,代碼是免費的。

      Vibe Coding 將會徹底重塑軟件行業,也會改寫程序員的招聘 JD。

      6. Nano Banana:AI 終于有了自己的「臉」


      為什么現在的 AI 交互很反人類?

      不管是 ChatGPT 還是 Claude,我們還在用「打字」跟它們聊天。這就像 80 年代還在用 DOS 命令行的黑底白字。

      事實是: 計算機喜歡文本,但人類討厭讀文本。人類是視覺動物,我們喜歡看圖、看表、看視頻。

      Google Gemini Nano banana(這是一個虛構的模型代號,指代某種多模態交互模型)是 2025 年的另一個范式轉變。它暗示了未來的 LLM GUI(圖形界面) 是什么樣子的

      未來的 AI 不應該給你吐一堆字,它應該直接給你畫一張圖、生成一個網頁、彈出一個交互面板。 這不僅僅是「畫圖」,而是將文本生成、邏輯推理和視覺表達糾纏在一起的混合能力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      水均益到泉州女婿家做客,和前妻同框還抱外孫女,對女婿稱呼疏離

      水均益到泉州女婿家做客,和前妻同框還抱外孫女,對女婿稱呼疏離

      李佳康
      2025-12-18 01:35:59
      張維為:美國已經力不從心、經濟在收縮、已經面臨崩潰的邊緣!

      張維為:美國已經力不從心、經濟在收縮、已經面臨崩潰的邊緣!

      翻開歷史和現實
      2025-12-19 16:39:41
      2026跨境匯款雙重沖擊:美國1%稅+中國5000元實名,華人如何破局

      2026跨境匯款雙重沖擊:美國1%稅+中國5000元實名,華人如何破局

      最英國
      2025-12-20 18:05:46
      翁帆新消息傳來,太令人驚喜了

      翁帆新消息傳來,太令人驚喜了

      深度報
      2025-12-18 22:35:44
      王小騫崩潰大哭!11歲女兒患上“正食癥”,心率高達120心肌損傷

      王小騫崩潰大哭!11歲女兒患上“正食癥”,心率高達120心肌損傷

      振華觀史
      2025-12-20 10:26:23
      為什么廣東人離不開垃圾食品:粥

      為什么廣東人離不開垃圾食品:粥

      食味藝文志
      2025-12-20 12:17:29
      愛潑斯坦檔案曝光克林頓驚人照片

      愛潑斯坦檔案曝光克林頓驚人照片

      小鬼頭體育
      2025-12-20 09:28:49
      大風、暴雪來襲!湖北氣溫暴跌10℃

      大風、暴雪來襲!湖北氣溫暴跌10℃

      湖北e家庭
      2025-12-20 11:06:11
      男子日租房內吸食“笑氣”后跳樓身亡 父母起訴經營者索賠近30萬元 一審被駁回

      男子日租房內吸食“笑氣”后跳樓身亡 父母起訴經營者索賠近30萬元 一審被駁回

      紅星新聞
      2025-12-20 18:05:19
      外國人對中國的誤解有多深?網友:很多時候感覺外國人也挺沒見識

      外國人對中國的誤解有多深?網友:很多時候感覺外國人也挺沒見識

      帶你感受人間冷暖
      2025-12-20 00:10:07
      找到證據!一幅傳世名畫從龐家6800元賤賣,如今成陸家8000萬遺產

      找到證據!一幅傳世名畫從龐家6800元賤賣,如今成陸家8000萬遺產

      熱點菌本君
      2025-12-19 20:03:24
      一高中生全飛秒近視手術成功,40天后失明,醫生指出她犯了5個錯

      一高中生全飛秒近視手術成功,40天后失明,醫生指出她犯了5個錯

      健康科普365
      2025-12-19 07:20:07
      貴妃帶5歲男孩亮相,塌鼻子厚嘴唇酷似年幼泰王,曾與提幫功一起

      貴妃帶5歲男孩亮相,塌鼻子厚嘴唇酷似年幼泰王,曾與提幫功一起

      阿纂看事
      2025-12-20 13:50:05
      順豐主動放棄抖音電商退貨業務 順豐員工:接手者也不好干

      順豐主動放棄抖音電商退貨業務 順豐員工:接手者也不好干

      快科技
      2025-12-20 13:24:04
      又老又丑,連普通話都說不好,為何能讓千億富豪對她情有獨鐘?

      又老又丑,連普通話都說不好,為何能讓千億富豪對她情有獨鐘?

      素衣讀史
      2025-12-20 16:26:36
      轉發野三坡隧道事故視頻被要求刪除,還有網友稱發生了爆炸

      轉發野三坡隧道事故視頻被要求刪除,還有網友稱發生了爆炸

      映射生活的身影
      2025-12-20 19:18:13
      央企“最牛女副處長”落馬:兩年與上司開房410次,細節曝光

      央企“最牛女副處長”落馬:兩年與上司開房410次,細節曝光

      西門老爹
      2025-12-16 15:35:31
      何晴頭七,許亞軍老婆發最新動態太扎心,史曉燕的話開始有人信了

      何晴頭七,許亞軍老婆發最新動態太扎心,史曉燕的話開始有人信了

      老吳教育課堂
      2025-12-20 00:56:05
      明天開始,運勢大爆發!3生肖前程似錦,財運扎堆來

      明天開始,運勢大爆發!3生肖前程似錦,財運扎堆來

      人閒情事
      2025-12-20 14:18:21
      關窗!關窗!馬上抵達深圳

      關窗!關窗!馬上抵達深圳

      深圳晚報
      2025-12-20 18:04:16
      2025-12-20 21:43:00
      愛范兒 incentive-icons
      愛范兒
      消費科技第一媒體
      38199文章數 2600425關注度
      往期回顧 全部

      科技要聞

      許四清:具身智能的"ChatGPT時刻"還未到來

      頭條要聞

      網友稱"燒傷超人阿寶"補繳稅款84萬余元 當事人發聲

      頭條要聞

      網友稱"燒傷超人阿寶"補繳稅款84萬余元 當事人發聲

      體育要聞

      我開了20年大巴,現在是一名西甲主帥

      娛樂要聞

      2026央視跨年晚會陣容曝光,豪華陣仗

      財經要聞

      求解“地方財政困難”

      汽車要聞

      嵐圖推進L3量產測試 已完成11萬公里實際道路驗證

      態度原創

      游戲
      本地
      親子
      手機
      公開課

      《機甲戰魔:神話之裔》更新檔發布 添加BOSS挑戰

      本地新聞

      云游安徽|訪黃山云海古村,讀一城山水風骨

      親子要聞

      韓紅為小洛熙發聲:錯得太離譜!尸檢報告曝光,5月嬰兒本可痊愈

      手機要聞

      銷量破260萬登頂國產!小米17系列:Pro Max占比50%的旗艦勝利

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美黑人又粗又大的性格特点| 国产精品久久国产精麻豆99网站| 在线观看亚洲天堂| 久久青青草原国产毛片| 在线观看国产精品日韩av| 中文字幕A片免费观看| 免费看无码自慰一区二区| 牲欲强的熟妇农村老妇女视频| 国产精品香港三级国产av| 妇女bbbbb撒尿正面视频 | 色欲aⅴ亚洲情无码av蜜桃| 天天综合久久| 99在线视频免费观看| 99久久精品免费看国产一区二区三区| 欧美一二三区| 天天躁日日躁狠狠躁中文字幕 | 无码精品黑人| 免费超爽大片黄| 91精品国产情侣高潮露脸| 亚洲精品成人a在线观看| 日日夜夜影院| 久久久国产成人一区二区| 国产精品久久久久久影视| 两个人看的www免费视频中文| 中国少妇人妻xxxxx| 亚洲暴爽av天天爽日日碰| 18禁免费无码无遮挡不卡网站 | 国产精品疯狂输出jk草莓视频| 国产亚洲精品久久久久婷婷瑜伽| 人妻少妇视频| 无码中文字幕人妻在线一区| 99国产精品无码| 亚洲欧美日韩国产手机在线| 溧阳市| 制服.丝袜.亚洲.中文.综合| 国产精品露脸视频观看| 狂躁女人双腿流白色液体| 成人做爰视频www网站小优视频| 激情久久av一区av二区av三区| 欧美狠狠撸| 亚洲美女视频在线|