<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Open聯(lián)合創(chuàng)始人:AI大模型2025年度回顧

      0
      分享至

      Andrej Karpathy 是 OpenAI 聯(lián)合創(chuàng)始人、前特斯拉 AI 總監(jiān),也是全球最有影響力的 AI 研究者之一。他剛剛發(fā)布了一篇 2025 年 LLM 年度回顧。

      我推薦每一個(gè)AI產(chǎn)品經(jīng)理都學(xué)習(xí),這里翻譯為中文如下

      第一個(gè)大變化:訓(xùn)練方法的范式升級(jí)

      2025 年之前,訓(xùn)練一個(gè)好用的大模型基本是三步走:預(yù)訓(xùn)練、監(jiān)督微調(diào)、人類反饋強(qiáng)化學(xué)習(xí)。

      這個(gè)配方從 2020 年用到現(xiàn)在,穩(wěn)定可靠。

      2025 年多了關(guān)鍵的第四步:RLVR,全稱是 Reinforcement Learning from Verifiable Rewards,翻譯過來就是「可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)」。

      什么意思?簡(jiǎn)單說,就是讓模型在「有標(biāo)準(zhǔn)答案」的環(huán)境里反復(fù)練習(xí)。比如數(shù)學(xué)題,答案對(duì)就是對(duì),錯(cuò)就是錯(cuò),不需要人來打分。

      代碼也一樣,能跑通就是能跑通。

      這和之前的訓(xùn)練有什么本質(zhì)區(qū)別?之前的監(jiān)督微調(diào)和人類反饋,本質(zhì)上是「照葫蘆畫瓢」,人給什么樣本,模型學(xué)什么樣本。但 RLVR 不一樣,它讓模型自己摸索出解題策略。

      就像學(xué)游泳,之前是看教學(xué)視頻模仿動(dòng)作,現(xiàn)在是直接扔水里,只要你能游到對(duì)岸,怎么劃水我不管。

      結(jié)果呢?模型自己「悟」出了看起來像推理的東西。它學(xué)會(huì)了把大問題拆成小步驟,學(xué)會(huì)了走錯(cuò)路時(shí)回頭重來。這些策略如果靠人類標(biāo)注示范,根本標(biāo)不出來,因?yàn)槿俗约阂舱f不清「正確的思考過程」長(zhǎng)什么樣。

      這個(gè)變化帶來一個(gè)連鎖反應(yīng):算力的分配方式變了。以前大部分算力砸在預(yù)訓(xùn)練階段,現(xiàn)在越來越多算力用于 RL 階段。

      模型的參數(shù)規(guī)模沒怎么漲,但推理能力飆升。OpenAI 的 o1 是這條路的起點(diǎn),o3 是真正讓人「感覺到不一樣」的拐點(diǎn)。

      還有個(gè)新玩法:推理時(shí)也能花更多算力。讓模型「想久一點(diǎn)」,生成更長(zhǎng)的推理鏈條,效果就更好。這相當(dāng)于多了一個(gè)調(diào)節(jié)能力的旋鈕。

      第二個(gè)大變化:我們終于搞懂了 AI 是什么「形狀」的聰明

      Karpathy 用了一個(gè)很妙的比喻:我們不是在「養(yǎng)動(dòng)物」,而是在「召喚幽靈」,人類的智能是進(jìn)化出來的,優(yōu)化目標(biāo)是「在叢林里讓部落活下去」。

      大模型的智能是訓(xùn)練出來的,優(yōu)化目標(biāo)是「模仿人類文本、在數(shù)學(xué)題里拿分、在評(píng)測(cè)榜單上刷分」。

      優(yōu)化目標(biāo)完全不同,出來的東西當(dāng)然也完全不同。

      所以 AI 的智能是「參差不齊」的,英文叫 jagged intelligence。它可以在某些領(lǐng)域表現(xiàn)得像全知全能的學(xué)者,同時(shí)在另一些領(lǐng)域犯小學(xué)生都不會(huì)犯的錯(cuò)。上一秒幫你推導(dǎo)復(fù)雜公式,下一秒被一個(gè)簡(jiǎn)單的越獄提示騙走你的數(shù)據(jù)。

      為什么會(huì)這樣?因?yàn)槟膫€(gè)領(lǐng)域有「可驗(yàn)證的獎(jiǎng)勵(lì)」,模型在那個(gè)領(lǐng)域就會(huì)長(zhǎng)出「尖刺」。

      數(shù)學(xué)有標(biāo)準(zhǔn)答案,代碼能跑測(cè)試,所以這些領(lǐng)域進(jìn)步飛快。但常識(shí)、社交、創(chuàng)意這些領(lǐng)域,什么是「對(duì)」很難定義,模型就沒法高效學(xué)習(xí)。

      這也讓 Karpathy 對(duì)基準(zhǔn)測(cè)試失去了信任。道理很簡(jiǎn)單:測(cè)試題本身就是「可驗(yàn)證環(huán)境」,所有基準(zhǔn)都刷滿了,但離真正的通用智能還差得遠(yuǎn),這是完全可能發(fā)生的事。

      第三個(gè)大變化:LLM 應(yīng)用層浮出水面

      Cursor 今年火得一塌糊涂,但 Karpathy 認(rèn)為它最大的意義不是產(chǎn)品本身,而是證明了「LLM 應(yīng)用」這個(gè)新物種的存在。

      大家開始討論「X 領(lǐng)域的 Cursor」,這說明一種新的軟件范式成立了。這類應(yīng)用做什么?

      • 第一,做上下文工程。把相關(guān)信息整理好,喂給模型。

      • 第二,編排多個(gè)模型調(diào)用,后臺(tái)可能串了一堆 API 調(diào)用,平衡效果和成本。

      • 第三,提供專業(yè)場(chǎng)景的界面,讓人類能在關(guān)鍵節(jié)點(diǎn)介入。

      • 第四,給用戶一個(gè)「自主程度滑桿」。

      你可以讓它多干點(diǎn),也可以讓它少干點(diǎn)。 有個(gè)問題被討論了一整年:這個(gè)應(yīng)用層有多「厚」?模型廠商會(huì)不會(huì)把所有應(yīng)用都吃掉?

      Karpathy 的判斷是:模型廠商培養(yǎng)的是「有通用能力的大學(xué)畢業(yè)生」,但 LLM 應(yīng)用負(fù)責(zé)把這些畢業(yè)生組織起來、培訓(xùn)上崗,變成能在具體行業(yè)干活的專業(yè)團(tuán)隊(duì)。數(shù)據(jù)、傳感器、執(zhí)行器、反饋循環(huán),這些都是應(yīng)用層的活。

      第四個(gè)大變化:AI 搬進(jìn)了你的電腦 Claude Code 是今年最讓 Karpathy 印象深刻的產(chǎn)品之一。

      它展示了「AI 智能體」應(yīng)該長(zhǎng)什么樣:能調(diào)用工具、能做推理、能循環(huán)執(zhí)行、能解決復(fù)雜問題。

      但更關(guān)鍵的是,它跑在你的電腦上。用你的環(huán)境、你的數(shù)據(jù)、你的上下文。 Karpathy 認(rèn)為 OpenAI 在這里判斷失誤了。他們把 Codex 和智能體的重心放在云端容器里,從 ChatGPT 去調(diào)度。這像是在瞄準(zhǔn)「AGI 終局」,但我們還沒到那一步。

      現(xiàn)實(shí)是,AI 的能力還是參差不齊的,還需要人類在旁邊看著、配合著干活。把智能體放在本地,和開發(fā)者并肩工作,才是當(dāng)下更合理的選擇。 Claude Code 用一個(gè)極簡(jiǎn)的命令行界面做到了這一點(diǎn)。

      AI 不再只是你訪問的一個(gè)網(wǎng)站,而是「住在」你電腦里的一個(gè)小精靈。這是一種全新的人機(jī)交互范式。

      第五個(gè)大變化:Vibe Coding 起飛了 2025 年,AI 的能力跨過了一個(gè)門檻:你可以純用英語描述需求,讓它幫你寫程序,完全不用管代碼長(zhǎng)什么樣。Karpathy 隨手發(fā)了條推特,給這種編程方式起了個(gè)名字叫 vibe coding,結(jié)果這個(gè)詞火遍全網(wǎng)。

      這意味著什么?編程不再是專業(yè)程序員的專利,普通人也能做。這和過去所有技術(shù)的擴(kuò)散模式都不一樣。以前新技術(shù)總是先被大公司、政府、專業(yè)人士掌握,然后才慢慢下沉。但大模型反過來,普通人從中受益的比例遠(yuǎn)超專業(yè)人士。

      不只是「讓不會(huì)編程的人能編程」。對(duì)會(huì)編程的人來說,很多以前「不值得寫」的小程序現(xiàn)在都值得寫了。

      Karpathy 自己就用 vibe coding 做了一堆項(xiàng)目:用 Rust 寫了個(gè)定制的分詞器、做了好幾個(gè)工具類 App、甚至寫了一次性的程序只為找一個(gè) bug。 代碼突然變得廉價(jià)、即用即棄、像草稿紙一樣隨便寫。

      這會(huì)徹底改變軟件的形態(tài)和程序員的工作內(nèi)容。

      第六個(gè)大變化:大模型的「圖形界面時(shí)代」要來了 Google 的 Gemini Nano Banana 是今年最被低估的產(chǎn)品之一。

      它能根據(jù)對(duì)話內(nèi)容實(shí)時(shí)生成圖片、信息圖、動(dòng)畫,把回復(fù)「畫」出來而不是「寫」出來。 Karpathy 把這件事放到更大的歷史脈絡(luò)里看:大模型是下一個(gè)重大計(jì)算范式,就像 70 年代、80 年代的計(jì)算機(jī)一樣。所以我們會(huì)看到類似的演進(jìn)路徑。 現(xiàn)在和大模型「聊天」,有點(diǎn)像 80 年代在終端敲命令。文字是機(jī)器喜歡的格式,但不是人喜歡的格式。

      人其實(shí)不愛讀文字,讀文字又慢又累。人喜歡看圖、看視頻、看空間布局。這就是傳統(tǒng)計(jì)算機(jī)為什么要發(fā)明圖形界面。 大模型也需要自己的「GUI」。

      它應(yīng)該用我們喜歡的方式跟我們說話:圖片、幻燈片、白板、動(dòng)畫、小應(yīng)用。現(xiàn)在的 Emoji 和 Markdown 只是初級(jí)形態(tài),幫文字「化個(gè)妝」。真正的 LLM GUI 會(huì)是什么樣?Nano Banana 是一個(gè)早期暗示。 最有意思的是,這不只是圖像生成的事。它需要把文本生成、圖像生成、世界知識(shí)全部絞在一起,在模型權(quán)重里融為一體。

      Karpathy 的總結(jié)是這樣的:2025 年的大模型,比他預(yù)期的聰明,也比他預(yù)期的蠢。兩者同時(shí)成立。 但有一點(diǎn)很確定:即使以現(xiàn)在的能力,我們連 10% 的潛力都沒挖掘出來。

      還有太多想法可以試,整個(gè)領(lǐng)域感覺是敞開的。

      他在 Dwarkesh 的播客里說過一句看似矛盾的話: > 他相信進(jìn)步會(huì)繼續(xù)飛速推進(jìn), > 同時(shí)也相信還有大量的工作要做。

      兩件事并不矛盾。2026 年系好安全帶繼續(xù)加速吧。

      “分享產(chǎn)品經(jīng)理改變世界的點(diǎn)滴”

      產(chǎn)品顧問| 產(chǎn)品咨詢|培訓(xùn)合作

      請(qǐng)?zhí)砑游⑿? PMxiaowanzi

      最近我的原創(chuàng)

      每日案例拆解庫(kù),AI等產(chǎn)品打卡群

      我創(chuàng)建的產(chǎn)品設(shè)計(jì)打卡社群,加入后365天,每天體驗(yàn)一款A(yù)PP。提升產(chǎn)品設(shè)計(jì)能力,同時(shí)有1300份體驗(yàn)報(bào)告幫助你找到競(jìng)品

      在這里你可以隨時(shí)查詢到你想找的各類競(jìng)品行業(yè)APP,無須自己親自下載就可以馬上得到APP的一手產(chǎn)品優(yōu)化、交互設(shè)計(jì)、功能描述信息。

      從優(yōu)化&建議、商業(yè)模式、運(yùn)營(yíng)、功能描述、交互設(shè)計(jì)、產(chǎn)品定位至少6個(gè)維度,體驗(yàn)一款應(yīng)用。

      平均1天1塊錢,掃碼購(gòu)買即可加入

      連續(xù)體驗(yàn)48款應(yīng)用,通過后原路退回


      報(bào)名后添加星球助理

      PMTalk123

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      吊帶紅裙,性感尤物

      吊帶紅裙,性感尤物

      吃瓜黨二號(hào)頭目
      2026-01-09 09:59:03
      “慰安婦”韋紹蘭:忍辱生下日本兵后代,兒子:母親去世就喝農(nóng)藥

      “慰安婦”韋紹蘭:忍辱生下日本兵后代,兒子:母親去世就喝農(nóng)藥

      何氽簡(jiǎn)史
      2025-12-31 18:45:15
      董卓巔峰時(shí)陣容有多牛?麾下兩個(gè)頂級(jí)謀士、三位元帥、十余名猛將

      董卓巔峰時(shí)陣容有多牛?麾下兩個(gè)頂級(jí)謀士、三位元帥、十余名猛將

      銘記歷史呀
      2025-12-16 18:54:04
      公公重傷入院,婆婆求70萬救命錢,我揭穿錢款已被她挪用給小叔購(gòu)車

      公公重傷入院,婆婆求70萬救命錢,我揭穿錢款已被她挪用給小叔購(gòu)車

      磊子講史
      2026-01-09 17:38:39
      美ICE特工射殺女子事件持續(xù)發(fā)酵,“綠巨人”等名人在紅毯上佩戴胸針抗議ICE

      美ICE特工射殺女子事件持續(xù)發(fā)酵,“綠巨人”等名人在紅毯上佩戴胸針抗議ICE

      環(huán)球網(wǎng)資訊
      2026-01-12 11:13:05
      65歲農(nóng)村老太坐高鐵商務(wù)座遭富人譏笑,子女趕來后,眾人傻眼

      65歲農(nóng)村老太坐高鐵商務(wù)座遭富人譏笑,子女趕來后,眾人傻眼

      蘭姐說故事
      2025-07-01 20:10:07
      決戰(zhàn)泰國(guó)隊(duì)前,U23國(guó)足先迎來一個(gè)重大喜訊,亞洲杯出線徹底穩(wěn)了

      決戰(zhàn)泰國(guó)隊(duì)前,U23國(guó)足先迎來一個(gè)重大喜訊,亞洲杯出線徹底穩(wěn)了

      零度眼看球
      2026-01-13 06:41:33
      廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

      廣西一精神小妹結(jié)婚,身上多處紋身新郎小她10歲,網(wǎng)友:相當(dāng)炸裂

      唐小糖說情感
      2026-01-07 16:37:28
      中產(chǎn)「大逃殺」,正在席卷全球

      中產(chǎn)「大逃殺」,正在席卷全球

      鳳凰WEEKLY
      2026-01-12 17:59:36
      千萬不要過度體檢?醫(yī)生再三提醒:55歲后,這5種體檢能不做就不做

      千萬不要過度體檢?醫(yī)生再三提醒:55歲后,這5種體檢能不做就不做

      神奇故事
      2025-12-30 23:09:45
      49歲“李小冉”也太凡爾賽了吧!穿羽絨服配牛仔褲,漫畫腿太搶鏡

      49歲“李小冉”也太凡爾賽了吧!穿羽絨服配牛仔褲,漫畫腿太搶鏡

      蓓小西
      2026-01-12 09:21:07
      張雨綺穿吊帶看著骨架有點(diǎn)大哦!這大體格誰看了不喜歡?

      張雨綺穿吊帶看著骨架有點(diǎn)大哦!這大體格誰看了不喜歡?

      草莓解說體育
      2025-12-21 00:52:27
      人美戲好的她,為啥紅不了?

      人美戲好的她,為啥紅不了?

      民間平哥
      2026-01-12 20:21:51
      將帥失和致阿隆索下課,弗洛倫蒂諾仍期待“齊達(dá)內(nèi)式救贖”

      將帥失和致阿隆索下課,弗洛倫蒂諾仍期待“齊達(dá)內(nèi)式救贖”

      足球報(bào)
      2026-01-13 11:40:57
      “死了么”APP開發(fā)者回應(yīng)網(wǎng)友喊話改名:不太想改名,該APP偏向年輕群體,會(huì)針對(duì)中老年人群體單獨(dú)開發(fā)新產(chǎn)品

      “死了么”APP開發(fā)者回應(yīng)網(wǎng)友喊話改名:不太想改名,該APP偏向年輕群體,會(huì)針對(duì)中老年人群體單獨(dú)開發(fā)新產(chǎn)品

      觀威海
      2026-01-12 10:14:04
      講一個(gè)知名女星揭發(fā)眾導(dǎo)演X交易,被逼到退圈的故事

      講一個(gè)知名女星揭發(fā)眾導(dǎo)演X交易,被逼到退圈的故事

      仙味少女心
      2026-01-11 10:29:31
      注意!業(yè)績(jī)預(yù)虧密集發(fā)布,有公司巨虧

      注意!業(yè)績(jī)預(yù)虧密集發(fā)布,有公司巨虧

      數(shù)據(jù)寶
      2026-01-13 10:52:41
      71歲的成龍,已準(zhǔn)備好告別

      71歲的成龍,已準(zhǔn)備好告別

      藍(lán)鉆故事
      2026-01-13 00:04:46
      臺(tái)中藍(lán)營(yíng)“宮斗大戲”:江啟臣施壓翻車,鄭麗文霸氣破局!

      臺(tái)中藍(lán)營(yíng)“宮斗大戲”:江啟臣施壓翻車,鄭麗文霸氣破局!

      天啟談古說今
      2026-01-12 19:19:50
      委內(nèi)瑞拉宣布釋放116名罪犯,以展示“和平姿態(tài)”

      委內(nèi)瑞拉宣布釋放116名罪犯,以展示“和平姿態(tài)”

      揚(yáng)子晚報(bào)
      2026-01-12 23:59:02
      2026-01-13 12:12:49
      Kevin改變世界的點(diǎn)滴 incentive-icons
      Kevin改變世界的點(diǎn)滴
      每周一次,產(chǎn)品案例與經(jīng)驗(yàn)分享
      213文章數(shù) 8關(guān)注度
      往期回顧 全部

      科技要聞

      每年10億美元!谷歌大模型注入Siri

      頭條要聞

      業(yè)主花400多萬買新房:還沒交付 半年資產(chǎn)縮水百萬

      頭條要聞

      業(yè)主花400多萬買新房:還沒交付 半年資產(chǎn)縮水百萬

      體育要聞

      阿隆索得知下課后先是驚訝 然后表示如釋重負(fù)

      娛樂要聞

      周杰倫以球員身份參加澳網(wǎng),C位海報(bào)公開

      財(cái)經(jīng)要聞

      中國(guó)一口氣申報(bào)20萬顆衛(wèi)星,意味著什么?

      汽車要聞

      吉利持續(xù)加碼億咖通 智能化海外布局提速

      態(tài)度原創(chuàng)

      旅游
      親子
      本地
      教育
      房產(chǎn)

      旅游要聞

      廈門與哈爾濱聯(lián)手打造10條精品線路

      親子要聞

      2026年“博學(xué)杯”全國(guó)幼兒閱讀大會(huì)西南區(qū)域賽在彌勒?qǐng)A滿落幕!

      本地新聞

      云游內(nèi)蒙|到巴彥淖爾去,赴一場(chǎng)塞上江南的邀約

      教育要聞

      哈爾濱中考體育統(tǒng)一測(cè)試在即,考生該選啥項(xiàng)目?家長(zhǎng)如何準(zhǔn)備?

      房產(chǎn)要聞

      重磅調(diào)規(guī)!417畝商改住+教育地塊!海口西海岸又要爆發(fā)!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 全部孕妇毛片丰满孕妇孕交| 少妇人妻综合久久中文字幕| 国产在线精品熟女 | 大桥未久亚洲无av码在线| 极品妇女扒开粉嫩小泬 | 无码人妻丰满熟妇精品区| 成人av一区二区三区| 被黑人伦流澡到高潮HNP动漫| 国产精品亚洲精品日韩已方| 彩票| 97人人模人人爽人人喊网| 69久蜜桃人妻无码精品一区| 亚洲人妻在线一区二区| 亚洲男人在线| 男男车车的车车网站w98免费 | 亚洲va国产va天堂va久久| 樱花AV在线无码| AV无码不卡一区二区三区| 亚洲欧美综合中文| 99视频精品全部免费 在线| 色婷婷综合激情视频免费看| 日本熟妇人妻xxxx| 天堂а√在线中文在线| 欧美日韩精品久久久免费观看| 人人肏屄| 亚洲精品久久国产高清| 国模天堂| 又爽又黄无遮挡高潮视频网站| http://国产熟女.com| 无码中文字幕网| 爱色影网| 日本免费人成视频播放试看| 超级碰碰色偷偷免费视频| 人草逼视频频| www91国产| 视频网站在线观看不卡| 中年熟女av| 欧美精品一区二区蜜臀亚洲| 國產尤物AV尤物在線觀看| 久久精品国产999大香线焦| www成人国产高清内射|