<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      華人天才出走xAI:算力競賽已死,30美元解鎖AI自進化!

      0
      分享至


      新智元報道

      編輯:傾傾

      【新智元導讀】2026年2月,Grok的核心成員Jiayi Pan和Toby Pohlen相繼離開xAI。這似乎是某種預示,或許通往AGI的路不是算力規模,而是方法的突破。

      2月26日,xAI Grok 4團隊核心成員Jiayi Pan宣布離職


      在離職聲明中,他感謝了團隊所有成員,給馬斯克留足了面子。

      幾乎同一時間,Grok團隊的另一位核心研究員Toby Pohlen也宣布離職。

      他在X上陰陽Grok的工作機制,稱「沒有人能比你們更能熬夜」,然后@官方,公開叫板。


      兩人都是grok團隊的重要貢獻者,卻在48小時內相繼離開,這讓外界對xAI內部狀況產生了更多猜測。

      4年,Jiayi Pan從一個初學者成長為Grok 4的核心貢獻者,又選擇了一條與巨頭算力競賽截然不同的技術路徑。

      四年蛻變

      從AlphaGo迷弟到Grok 4貢獻者

      Jiayi Pan的AI之路始于2019年。

      他本科就讀于密歇根大學,獲得計算機科學與電子計算機工程雙學位,2023年畢業。

      那時,Jiayi Pan對RL還一無所知。據他自己回憶,當導師提到RL時,他下意識想到的還只是AlphaGo。


      2023年,他進入加州大學伯克利分校攻讀博士,研究語言模型與視覺/機器人學的結合。

      在Berkeley的早期項目中,他開發了SWE-Gym,這是一個將RL引入軟件工程領域的環境。


      代碼傳送門:https://github.com/SWE-Gym/SWE-Gym

      該項目基于SWE-bench數據集的2294個真實GitHub Issue,要求AI不僅能讀懂代碼,還要生成可通過測試的Patch。

      這為他后續的TinyZero研究——讓AI學會修正自己,奠定了基礎。

      2025年5月,Pan加入xAI的Reasoning團隊,4開發的核心成員之一。

      在xAI的9個月里,他參與了強化學習模塊的優化,推動模型從簡單預測向自我驗證演進。

      也正是在這段時間,他啟動了TinyZero項目。

      30美元的顛覆

      TinyZero「羞辱」巨頭

      2025年,Jiayi Pan在X上宣布開源TinyZero。

      這是一個僅需30美元訓練成本的3B參數模型,通過純強化學習實現了自我驗證和推理能力。


      代碼傳送門:https://github.com/Jiayi-Pan/TinyZero

      TinyZero基于Qwen2.5-3B基礎模型,使用veRL框架在Countdown和Multiplication等任務上訓練。

      實驗結果顯示,基礎模型在Countdown任務上的準確率從0%提升到RL訓練后的80%以上。

      這驗證了一個假設:DeepSeek R1-Zero展現的自我推理能力,不是靠海量參數堆出來的,而是可以通過純強化學習在小模型上復現的。

      通往高級推理能力的路徑,可能不需要5000億美元的基礎設施投資。

      同一時期,Sam Altman宣布Stargate計劃,計劃在4年內投資數千億美元建設AI基礎設施,與Microsoft和Oracle合作。

      但據報道,該項目因三方利益沖突而陷入停滯,到2025年底,一個數據中心都沒建成。


      相比之下,TinyZero的性價比拉滿。

      無需海量數據,無需龐大資金注入,純靠RL,在極低的算力下完成了關鍵突破。

      這或許也解釋了為什么Pan等核心成員相繼離職。

      當你已經驗證了一條不依賴巨頭資源的技術路徑,留在算力軍備競賽中還有意義嗎?

      出錯了!TinyZero的元認知覺醒

      TinyZero最引人注目的不是成本,而是它展現出的「元認知」特征。

      在Countdown游戲中,模型不僅會預測答案,還會在輸出最終答案前,進行完整的試錯與回溯。

      訓練日志顯示,模型會頻繁輸出 標簽,內含自我質疑的語句。

      例如,當計算路徑偏離目標時,它會自動生成類似「Wait, that's wrong」的中間思維鏈,并立即啟動新一輪推演。

      這種行為模式此前只在DeepSeek R1-Zero等大規模模型中觀察到。

      R1-Zero的訓練過程中曾出現「頓悟」式的能力躍遷,而這通常需要數周的迭代。

      但TinyZero在3B參數、30美元成本的條件下就復現了這一現象。


      Countdown任務中不同參數規模模型的PPO訓練critic score曲線。可以看到,即使是3B的小模型,經過強化學習訓練后也能展現出明顯的能力提升。

      這證明,Scaling Law負責堆砌知識廣度,而RL負責打通邏輯深度的最后一公里,兩者的結合不一定需要海量參數。

      隨著TinyZero的開源,這種自我糾錯能力不再是巨頭的專屬技術。

      任何開發者都可以在自己的垂直領域訓練出具備思考后再回答能力的AI。

      技術拼圖:自我進化的可能性

      回顧Jiayi Pan的研究脈絡,可以看到一條清晰的技術路徑:

      在Berkeley期間開發的SWE-Gym,將軟件工程基準SWE-bench轉化為強化學習環境,訓練AI修復真實代碼問題。這是讓AI學會改代碼。

      在xAI期間參與的Grok 4項目,將強化學習應用于大模型推理能力的提升,這讓AI學會推理。

      而TinyZero的開源,則證明了推理能力可以在小模型上通過純RL實現,這是讓AI學會自我糾錯。

      當這三塊拼圖組合在一起,一個更具想象力的可能性浮現:如果AI既能糾錯,又能改代碼,那它是否能優化自己的訓練代碼,從而實現某種程度的「自我進化」?

      而這,正是2025年發布的Humanity's Last Exam(HLE)基準所隱喻的場景。


      論文鏈接:https://arxiv.org/abs/2501.14249

      HLE是一個多模態、超高難度的AI評估基準。

      現有的MMLU等測試已被模型以90%+的準確率攻破,失去了區分度,而當AI能力持續提升。

      人類需要什么樣的「最后一道防線」來評估超級智能?

      Jiayi Pan的工作,無論是SWE-Gym、Grok 4還是TinyZero都在逼近這個問題的邊界。

      他已經離開了xAI,去向未知。但他留下的代碼和論文清晰地指向一個方向:

      高級AI能力的實現,可能不需要依賴巨頭的算力資源,而是可以通過方法論的創新在更小的規模上達成。

      這帶來了技術平權的可能,也帶來了風險擴散的隱憂。

      當任何開發者都能用30美元訓練出具備自我糾錯能力的模型,RL訓練的不穩定性、開源模型的倫理邊界、失控風險的防范......這些問題都沒有現成答案。

      或許,這確實是人類面對AI自我進化可能性的「最后一次考試」。

      而這場考試,是所有人都需要參與的開卷測驗。

      參考資料:

      https://www.linkedin.com/in/jiayi-pan-88964132a/https://x.com/jiayi_pirate/status/2026733283518906703?s=20

      https://x.com/TobyPhln/status/2027188868059926705?s=20

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國50后還有多少人?多少人能活到80歲?權威數據告訴你

      中國50后還有多少人?多少人能活到80歲?權威數據告訴你

      芭比衣櫥
      2026-02-19 21:00:42
      公開宣稱要創造條件解體俄羅斯,內部確實很難!布達諾夫干得不錯

      公開宣稱要創造條件解體俄羅斯,內部確實很難!布達諾夫干得不錯

      鷹眼Defence
      2026-02-27 12:52:36
      恐怖統治力!英超9隊參加3級別歐戰,全部晉級16強:6隊踢歐冠

      恐怖統治力!英超9隊參加3級別歐戰,全部晉級16強:6隊踢歐冠

      風過鄉
      2026-02-27 06:50:28
      不是胡金秋!不是廖三寧!楊鳴盛贊中國男籃1人,是他改變了局勢

      不是胡金秋!不是廖三寧!楊鳴盛贊中國男籃1人,是他改變了局勢

      籃球看比賽
      2026-02-27 14:00:58
      黎智英女兒:懇請谷愛凌為父發聲后,不到24小時,港府回應了!

      黎智英女兒:懇請谷愛凌為父發聲后,不到24小時,港府回應了!

      閱微札記
      2026-02-26 19:54:32
      依法從嚴治軍:多名軍隊人大代表被罷免,原因清晰明確

      依法從嚴治軍:多名軍隊人大代表被罷免,原因清晰明確

      雪中風車
      2026-02-26 23:14:11
      WTT大滿貫!女單4強對陣出爐,張本美和強勢橫掃,王曼昱苦戰逆轉

      WTT大滿貫!女單4強對陣出爐,張本美和強勢橫掃,王曼昱苦戰逆轉

      現代小青青慕慕
      2026-02-27 06:33:29
      離了大譜!美國政客提案,征收谷愛凌100%個稅,上億收入將清零?

      離了大譜!美國政客提案,征收谷愛凌100%個稅,上億收入將清零?

      妙知
      2026-02-27 14:58:21
      國際籃聯重罰!中國男籃遇到2次誤判細節披露,中國籃協應上訴

      國際籃聯重罰!中國男籃遇到2次誤判細節披露,中國籃協應上訴

      現代小青青慕慕
      2026-02-27 06:53:55
      現場簽約!中方給出重磅見面禮,默茨輕飄飄2句話,斷了波音后路

      現場簽約!中方給出重磅見面禮,默茨輕飄飄2句話,斷了波音后路

      紀中百大事
      2026-02-26 19:59:58
      梅西點球破門!險1分鐘兩球,破門之后不慶祝,蘇亞雷斯造點

      梅西點球破門!險1分鐘兩球,破門之后不慶祝,蘇亞雷斯造點

      奧拜爾
      2026-02-27 10:39:46
      2026年,各國領導人都多少歲了,馬克龍48,普京73,特朗普近80

      2026年,各國領導人都多少歲了,馬克龍48,普京73,特朗普近80

      小陸搞笑日常
      2026-02-26 18:24:58
      日本排放核水后,奇怪的事發生了:剛開始各國對海鮮避之不及

      日本排放核水后,奇怪的事發生了:剛開始各國對海鮮避之不及

      百態人間
      2026-02-26 15:21:28
      遛老頭被反殺,王星昊棋仙戰決賽告負,樸廷桓一路裝傻將計就計

      遛老頭被反殺,王星昊棋仙戰決賽告負,樸廷桓一路裝傻將計就計

      真理是我親戚
      2026-02-27 15:25:25
      TVB“御用爛仔”演員游飚去世,終年57歲,李力持發文悼念

      TVB“御用爛仔”演員游飚去世,終年57歲,李力持發文悼念

      紅星新聞
      2026-02-25 11:05:07
      世界第二爆冷!2-3惜敗早田,國乒女單6人出局懸念拉滿

      世界第二爆冷!2-3惜敗早田,國乒女單6人出局懸念拉滿

      卿子書
      2026-02-27 08:26:14
      大批美國游客涌入中國,回國后坦言:客觀對比,中國比美國強多了

      大批美國游客涌入中國,回國后坦言:客觀對比,中國比美國強多了

      80后房車生活
      2026-02-27 10:31:51
      為L3奠定基礎!華為智駕能力將迎跨越式升級:尊界S800有望首發全新激光雷達

      為L3奠定基礎!華為智駕能力將迎跨越式升級:尊界S800有望首發全新激光雷達

      快科技
      2026-02-27 15:26:38
      小米連出六輛新車!雷軍震驚行業

      小米連出六輛新車!雷軍震驚行業

      銷售與管理
      2026-02-24 17:32:08
      廖三寧砍16+5令球迷懷念一人:要是他在,肯定不會是現在這個局面

      廖三寧砍16+5令球迷懷念一人:要是他在,肯定不會是現在這個局面

      弄月公子
      2026-02-26 21:07:44
      2026-02-27 16:15:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14602文章數 66645關注度
      往期回顧 全部

      科技要聞

      英偉達業績亮眼仍跌5% 兩大因素成核心隱憂

      頭條要聞

      24歲女子生下1男4女五胞胎 孩子爸爸稱"心情像過山車"

      頭條要聞

      24歲女子生下1男4女五胞胎 孩子爸爸稱"心情像過山車"

      體育要聞

      一場必須要贏的比賽,男籃何止擊敗了裁判

      娛樂要聞

      繼網暴谷愛凌后 美國欲沒收其全部收入

      財經要聞

      沈明高提共富建議 百姓持科技股國家兜底

      汽車要聞

      寶馬X5傳承版發布:給經典G05的一場體面謝幕?

      態度原創

      本地
      健康
      教育
      藝術
      公開課

      本地新聞

      津南好·四時總相宜

      轉頭就暈的耳石癥,能開車上班嗎?

      教育要聞

      中考數學,計算題,別想太簡單

      藝術要聞

      紫氣東來,好運一整年!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版