<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      英偉達4B小模型擊敗GPT-5 Pro!成本僅1/36

      0
      分享至

      聞樂 發自 凹非寺
      量子位 | 公眾號 QbitAI

      英偉達小模型持續獲勝。

      ARC-AGI 2最新成績,4B小模型NVARC27.64%的公開榜成績力壓GPT-5 Pro 18.3%登頂榜首。

      且每任務成本僅20美分,大約是GPT-5 Pro單任務成本(超過7美元)的1/36。



      據官方分析,此次NVARC奪冠的亮點在于零預訓練深度學習方法,沒有依賴大規模通用數據集進行前期預訓練,規避了預訓練模型的領域偏見、數據依賴等問題。

      而ARC-AGI 2確實是一個消除了與公共訓練數據重疊的更高難度測試,主要是看測試模型能否高效地獲取超出其訓練數據的新技能。



      成績出爐后,官方訪談到了NVARC團隊的Jean-Francois Puget和Ivan Sorokin,進行技術剖析。



      快來看看“性價比之王”是如何“練”成的?

      不靠參數堆料

      英偉達的策略是將復雜推理移至離線的合成數據管道,訓練能在評估時快速運行的較小模型。

      簡單來說就是大規模合成高質量數據,然后對現有模型進行優化,并且將昂貴的計算工作轉移到離線進行



      由于Kaggle比賽對計算資源限制非常嚴格,團隊意識到,他們不能直接使用那些需要超強算力的大型LMM來進行復雜的、一步一步的推理和代碼生成。

      因此他們改變了思路,決定將最燒錢的計算工作轉移到離線完成。比如利用GPT-OSS-120B來大規模制作高質量的合成謎題。

      團隊從H-ARC、BARC數據集中搜集了現有的ARC謎題數據,然后將簡單的謎題混合起來,生成更復雜的新謎題。



      為了確保數據質量,他們將復雜的推理管線拆分成不同的階段,每個階段都可以獨立驗證。

      通過這種方式,他們建立了一個含320萬+增強樣本的合成數據集,其中每個樣本最多有7對輸入/輸出。



      這里忍不住提一嘴,哈薩比斯剛強調了Scaling Law的重要性,那么合成數據的Scaling怎么不算呢(doge)?



      言歸正傳,NVARC核心的推理模塊以改進版ARChitects方法為基礎,選用小參數模型Qwen3-4B,通過對話式模板簡化謎題理解。

      訓練時借助NeMo RL框架和Megatron后端進行監督微調。

      不過,讓模型取得優異成績的關鍵一步在于測試時微調(TTFT)。

      針對ARC-AGI-2“每個任務都是全新規則”的特點,NVARC引入了LoRA微調技術,并且是針對每一個問題都進行微調,讓模型在做題前快速適應。

      而對ARChitects方法的改進在于解碼階段DFS算法做了批處理優化,修復結果非確定性問題。

      同時統一了8種數據增強操作評估候選解,最終在公開榜獲得了27.64%的分數。



      在競賽后期,團隊還應用了“少即是多”的TRM方法,嘗試與Qwen3-4B集成補充分數,雖然有一定提升,但受各種限制并沒有大幅優化。

      那么問題來了,有人會說這樣訓練出來的小模型不就是做題機器嗎?哪里比得上全面發力的超級大模型?

      但更值得關注的或許不在于模型本身,而在于實現突破的方法。

      在特定領域任務中,小模型經過針對性優化,性能并不遜色,再加之成本、速度、適配性與領域聚焦優勢,它們已經在諸多場景嶄露頭角。

      將正確的方法用在正確的地方,將會實現更大的價值。



      借用這位網友所說,模型或許應該被設計得更加“敏捷”。

      論文地址:https://drive.google.com/file/d/1vkEluaaJTzaZiJL69TkZovJUkPSDH5Xc/view
      [1]https://developer.nvidia.com/blog/nvidia-kaggle-grandmasters-win-artificial-general-intelligence-competition/
      [2]https://arcprize.org/blog/arc-prize-2025-results-analysis
      [3]https://www.kaggle.com/competitions/arc-prize-2025/writeups/nvarc

      — 完 —

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      多少人靠超市300塊羽絨服體面過冬?山姆們賣衣服比始祖鳥更能拿捏返貧中產

      多少人靠超市300塊羽絨服體面過冬?山姆們賣衣服比始祖鳥更能拿捏返貧中產

      Vista氫商業
      2025-12-08 14:55:05
      連續得分上雙!混血后衛朱正首發出戰25分鐘8中7得到20分3助2斷

      連續得分上雙!混血后衛朱正首發出戰25分鐘8中7得到20分3助2斷

      狼叔評論
      2025-12-08 11:42:56
      《阿凡達3》首映禮:章子怡穿得像撲棱蛾子,鄧超偷親孫儷失敗

      《阿凡達3》首映禮:章子怡穿得像撲棱蛾子,鄧超偷親孫儷失敗

      振華觀史
      2025-12-08 17:08:58
      全球明星力挺烏克蘭:從巴菲特到濱崎步,從馬斯克到貝克漢姆…

      全球明星力挺烏克蘭:從巴菲特到濱崎步,從馬斯克到貝克漢姆…

      吃瓜盟主
      2025-12-08 14:55:14
      柯文哲自曝:民進黨搜查自己電腦里的美女裸照是舒淇

      柯文哲自曝:民進黨搜查自己電腦里的美女裸照是舒淇

      總在茶余后
      2025-12-08 23:16:03
      2026年經濟工作怎么干,讀懂政治局會議里的4個關鍵提法

      2026年經濟工作怎么干,讀懂政治局會議里的4個關鍵提法

      新京報
      2025-12-08 22:27:31
      球員慶祝時跳廣告牌 掉到1層樓高的深坑:希特勒在任時德國人挖的

      球員慶祝時跳廣告牌 掉到1層樓高的深坑:希特勒在任時德國人挖的

      風過鄉
      2025-12-08 17:56:59
      剛復出就開演唱會,票價賣到1280,到底誰給的自信?

      剛復出就開演唱會,票價賣到1280,到底誰給的自信?

      易同學愛談娛樂
      2025-07-02 08:32:15
      超強mini!新機官宣:12月15日,正式發布亮相!

      超強mini!新機官宣:12月15日,正式發布亮相!

      Q科技基地
      2025-12-07 12:17:33
      利好突襲!深夜暴漲!

      利好突襲!深夜暴漲!

      證券時報
      2025-12-08 23:51:05
      張本智和輸球后炮轟:在中國發生了很多事 我不想說 但我早料到了

      張本智和輸球后炮轟:在中國發生了很多事 我不想說 但我早料到了

      風過鄉
      2025-12-08 07:49:46
      果然不出中國所料:中日戰機空中對峙后,美國防長送日本一句狠話

      果然不出中國所料:中日戰機空中對峙后,美國防長送日本一句狠話

      千里持劍
      2025-12-08 11:55:55
      東契奇31+15+11無緣今日最佳球員!因為詹姆斯29+7+6創3項記錄!

      東契奇31+15+11無緣今日最佳球員!因為詹姆斯29+7+6創3項記錄!

      Tracy的籃球博物館
      2025-12-08 11:54:30
      反手下單!段永平試駕特斯拉后直呼真香,對馬斯克的態度徹底反轉

      反手下單!段永平試駕特斯拉后直呼真香,對馬斯克的態度徹底反轉

      雷科技
      2025-12-08 20:45:58
      揭陽林家 2 億絕殺帝王綠原石,切石瞬間狂喜,緬甸礦主當場遞礦契

      揭陽林家 2 億絕殺帝王綠原石,切石瞬間狂喜,緬甸礦主當場遞礦契

      白淺娛樂聊
      2025-12-06 11:08:51
      山東淘汰青島!克里斯轟28分,高詩巖殺死比賽,謝智杰防守極佳!

      山東淘汰青島!克里斯轟28分,高詩巖殺死比賽,謝智杰防守極佳!

      籃球資訊達人
      2025-12-08 17:02:40
      大降11℃,中雪、大雪,即將抵達湖北

      大降11℃,中雪、大雪,即將抵達湖北

      極目新聞
      2025-12-08 14:56:08
      見證歷史!楊瀚森首次首發創2紀錄,為何前后判若兩人?答案來了

      見證歷史!楊瀚森首次首發創2紀錄,為何前后判若兩人?答案來了

      萌蘭聊個球
      2025-12-08 09:59:44
      殲15一個照面壓制F15戰機,日本終于明白:印度5.7空戰為什么慘敗

      殲15一個照面壓制F15戰機,日本終于明白:印度5.7空戰為什么慘敗

      滄海旅行家
      2025-12-08 16:05:48
      日本社民黨黨首要求高市辭職

      日本社民黨黨首要求高市辭職

      參考消息
      2025-12-08 20:15:47
      2025-12-09 00:40:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11826文章數 176340關注度
      往期回顧 全部

      科技要聞

      國產機械硬盤尚未攻克,華為高管呼吁

      頭條要聞

      江蘇男子貴州投資養羊損失近百萬 543只羊被"躲貓貓"

      頭條要聞

      江蘇男子貴州投資養羊損失近百萬 543只羊被"躲貓貓"

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經要聞

      百億金融爆雷 浙商大佬"朋友圈"也不靈了

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      時尚
      藝術
      手機
      本地
      房產

      50+女人別踩坑!遠離緊身褲和老年裝,這樣穿優雅又顯瘦

      藝術要聞

      一棵樹的力量

      手機要聞

      蘋果換帥在即?iPhone或迎最大升級

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      房產要聞

      全球征集方案!涉及2400畝,秀英港又有新動作!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品无人乱码一区二区三区的优势| 日本丰满少妇裸体自慰| 色综亚洲国产vv在线观看| 麻豆a级片| 亚卅精品| 无码人妻精品中文字幕免费时间| 无限看片在线版免费视频大全| 欧美另类性爱| 久久99免费麻辣视频| 南汇区| 亚洲乱妇熟女爽到高潮的片| 婷婷四房色播| 久久综合国产色美利坚| 99视频精品3| 亚洲精品一区国产| 337p日本欧洲亚洲大胆| 亚洲男人的天堂久久香蕉| 超碰狠狠干| 男女性杂交内射女bbwxz| 国产乱子夫妻xx黑人xyx真爽| 亚洲精品久荜中文字幕| 国产AV影院| 自拍亚洲一区欧美另类| 国产人妖系列-不堪入目| 中文字幕av久久爽一区| 林口县| 野花社区www高清视频| 亚洲一区二区经典在线播放| 熟女Www亚洲国产W| 一本色道无码DVD道色| 午夜精品久久久久久毛片| 日韩精品一区二区三区激情视频| 日本成人社区| 日本无遮挡吸乳呻吟视频| 人妻va精品va欧美va| 国产精品性爱| 亚洲永久免费精网站| 疯狂的欧美乱大交| 免费人成在线观看网站| 色天使av| 亚洲人成伊人成综合网小说|