<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<menuitem id="wzba6"><delect id="wzba6"></delect></menuitem><samp id="wzba6"><b id="wzba6"></b></samp>

<center id="wzba6"></center>

<rt id="wzba6"><source id="wzba6"></source></rt>

<pre id="wzba6"><option id="wzba6"><tbody id="wzba6"></tbody></option></pre>

<u id="wzba6"><strong id="wzba6"><p id="wzba6"></p></strong></u>

<ruby id="wzba6"><blockquote id="wzba6"></blockquote></ruby>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

英偉達4B小模型擊敗GPT-5 Pro！成本僅1/36

2025-12-08 14:31:05　來源: 量子位

北京舉報

0

分享至

聞樂發自凹非寺
量子位 | 公眾號 QbitAI

英偉達小模型持續獲勝。

ARC-AGI 2最新成績，4B小模型NVARC27.64%的公開榜成績力壓GPT-5 Pro 18.3%登頂榜首。

且每任務成本僅20美分，大約是GPT-5 Pro單任務成本（超過7美元）的1/36。

據官方分析，此次NVARC奪冠的亮點在于零預訓練深度學習方法，沒有依賴大規模通用數據集進行前期預訓練，規避了預訓練模型的領域偏見、數據依賴等問題。

而ARC-AGI 2確實是一個消除了與公共訓練數據重疊的更高難度測試，主要是看測試模型能否高效地獲取超出其訓練數據的新技能。

成績出爐后，官方訪談到了NVARC團隊的Jean-Francois Puget和Ivan Sorokin，進行技術剖析。

快來看看“性價比之王”是如何“練”成的？

不靠參數堆料

英偉達的策略是將復雜推理移至離線的合成數據管道，訓練能在評估時快速運行的較小模型。

簡單來說就是大規模合成高質量數據，然后對現有模型進行優化，并且將昂貴的計算工作轉移到離線進行

由于Kaggle比賽對計算資源限制非常嚴格，團隊意識到，他們不能直接使用那些需要超強算力的大型LMM來進行復雜的、一步一步的推理和代碼生成。

因此他們改變了思路，決定將最燒錢的計算工作轉移到離線完成。比如利用GPT-OSS-120B來大規模制作高質量的合成謎題。

團隊從H-ARC、BARC數據集中搜集了現有的ARC謎題數據，然后將簡單的謎題混合起來，生成更復雜的新謎題。

為了確保數據質量，他們將復雜的推理管線拆分成不同的階段，每個階段都可以獨立驗證。

通過這種方式，他們建立了一個含320萬+增強樣本的合成數據集，其中每個樣本最多有7對輸入/輸出。

這里忍不住提一嘴，哈薩比斯剛強調了Scaling Law的重要性，那么合成數據的Scaling怎么不算呢（doge）？

言歸正傳，NVARC核心的推理模塊以改進版ARChitects方法為基礎，選用小參數模型Qwen3-4B，通過對話式模板簡化謎題理解。

訓練時借助NeMo RL框架和Megatron后端進行監督微調。

不過，讓模型取得優異成績的關鍵一步在于測試時微調（TTFT）。

針對ARC-AGI-2“每個任務都是全新規則”的特點，NVARC引入了LoRA微調技術，并且是針對每一個問題都進行微調，讓模型在做題前快速適應。

而對ARChitects方法的改進在于解碼階段DFS算法做了批處理優化，修復結果非確定性問題。

同時統一了8種數據增強操作評估候選解，最終在公開榜獲得了27.64%的分數。

在競賽后期，團隊還應用了“少即是多”的TRM方法，嘗試與Qwen3-4B集成補充分數，雖然有一定提升，但受各種限制并沒有大幅優化。

那么問題來了，有人會說這樣訓練出來的小模型不就是做題機器嗎？哪里比得上全面發力的超級大模型？

但更值得關注的或許不在于模型本身，而在于實現突破的方法。

在特定領域任務中，小模型經過針對性優化，性能并不遜色，再加之成本、速度、適配性與領域聚焦優勢，它們已經在諸多場景嶄露頭角。

將正確的方法用在正確的地方，將會實現更大的價值。

借用這位網友所說，模型或許應該被設計得更加“敏捷”。

論文地址：https://drive.google.com/file/d/1vkEluaaJTzaZiJL69TkZovJUkPSDH5Xc/view
[1]https://developer.nvidia.com/blog/nvidia-kaggle-grandmasters-win-artificial-general-intelligence-competition/
[2]https://arcprize.org/blog/arc-prize-2025-results-analysis
[3]https://www.kaggle.com/competitions/arc-prize-2025/writeups/nvarc

— 完 —

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

英偉達親手終結CUDA「護城河」？傳奇芯片架構師引發爭議

新智元 2025-12-08 16:57:34
1 跟貼 1
英偉達AI世界模擬器？AI P圖學會「腦補」過程了！

新智元 2025-11-04 19:33:28
0 跟貼 0

谷歌HOPE架構來了！突破大模型長期記憶難題，智能體要爆發？

雷科技 2025-12-08 21:13:58
0 跟貼 0

字節Seed團隊發布循環語言模型Ouro，在預訓練階段直接「思考」

機器之心Pro 2025-11-04 11:58:36
0 跟貼 0
滴普科技趙杰輝：從技術探索到場景實效，AI 穿越 “高山與大海” 的企業賦能路徑 | WISE2025 商業之王大會

36氪 2025-12-08 17:03:10
0 跟貼 0

地平線余凱：共赴物理AI高境，同立普惠生態基石

雷科技 2025-12-08 21:53:35
0 跟貼 0

GPT-5.2要來了？通信ETF（515880）大漲超5%，光模塊占比超50%

每日經濟新聞 2025-12-08 10:22:06
0 跟貼 0
兩個LLM互相對線，推理起飛：康奈爾團隊發布大模型版類GAN訓練法

機器之心Pro 2025-12-08 16:16:12
0 跟貼 0

DeepSeek、Gemini誰更能提供情感支持？趣丸×北大來了波動態評估

機器之心Pro 2025-12-08 16:08:38
0 跟貼 0
特斯拉人形機器人演示時翻車，摔倒前突然做出慌忙“摘頭顯”動作，疑似模仿遠程操作員，馬斯克曾回應其由AI驅動、非遙控

揚子晚報 2025-12-08 21:07:35
0 跟貼 0
不止于炫技，普渡如何引領機器狗成為具身智能商業化最佳物種？

智東西 2025-12-08 21:43:08
0 跟貼 0
剛演示過絲滑跑步，特斯拉機器人莫名倒地，姿勢怪異

每日經濟新聞 2025-12-09 00:19:07
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5，開源了

量子位 2025-12-06 14:07:18
7 跟貼 7
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7
北大才女成硅谷毒梟，用算法給10萬人投du

大貓財經Pro 2025-12-04 22:26:55
4 跟貼 4
英偉達CEO黃仁勛：父母對孩子的鼓勵可以激發無限潛能！

知了3C 2025-12-04 23:05:22
0 跟貼 0
剛剛，英偉達CUDA迎來史上最大更新！

機器之心Pro 2025-12-08 18:12:05
2 跟貼 2
十八般武藝樣樣精通，王楚欽多拍相持展示全面技術

咪咕體育 2025-12-04 11:57:02
7 跟貼 7
達晨、華控領投，極佳視界A2輪再融2億，押注“世界模型+行動模型”原生架構

鈦媒體APP 2025-12-08 15:11:08
0 跟貼 0
GPT-5編程成績有貓膩！自刪23道測試題，關鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15
LLaVA-OneVision-1.5開源，8B模型預訓練只需4天、1.6萬美元

機器之心Pro 2025-10-13 18:37:02
0 跟貼 0
架構解耦是統一多模態模型所必須的嗎？全新AIA損失：No

機器之心Pro 2025-12-02 14:25:38
0 跟貼 0
向太看懂2條人性規則，幫你少走10年彎路！向太這番話太透徹了！

悅悅知識分享 2025-12-06 02:02:40
0 跟貼 0
新國標電動自行車陸續到店開售價格如何？

新京報 2025-12-08 07:19:40
8607 跟貼 8607
已正式啟動福建適齡男子必須全部進行兵役登記

漳視新聞 2025-12-08 10:52:49
2461 跟貼 2461
英偉達CEO黃仁勛：麥當勞是最棒的餐廳！

知了3C 2025-12-08 20:14:42
0 跟貼 0
規則無禁即可行，真理在手即正義

小小魚追劇 2025-12-06 10:01:58
2 跟貼 2
美股三大期指漲跌不一黃仁勛不滿美國基建速度 | 今夜看點

財聯社 2025-12-08 21:50:40
0 跟貼 0
英偉達持倉股CoreWeave盤前跌幅擴大至6.5%

每日經濟新聞 2025-12-08 20:25:04
0 跟貼 0
iPhone 17 Pro官方降價

大象新聞 2025-12-08 11:30:46
2772 跟貼 2772
理發師技術高超，三下五除二的剪發，真是高手在民間！

河馬搞笑君 2025-12-08 13:46:35
1 跟貼 1
暗勁大師范戴克，身體博弈的防守藝術，每招都在規則邊緣試探！

足球印象CC 2025-12-06 17:06:21
20 跟貼 20
算力比兩顆英偉達還高，地平線HSD量產版實戰體驗 | 智能車指南

吳佩頻道 2025-12-04 15:41:12
0 跟貼 0
罕見！遼寧艦沿琉球群島北上

揚子晚報 2025-12-08 12:37:37
911 跟貼 911
干枯了三十多年，鄭州“母親河”賈魯河源頭泉水復涌，水溫近30℃，附近民眾興奮不已，奔走相告

極目新聞 2025-12-08 14:40:30
133 跟貼 133
【徹底講透RAG】從破防rag弱點->阿里神器qwen3 Embedding模型->大模型rag項目

盧菁老師 2025-12-08 10:00:31
0 跟貼 0
違停清了、堵塞通了、不用來回跑了……看TA們創新機制巧解“三跨”治理難題

上海靜安 2025-12-08 20:40:02
0 跟貼 0
《ARC Raiders》開發秘聞巨大多足機器人經常暴走

3DM游戲 2025-12-06 11:25:24
1 跟貼 1
南寧一小學招標公告標題變聊天記錄，項目公司發布情況說明

界面新聞 2025-12-08 20:00:32
30 跟貼 30
美媒稱烏東戰局正發生急劇變化

參考消息 2025-12-08 12:53:03
3 跟貼 3

多少人靠超市300塊羽絨服體面過冬？山姆們賣衣服比始祖鳥更能拿捏返貧中產

多少人靠超市300塊羽絨服體面過冬？山姆們賣衣服比始祖鳥更能拿捏返貧中產

Vista氫商業

2025-12-08 14:55:05

連續得分上雙！混血后衛朱正首發出戰25分鐘8中7得到20分3助2斷

連續得分上雙！混血后衛朱正首發出戰25分鐘8中7得到20分3助2斷

狼叔評論

2025-12-08 11:42:56

《阿凡達3》首映禮：章子怡穿得像撲棱蛾子，鄧超偷親孫儷失敗

《阿凡達3》首映禮：章子怡穿得像撲棱蛾子，鄧超偷親孫儷失敗

振華觀史

2025-12-08 17:08:58

全球明星力挺烏克蘭：從巴菲特到濱崎步，從馬斯克到貝克漢姆…

全球明星力挺烏克蘭：從巴菲特到濱崎步，從馬斯克到貝克漢姆…

吃瓜盟主

2025-12-08 14:55:14

柯文哲自曝：民進黨搜查自己電腦里的美女裸照是舒淇

柯文哲自曝：民進黨搜查自己電腦里的美女裸照是舒淇

總在茶余后

2025-12-08 23:16:03

2026年經濟工作怎么干，讀懂政治局會議里的4個關鍵提法

2026年經濟工作怎么干，讀懂政治局會議里的4個關鍵提法

新京報

2025-12-08 22:27:31

球員慶祝時跳廣告牌掉到1層樓高的深坑：希特勒在任時德國人挖的

球員慶祝時跳廣告牌掉到1層樓高的深坑：希特勒在任時德國人挖的

風過鄉

2025-12-08 17:56:59

剛復出就開演唱會，票價賣到1280，到底誰給的自信？

剛復出就開演唱會，票價賣到1280，到底誰給的自信？

易同學愛談娛樂

2025-07-02 08:32:15

超強mini！新機官宣：12月15日，正式發布亮相！

超強mini！新機官宣：12月15日，正式發布亮相！

Q科技基地

2025-12-07 12:17:33

利好突襲！深夜暴漲！

證券時報

2025-12-08 23:51:05

張本智和輸球后炮轟：在中國發生了很多事我不想說但我早料到了

張本智和輸球后炮轟：在中國發生了很多事我不想說但我早料到了

風過鄉

2025-12-08 07:49:46

果然不出中國所料：中日戰機空中對峙后，美國防長送日本一句狠話

果然不出中國所料：中日戰機空中對峙后，美國防長送日本一句狠話

千里持劍

2025-12-08 11:55:55

東契奇31+15+11無緣今日最佳球員！因為詹姆斯29+7+6創3項記錄！

東契奇31+15+11無緣今日最佳球員！因為詹姆斯29+7+6創3項記錄！

Tracy的籃球博物館

2025-12-08 11:54:30

反手下單！段永平試駕特斯拉后直呼真香，對馬斯克的態度徹底反轉

反手下單！段永平試駕特斯拉后直呼真香，對馬斯克的態度徹底反轉

雷科技

2025-12-08 20:45:58

揭陽林家 2 億絕殺帝王綠原石，切石瞬間狂喜，緬甸礦主當場遞礦契

揭陽林家 2 億絕殺帝王綠原石，切石瞬間狂喜，緬甸礦主當場遞礦契

白淺娛樂聊

2025-12-06 11:08:51

山東淘汰青島！克里斯轟28分，高詩巖殺死比賽，謝智杰防守極佳！

山東淘汰青島！克里斯轟28分，高詩巖殺死比賽，謝智杰防守極佳！

籃球資訊達人

2025-12-08 17:02:40

大降11℃，中雪、大雪，即將抵達湖北

大降11℃，中雪、大雪，即將抵達湖北

極目新聞

2025-12-08 14:56:08

見證歷史！楊瀚森首次首發創2紀錄，為何前后判若兩人？答案來了

見證歷史！楊瀚森首次首發創2紀錄，為何前后判若兩人？答案來了

萌蘭聊個球

2025-12-08 09:59:44

殲15一個照面壓制F15戰機，日本終于明白：印度5.7空戰為什么慘敗

殲15一個照面壓制F15戰機，日本終于明白：印度5.7空戰為什么慘敗

滄海旅行家

2025-12-08 16:05:48

日本社民黨黨首要求高市辭職

參考消息

2025-12-08 20:15:47

追蹤人工智能動態

11826文章數 176340關注度

往期回顧全部

科技要聞

國產機械硬盤尚未攻克，華為高管呼吁

頭條要聞

江蘇男子貴州投資養羊損失近百萬 543只羊被"躲貓貓"

頭條要聞

江蘇男子貴州投資養羊損失近百萬 543只羊被"躲貓貓"

體育要聞

一位大學美術生，如何用4年成為頂級跑者？

娛樂要聞

章子怡被說拜高踩低主動和卡梅隆熱聊

財經要聞

百億金融爆雷浙商大佬"朋友圈"也不靈了

汽車要聞

純電全尺寸大六座凱迪拉克"小凱雷德"申報圖曝光

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

藝術

手機

本地

房產

50+女人別踩坑！遠離緊身褲和老年裝，這樣穿優雅又顯瘦

藝術要聞

一棵樹的力量

手機要聞

蘋果換帥在即？iPhone或迎最大升級

本地新聞

云游安徽｜七千年敘事，第一章寫在蚌埠

房產要聞

全球征集方案！涉及2400畝，秀英港又有新動作！

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：精品无人乱码一区二区三区的优势| 日本丰满少妇裸体自慰| 色综亚洲国产vv在线观看| 麻豆a级片| 亚卅精品| 无码人妻精品中文字幕免费时间| 无限看片在线版免费视频大全| 欧美另类性爱| 久久99免费麻辣视频| 南汇区| 亚洲乱妇熟女爽到高潮的片| 婷婷四房色播| 久久综合国产色美利坚| 99视频精品3| 亚洲精品一区国产| 337p日本欧洲亚洲大胆| 亚洲男人的天堂久久香蕉| 超碰狠狠干| 男女性杂交内射女bbwxz| 国产乱子夫妻xx黑人xyx真爽| 亚洲精品久荜中文字幕| 国产AV影院| 自拍亚洲一区欧美另类| 国产人妖系列-不堪入目| 中文字幕av久久爽一区| 林口县| 野花社区www高清视频| 亚洲一区二区经典在线播放| 熟女Www亚洲国产W| 一本色道无码DVD道色| 午夜精品久久久久久毛片| 日韩精品一区二区三区激情视频| 日本成人社区| 日本无遮挡吸乳呻吟视频| 人妻va精品va欧美va| 国产精品性爱| 亚洲永久免费精网站| 疯狂的欧美乱大交| 免费人成在线观看网站| 色天使av| 亚洲人成伊人成综合网小说|

<u id="3lxp0"></u>

<nobr id="3lxp0"></nobr>