<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      再見,數據標注!騰訊發布R-Zero框架,讓AI自己訓練自己

      0
      分享至


      大數據文摘出品

      一個不再依賴人類數據標注的大模型訓練框架,它來了!

      由騰訊AI Lab與美國圣路易斯華盛頓大學聯合開發的新框架“R-Zero”,成功展示出大語言模型(LLM)如何靠自己訓練自己,不再需要人類提供任務或答案。


      論文地址: https://www.arxiv.org/pdf/2508.05004

      這個突破的核心,是徹底擺脫人類標注數據的依賴,靠模型之間的博弈,自動生成、篩選和吸收新的訓練內容。

      他們用強化學習的方法,讓兩個AI模型互相挑戰、不斷進化,從零開始構建出一個高質量的訓練體系。


      R-Zero采用的結構,是將一個基礎模型一分為二,分別扮演“挑戰者”和“解答者”兩個角色,分別訓練,但共同進化。

      挑戰者的目標是設計剛好夠難的問題,逼迫解答者必須進步;而解答者在解決這些問題中獲得獎勵和提升。

      “不是找到答案難,而是提出好問題難。”顯然,真正稀缺的是“好老師”,而不是“好學生”。

      R-Zero就是通過自動化產生“老師”,讓模型不斷面對新的、更難的考題,從而不斷突破原有水平。

      01 R-Zero的實驗結果

      R-Zero的實驗效果遠超預期,尤其是在推理能力方面,不同規模的開源大模型均出現明顯性能躍升


      騰訊測試了多個模型家族,包括Qwen3系列和OctoThinker,在基礎模型上僅通過R-Zero訓練,就讓推理能力顯著提升。

      例如,Qwen3-4B-Base在數學推理測試中得分平均提升+6.49分;Qwen3-8B-Base在三輪訓練后得分也提升了+5.51分。

      更重要的是,這種通過數學任務訓練得到的推理能力,可以成功遷移到通用推理任務上

      在MMLU-Pro和SuperGPQA等通用領域測試中,Qwen3-4B-Base同樣表現出+7.54分的躍升,說明R-Zero訓練的不只是技巧,而是底層能力。

      甚至在后續再用傳統標注數據微調時,經過R-Zero預訓練的模型也能表現得更好。

      對企業而言,R-Zero的“從零數據”方式尤其具有吸引力,因為許多垂直行業領域,壓根沒有高質量的大規模數據集可供使用


      騰訊的這項研究直接繞開了數據收集、人工標注這些最昂貴、最耗時的流程,變相打破了AI發展的最大天花板:人類知識和數據的邊界。

      02 但問題同樣存在

      盡管R-Zero在性能上令人振奮,但它也暴露出自我進化AI的核心風險:數據質量的失控

      研究者發現,隨著挑戰者不斷提出更復雜的問題,解答者給出的“多數票答案”正確率開始下降。


      第一輪訓練中,自動生成數據的準確率為79%,而到第三輪下降至63%

      相比之下,一個“強大而理想”的大模型如GPT-4,可以保持更高的正確率,這種落差說明自我進化的過程可能存在精度塌陷的風險。這是這個新范式面臨的最大瓶頸。

      目前論文成果只是概念驗證,要真正做到持續穩定進化,不出現性能平臺期,是接下來整個研究社區要攻克的難關。

      此外,R-Zero目前僅適用于“答案可驗證”的任務,如數學推理、科學問答等,其優勢來自于能夠清晰判斷“對”與“錯”。

      那在沒有“標準答案”的領域怎么辦?比如營銷文案、情感寫作、摘要生成?

      騰訊提出了未來的一種可能方向:引入第三個模型角色“驗證者”或“評論員”。

      驗證者將不再判斷對錯,而是評價內容的質量,從多個維度給予評分。

      如此一來,挑戰者繼續生成題目,解答者負責作答,而驗證者則提供反饋。三方協同進化,形成更復雜、更全面的智能結構。

      或許會推動AI從“邏輯能力”邁向“主觀判斷”,不僅懂計算,更懂人類世界的模糊與語境。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開眼

      廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開眼

      今日搞笑分享
      2026-04-06 17:55:16
      印度人:如果中國真比印度發達,為何中國城市大街看不到突突車?

      印度人:如果中國真比印度發達,為何中國城市大街看不到突突車?

      瀲滟晴方DAY
      2026-04-26 14:06:23
      《北京人在紐約》演員現狀,小龍套成名導,女N號女兒成一線女星

      《北京人在紐約》演員現狀,小龍套成名導,女N號女兒成一線女星

      談史論天地
      2026-04-24 15:20:03
      約P?多人運動?夜夜不重樣?“娛圈鐵腎”的瓜

      約P?多人運動?夜夜不重樣?“娛圈鐵腎”的瓜

      萌姐
      2026-04-11 18:44:38
      中日交鋒刺刀見紅,嗅到危機的菲律賓,對中國說了一句不尋常的話

      中日交鋒刺刀見紅,嗅到危機的菲律賓,對中國說了一句不尋常的話

      通文知史
      2026-04-25 15:30:08
      保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

      保姆偷拿了家里2瓶茅臺去賣,我沒揭穿只辭退了她,臨走時她指了指舊皮鞋,我一看瞬間癱坐在地

      今夜有個好故事
      2026-03-11 17:26:56
      金庸筆下名字最難聽的7位女子,兒時覺得好聽,長大卻覺不堪入耳

      金庸筆下名字最難聽的7位女子,兒時覺得好聽,長大卻覺不堪入耳

      耳東文史
      2026-04-26 00:03:21
      英超歐冠劇本殺?維拉“放水”劍指六個名額,身后追趕者處境微妙

      英超歐冠劇本殺?維拉“放水”劍指六個名額,身后追趕者處境微妙

      體壇老球迷
      2026-04-25 22:08:43
      雙色球第046期2026年4月26日(僅供參考,祝?中獎)

      雙色球第046期2026年4月26日(僅供參考,祝?中獎)

      小李子體育
      2026-04-26 11:28:46
      民國最牛地主,家里出2大將1上將,2名長工也成司令和國軍中將

      民國最牛地主,家里出2大將1上將,2名長工也成司令和國軍中將

      文人相愛A
      2026-04-18 15:20:36
      笑麻!原來可樂到了拉薩也高反,當地網友:不是這種的肯定都壞了

      笑麻!原來可樂到了拉薩也高反,當地網友:不是這種的肯定都壞了

      夜深愛雜談
      2026-04-26 07:42:23
      許家印認罪!2.4萬億窟窿,家族只拿走500億,其余真金白銀去哪了

      許家印認罪!2.4萬億窟窿,家族只拿走500億,其余真金白銀去哪了

      蜉蝣說
      2026-04-23 09:41:11
      第一集就全裸出鏡,女神新劇太生猛了

      第一集就全裸出鏡,女神新劇太生猛了

      來看美劇
      2026-04-24 22:03:11
      一部 “中國文化的診斷報告”,戳破了14億人的文化幻覺!

      一部 “中國文化的診斷報告”,戳破了14億人的文化幻覺!

      尚曦讀史
      2026-04-25 07:05:27
      默森:阿森納如果能贏富勒姆,他們就將贏得聯賽冠軍

      默森:阿森納如果能贏富勒姆,他們就將贏得聯賽冠軍

      懂球帝
      2026-04-26 11:20:11
      國企機關化帶來的問題已經愈來愈嚴重,有的問題已經病入膏肓

      國企機關化帶來的問題已經愈來愈嚴重,有的問題已經病入膏肓

      細說職場
      2026-04-25 22:30:20
      雨雨雨!暴跌10℃!江蘇最新天氣預測!

      雨雨雨!暴跌10℃!江蘇最新天氣預測!

      江南晚報
      2026-04-26 03:00:28
      可怕的失誤 “消失”的KD!火箭僅剩為尊嚴而戰?

      可怕的失誤 “消失”的KD!火箭僅剩為尊嚴而戰?

      體壇周報
      2026-04-26 15:11:12
      烏軍曝出丑聞,西爾斯基怒不可遏:所有指揮官撤職查辦!

      烏軍曝出丑聞,西爾斯基怒不可遏:所有指揮官撤職查辦!

      史政先鋒
      2026-04-25 20:38:13
      北影節天壇獎揭曉,于和偉奪影帝,影后雙黃蛋,劉詩詩美翻全場

      北影節天壇獎揭曉,于和偉奪影帝,影后雙黃蛋,劉詩詩美翻全場

      露珠聊影視
      2026-04-25 23:28:18
      2026-04-26 15:59:01
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6853文章數 94542關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      伊朗拒見美代表轉赴阿曼 特朗普怒撤行程

      頭條要聞

      伊朗拒見美代表轉赴阿曼 特朗普怒撤行程

      體育要聞

      森林狼3比1掘金:逆境中殺出了多孫穆?!

      娛樂要聞

      《八千里路云和月》大結局意難平

      財經要聞

      DeepSeek V4背后,梁文鋒的轉身

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      手機
      房產
      藝術
      旅游
      公開課

      手機要聞

      W16周:華為無敵手,蘋果持續第二,OPPO變第三

      房產要聞

      新一輪教育大爆發來了!海口,開始瘋狂建學校!

      藝術要聞

      鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

      旅游要聞

      不設舞臺的賞花季!青島西海岸新區邀你在花海中自由撒野

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 在线aⅴ亚洲中文字幕| 顶级欧美熟妇高潮xxxxx| 欧美日韩欧美| 国产亚洲高清在线精品不卡| 国产欧美日韩综合精品一区二区| 亚洲乱熟女| 欧美精品一卡| 日日猛噜噜狠狠扒开双腿小说| 国产色婷婷视频在线观看| 在线精品无码字幕无码av | 顺昌县| 国产在线精品成人一区二区| 国产精品国产三级国产专区53| 国产肉丝袜在线观看| 日韩精品内射视频免费观看| 日韩老无码| 成在人线a免费观看影院| 亚洲精品久综合蜜| 久久成人电影| 又大又粗又爽免费视频a片| 夜夜添无码试看一区二区三区| 在线免费看av| 一本综合丁香日日狠狠色| 日日干夜夜干| 亚洲国产综合自在线另类| 一本色道久久综合狠狠| 欧美乱码伦视频免费| 影音先锋成人A片| 国产亚洲精品美女久久久久| 日韩欧美视频一区二区三区| 熟妇在线| 巨胸的教师在线完整版| 欧洲精品成人免费视频在线观看 | 国产拳交视频| 精品在线观看视频二区| 福利视频一区二区在线| 欧美中文字幕精品人妻| 国产欧美精品一区二区三区四区| 色色无码| 蜜臂av| 看毛片看毛片|