<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      調整訓練數據出場順序大模型就能變聰明!無需擴大模型/數據規模

      0
      分享至

      DELT團隊 投稿
      量子位 | 公眾號 QbitAI

      模型訓練重點在于數據的數量與質量?其實還有一個關鍵因素——

      數據的出場順序。

      對此,微軟亞洲研究院提出了一種全新的文本數據組織范式DELT(Data Efficacy in LM Training),通過引入數據排序策略,充分挖掘訓練數據潛力,在不同模型尺寸與規模下都達到了良好性能。



      數據效率與效能提升

      該方法用優化訓練數據的組織方式來讓語言模型學得更好,還不用增加數據量或擴大模型規模

      來看看是怎么做到的。

      訓練樣本的組織順序很關鍵

      首先,我們先來理清幾個概念。

      在語言模型訓練中,數據使用效率至關重要。現有研究多關注于數據效率(Data Efficiency),即如何通過數據選擇提升模型訓練效率并保持優異性能。

      然而,數據效能(Data Efficacy),即如何通過數據組織增強模型訓練表現,卻常常被忽視。

      以烹飪為例,數據效率就像在市場挑選新鮮、合適的食材,而數據效能則像名廚把握投放調料的時機與分寸,讓菜品發揮出最佳風味。

      數據組織的重要性

      為了避免過擬合,當前的大語言模型往往在海量數據上進行訓練,并且訓練的次數非常有限,甚至僅進行一次完整的訓練周期(epoch=1),這與早期模型依賴多次迭代訓練(epoch>>1)截然不同。

      這些變化讓數據呈現的先后順序對結果影響巨大

      早期的AI模型類似于讓學生多次反復翻閱同一本書,在多輪學習中慢慢補齊細節;而現在更像只給一遍通讀,不再反復回看。

      這就對閱讀順序提出了極高要求,必須精心規劃學習材料出現的先后和結構。因此,訓練樣本的組織順序顯得尤為關鍵。然而,關于這一點的研究卻很少。

      基于此觀察,微軟亞洲研究院最新提出的文本數據組織范式DELT,通過引入數據排序策略,充分挖掘訓練數據潛力,實現了數據的高效利用與效能提升。



      DELT范式不但通過數據選擇提升效率,選取高質量數據,加快訓練速度;

      而且通過數據排序提升效能,在預訓練和后訓練階段都顯著提升了模型性能,且適用于通用、數學和代碼等多領域任務。

      給模型按部就班安排訓練課程
      數據訓練效能定義Data Efficacy

      研究首先定義了數據訓練效能(Data Efficacy),是指通過優化訓練數據的組織方式來最大化語言模型的性能表現,而無需改變數據內容或模型架構。

      與以往關注的“數據訓練效率” (Data Efficiency) 側重數據篩選的研究目的不同,數據效能強調對訓練數據的評分和排序,以充分挖掘數據的潛在價值。

      數據順序在語言模型訓練中的潛力尚未被充分挖掘, 數據效能旨在通過合理的數據組織方式,使模型在有限的訓練數據和資源下實現更高的性能和泛化能力,成為提升語言模型性能的一種新興方法。

      數據組織范式DELT介紹



      DELT范式架構

      DELT(DataEfficacy inLMTraining)是一種創新的文本數據組織范式。

      它集成了數據評分(Data Scoring)、數據選擇(Data Selection) 和數據排序(Data Ordering) 三大核心組件。

      數據評分根據特定的屬性為每個樣本賦予分數,如:難度、質量、多樣性等。

      數據選擇通過評分篩選出最優子集(如:top-k、按閾值篩選等),然后數據排序根據評分重新組織所選擇數據的呈現順序(如:基于課程學習的分數從低到高排列)。 為了兼顧數據處理效率,DELT范式的數據選擇和數據排序共用數據評分的結果。

      因此,數據評分的規則設置非常重要。于是,研究還提出了Learning-Quality Score(LQS)方法。



      LQS打分方式

      該數據評分方式結合了質量可學習性兩個關鍵指標,不但可以篩選出低質量數據,而且也能捕捉數據在不同階段的訓練價值,進一步提供了可靠的數據排列順序。

      為了進一步提升數據效能,團隊還提出了一種全新的折疊排序方法Folding Ordering(FO)。

      基于課程學習的排序(即,按分數升序排序)可能導致模型遺忘和數據內部分布偏差。

      折疊排序策略通過多層“折疊”,將數據按分數分層并多次采樣,無重復且均衡分布。



      Folding排序方式

      相比隨機打亂或單一排序,它既保留難度排序優勢,又避免模型過度遺忘或依賴特定數據,提升了魯棒性和泛化能力。

      與傳統隨機排序方法相比,DELT范式不僅通過減小數據規模提升了訓練效率;而且在不同模型尺寸和數據規模下,在各種評測集上都顯著提升了模型性能。



      不同數據規模和模型尺寸下的結果

      DELT給Data-centric AI領域帶來了全新思路。

      看來,類比于人類教學實踐,講究個性化與按部就班地安排學習內容,AI訓練也需要類似的學習方法。

      論文鏈接:https://arxiv.org/abs/2506.21545
      代碼鏈接:https://github.com/microsoft/DELT

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      天津的雪有變!預計這兩天……

      天津的雪有變!預計這兩天……

      網信津南
      2025-12-08 09:13:45
      A股:今天漲到3936,跡象明顯了,不出意外,周二很可能這樣走

      A股:今天漲到3936,跡象明顯了,不出意外,周二很可能這樣走

      丁丁鯉史紀
      2025-12-08 15:56:46
      廣東單親媽媽嫁大27歲澳洲老頭,6年后被鹽酸溶解,只剩10顆烤瓷牙

      廣東單親媽媽嫁大27歲澳洲老頭,6年后被鹽酸溶解,只剩10顆烤瓷牙

      阿傖說事
      2025-11-30 02:10:39
      復旦大學領導班子調整

      復旦大學領導班子調整

      TOP大學來了
      2025-12-07 13:57:32
      白宮報告猛批歐洲,俄羅斯表歡迎:美政策調整“大體符合”俄方觀點

      白宮報告猛批歐洲,俄羅斯表歡迎:美政策調整“大體符合”俄方觀點

      上觀新聞
      2025-12-08 15:17:03
      腿粗屁股大的女生太好看,吊帶背心搭配瑜伽褲,小姐姐笑的好開心

      腿粗屁股大的女生太好看,吊帶背心搭配瑜伽褲,小姐姐笑的好開心

      小喬古裝漢服
      2025-12-02 10:10:02
      爸爸被公司外派出國3年至今沒回來過一次,偶遇他的公司領導

      爸爸被公司外派出國3年至今沒回來過一次,偶遇他的公司領導

      小秋情感說
      2025-12-07 15:01:03
      俄軍全押了!1000公里正面,10個集團軍全線進攻,烏軍形勢很不妙

      俄軍全押了!1000公里正面,10個集團軍全線進攻,烏軍形勢很不妙

      輝輝歷史記
      2025-12-08 11:11:24
      美國擬30個月內全面對華禁售高端AI芯片!

      美國擬30個月內全面對華禁售高端AI芯片!

      中國半導體論壇
      2025-12-08 12:54:51
      這般親密互動,王菲看了能接受嗎?全然不顧及旁人感受引爭議!

      這般親密互動,王菲看了能接受嗎?全然不顧及旁人感受引爭議!

      小椰的奶奶
      2025-12-06 03:02:26
      賴昌星前妻現狀曝光:曾明娜獨居3000平老宅,穿麻布衣用灶臺做飯

      賴昌星前妻現狀曝光:曾明娜獨居3000平老宅,穿麻布衣用灶臺做飯

      小濤叨叨
      2025-12-03 18:49:44
      1949年,潘文華起義前,發現枕邊人七姨太是特務,處理方式厲害了

      1949年,潘文華起義前,發現枕邊人七姨太是特務,處理方式厲害了

      興趣知識
      2025-12-08 13:22:03
      年輕鎮長匯報獲書記稱贊,上車后組織部長接到指示:查他背后的人

      年輕鎮長匯報獲書記稱贊,上車后組織部長接到指示:查他背后的人

      曉艾故事匯
      2025-12-03 08:18:13
      為什么說冥王星是太陽系最恐怖的星球?它的名字就是答案

      為什么說冥王星是太陽系最恐怖的星球?它的名字就是答案

      兔斯基聊科學
      2025-12-06 17:48:08
      72歲曾志偉和紅顏知己現身日本大阪逛商場購物,手牽手很親密

      72歲曾志偉和紅顏知己現身日本大阪逛商場購物,手牽手很親密

      陳意小可愛
      2025-12-06 01:59:29
      豬頭肉再次成為關注對象!醫生發現:常吃豬頭肉,或收獲5大好處

      豬頭肉再次成為關注對象!醫生發現:常吃豬頭肉,或收獲5大好處

      讀懂世界歷史
      2025-11-26 09:46:00
      16GB+1TB!新機官宣:搭載天璣 9400++9000mAh!

      16GB+1TB!新機官宣:搭載天璣 9400++9000mAh!

      科技堡壘
      2025-12-06 11:58:40
      最低1℃!雙峰將迎寒潮大風、降雨天氣

      最低1℃!雙峰將迎寒潮大風、降雨天氣

      雙峰生活
      2025-12-08 14:56:47
      皇馬主場0比2塞爾塔,心態失衡紅牌左右賽果,三大進攻利器啞火

      皇馬主場0比2塞爾塔,心態失衡紅牌左右賽果,三大進攻利器啞火

      云兒評球
      2025-12-08 14:51:01
      詹姆斯復出后湖人至今6勝1負!他有數據是喬丹的5倍以上!

      詹姆斯復出后湖人至今6勝1負!他有數據是喬丹的5倍以上!

      氧氣是個地鐵
      2025-12-08 14:03:19
      2025-12-08 17:03:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11824文章數 176340關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

      頭條要聞

      40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      重磅!政治局會議定調明年經濟工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      家居
      手機
      數碼
      藝術
      公開課

      家居要聞

      有限無界 打破慣有思維

      手機要聞

      匯頂科技為三星首款三折疊屏手機觸控方案供應商

      數碼要聞

      惠普、戴爾等回應漲價:由于配件漲價 電腦肯定也漲價

      藝術要聞

      一棵樹的力量

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻少妇不满足中文字幕| 长阳| 国产香蕉97碰碰久久人人| 少妇激情一区二区三区视频小说| 图片区小说区激情区偷拍区| 欧美日本激情| 亚洲播播| 国产tsAV| 亚洲人成网站999久久久综合| 天天伊人久久| 虞城县| 超碰人人超碰人人| 亚洲中文字幕无码一区日日添| 日韩高清在线中文字带字幕| 青草青草久热国产精品| 亚州脚交| 丰满熟女乱婬A片六区| 国产成人久久| 亚洲无码21| 青椒国产97在线熟女| 大陆一级毛片免费播放| 天天综合久久| 精品日本一区二区三区在线观看| 久久久久无码国产精品不卡| 91超碰在线精品| 夜夜欢视频| 亚洲gv猛男gv无码男同| 國产一二三内射在线看片| 一本久久a久久精品综合| 99热色| 国产精品人妻一区二区高| 99久热在线精品996热是什么| 男女xx00xx的视频免费观看| 亚洲精选91| 国产av人人夜夜澡人人爽麻豆| 自拍偷自拍亚洲精品播放| 久久久久人妻精品一区三寸 | AV不卡在线| 好吊色欧美一区二区三区视频| 视频一区视频二区视频三| 1024国产基地|