<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      金魚損失隨機(jī)剔除token,讓AI不再死記硬背

      0
      分享至

      henry 發(fā)自 凹非寺
      量子位 | 公眾號(hào) QbitAI

      訓(xùn)練大模型時(shí),有時(shí)讓它“記性差一點(diǎn)”,反而更聰明!

      大語言模型如果不加約束,很容易把訓(xùn)練數(shù)據(jù)原封不動(dòng)地復(fù)刻出來。為解決這個(gè)問題,來自馬里蘭大學(xué)、圖賓根大學(xué)和馬普所的研究團(tuán)隊(duì)提出了一個(gè)新方法——金魚損失(Goldfish Loss)



      顧名思義,金魚損失就是讓模型像金魚一樣,不去死記每一個(gè)細(xì)節(jié),而是在損失函數(shù)計(jì)算時(shí)隨機(jī)剔除一小部分token。

      由此,模型不再逐字記住訓(xùn)練集內(nèi)容,但仍能學(xué)會(huì)語言規(guī)律。

      實(shí)驗(yàn)顯示,LLaMA-2在使用金魚損失后:

      • 記憶化內(nèi)容顯著減少:模型不再復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)
      • 下游任務(wù)性能幾乎不受影響:仍然能流暢生成文本

      用網(wǎng)友的精辟評(píng)論概括就是:dropout,但損失函數(shù)!



      在梯度計(jì)算中隨機(jī)屏蔽部分token

      金魚損失的核心理念非常簡單,就是在模型訓(xùn)練過程中隨機(jī)剔除一部分訓(xùn)練文本中的tokens,使其不參與損失計(jì)算。

      這樣一來,當(dāng)模型在推理階段遇到這些位置時(shí),就只能“猜測(cè)”,而不是逐字逐句復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)的完整序列。

      此外,為了保證被剔除token的一致性,研究人員設(shè)計(jì)了一種基于哈希(hashing)的掩碼策略。



      那么,這和同樣是防止模型背會(huì)的正則化方法有什么不同呢?

      Dropout這樣的正則化方法為例,它通過在訓(xùn)練時(shí)“加噪聲”來防止模型過度依賴某些參數(shù),從而提高模型舉一反三的能力。

      但這樣做的問題在于:如果只是隨機(jī)丟token,那么,每次看到同一段落時(shí),丟掉的地方不一樣,模型累計(jì)幾次就能拼湊出完整段落。

      所以,說到底,模型還是靠死記硬背,記住了答案。

      相比之下,金魚損失則用哈希掩碼確保每次遇到同一段落,掩蓋位置都一樣,這就從根本上阻止了模型復(fù)現(xiàn)完整訓(xùn)練文本。

      接下來,我們來看金魚損失具體是怎么做的。

      在傳統(tǒng)的next-token prediction中,模型以序列中的下一個(gè)真實(shí)token作為目標(biāo),輸出預(yù)測(cè)分布,并基于該分布計(jì)算交叉熵?fù)p失。



      在金魚損失下,模型雖然也在前向傳播中預(yù)測(cè)序列里下一個(gè) token。但在計(jì)算損失時(shí),會(huì)以一定的概率將某些位置的token從損失計(jì)算里“抹掉”。

      也就是說,有些真實(shí)的下一個(gè)token不會(huì)作為目標(biāo)來訓(xùn)練。



      在這里,研究人員采用了簡單的靜態(tài)掩碼(static mask),剔除每序列中的第4個(gè)token。

      更進(jìn)一步,為了確保模型不會(huì)從其他地方學(xué)到被掩碼的數(shù)據(jù)(例如不同的文檔會(huì)在不同的網(wǎng)頁中反復(fù)出現(xiàn)),研究團(tuán)隊(duì)還提出了一種局部化哈希掩碼(localized hashed mask),使得當(dāng)相同的前h個(gè)token出現(xiàn)時(shí),掩蓋模式是相同的(可重復(fù))。

      實(shí)驗(yàn)測(cè)試與結(jié)果

      為了驗(yàn)證金魚損失確實(shí)能防止記憶化,研究團(tuán)隊(duì)設(shè)計(jì)了兩種實(shí)驗(yàn)場景:

      一種是極端場景,通過對(duì)少量樣本進(jìn)行多個(gè)訓(xùn)練周期(即重復(fù))來強(qiáng)烈促使記憶化;

      另一種是標(biāo)準(zhǔn)場景,模擬現(xiàn)實(shí)模型訓(xùn)練中使用的批次處理方式 。

      同時(shí),為了評(píng)估模型的記憶化程度,研究采用了以下指標(biāo):

      • RougeL得分:該指標(biāo)衡量最長公共(非連續(xù))子序列的長度 。得分為1.0表示完美記憶 。
      • 精確匹配率(Exact Match):該指標(biāo)衡量正確預(yù)測(cè)的序列占真實(shí)序列的百分比.

      實(shí)驗(yàn)表明,在極端場景下,標(biāo)準(zhǔn)訓(xùn)練導(dǎo)致模型逐字記憶了100篇文章中的84篇,而金魚損失沒有記憶任何文章



      (注:實(shí)驗(yàn)讓LLaMA-2-7B在《哈利·波特》第一章或100篇維基百科文檔上進(jìn)一步訓(xùn)練了100個(gè)epoch)

      此外,在標(biāo)準(zhǔn)訓(xùn)練場景下,金魚損失也明顯減少了模型逐字復(fù)現(xiàn)訓(xùn)練語料庫中目標(biāo)序列的情況。



      但這里可能有個(gè)直覺式的反應(yīng)——如果讓模型“隨機(jī)漏學(xué)”一些token,它的能力會(huì)不會(huì)也隨之降低呢?

      對(duì)此,研究人員進(jìn)行了測(cè)試:研究表明,金魚損失模型、標(biāo)準(zhǔn)損失模型和對(duì)照模型之間的總體性能沒有系統(tǒng)性差異。



      需要注意的是,金魚損失的核心在于忽略部分token的梯度計(jì)算。因此,為了學(xué)到足夠的語言模式,模型必須通過更多數(shù)據(jù)來補(bǔ)償這些空缺,這可能導(dǎo)致計(jì)算效率的下降。

      [1]https://arxiv.org/pdf/2406.10209

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      痛心!連霍高速十幾車連撞9死7傷,現(xiàn)場曝光十分慘烈,網(wǎng)友求改名

      痛心!連霍高速十幾車連撞9死7傷,現(xiàn)場曝光十分慘烈,網(wǎng)友求改名

      派大星紀(jì)錄片
      2025-12-07 11:46:14
      6國宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底!

      6國宣布出兵!中方不低頭也得低?揚(yáng)言和中方斗到底!

      花花娛界
      2025-12-06 19:38:20
      英偉達(dá)CEO的童年:9 歲打掃了100個(gè)男生的廁所

      英偉達(dá)CEO的童年:9 歲打掃了100個(gè)男生的廁所

      金融界
      2025-12-05 11:46:04
      知名演員官宣:已退出美國國籍,正式成為中國公民!

      知名演員官宣:已退出美國國籍,正式成為中國公民!

      每日經(jīng)濟(jì)新聞
      2025-12-05 23:33:03
      遭村民圍堵虧損數(shù)百萬?鎮(zhèn)政府讓加油站捐200萬換正常經(jīng)營

      遭村民圍堵虧損數(shù)百萬?鎮(zhèn)政府讓加油站捐200萬換正常經(jīng)營

      福建第一幫幫團(tuán)
      2025-12-06 16:21:28
      火車員工用裝垃圾的簸箕接開水,12306回應(yīng):暫無規(guī)定不能用簸箕接水,會(huì)反饋改進(jìn)

      火車員工用裝垃圾的簸箕接開水,12306回應(yīng):暫無規(guī)定不能用簸箕接水,會(huì)反饋改進(jìn)

      極目新聞
      2025-12-07 16:35:20
      醫(yī)療反腐要倒查十年:一退休整十年的三甲醫(yī)院院長被查

      醫(yī)療反腐要倒查十年:一退休整十年的三甲醫(yī)院院長被查

      金水路7號(hào)站
      2025-12-07 11:52:11
      剛剛結(jié)束中國訪問的馬克龍,幾乎是腳剛沾地就立刻翻臉不認(rèn)賬

      剛剛結(jié)束中國訪問的馬克龍,幾乎是腳剛沾地就立刻翻臉不認(rèn)賬

      我心縱橫天地間
      2025-12-07 16:03:04
      央視曝光新毒物!已流竄到全國,一級(jí)致癌超9000多倍,多人已中招

      央視曝光新毒物!已流竄到全國,一級(jí)致癌超9000多倍,多人已中招

      不寫散文詩
      2025-12-06 13:02:50
      衛(wèi)冕!中國隊(duì)奪得乒乓球混團(tuán)世界杯冠軍

      衛(wèi)冕!中國隊(duì)奪得乒乓球混團(tuán)世界杯冠軍

      澎湃新聞
      2025-12-07 21:20:31
      浙金中心爆雷了!諸多投資客欲哭無淚,有多名網(wǎng)友表示投了200萬

      浙金中心爆雷了!諸多投資客欲哭無淚,有多名網(wǎng)友表示投了200萬

      火山詩話
      2025-12-07 17:26:51
      廣東小伙見義勇為救下落水小孩,接受了一條煙,家長:以為他不會(huì)要,那條煙很貴.....

      廣東小伙見義勇為救下落水小孩,接受了一條煙,家長:以為他不會(huì)要,那條煙很貴.....

      上海約飯局
      2025-12-07 15:17:31
      機(jī)構(gòu)數(shù)據(jù):一線城市餐廳閉店率35% 僅北京人均消費(fèi)還能過百

      機(jī)構(gòu)數(shù)據(jù):一線城市餐廳閉店率35% 僅北京人均消費(fèi)還能過百

      西虹市閑話
      2025-12-07 12:55:59
      散戶的盛宴,還是老板的晚餐,10萬人掩護(hù)下,潮汕富豪悄然撤退

      散戶的盛宴,還是老板的晚餐,10萬人掩護(hù)下,潮汕富豪悄然撤退

      壹只灰鴿子
      2025-12-06 21:45:08
      拿下特斯拉大單,手握2家上市公司!“中國最大忽悠”要翻身了?

      拿下特斯拉大單,手握2家上市公司!“中國最大忽悠”要翻身了?

      品牌觀察官
      2025-12-07 20:49:20
      美國 突發(fā)!

      美國 突發(fā)!

      每日經(jīng)濟(jì)新聞
      2025-12-07 10:38:23
      壓軸王者!新機(jī)官宣:12月25日,即將發(fā)布上市!

      壓軸王者!新機(jī)官宣:12月25日,即將發(fā)布上市!

      科技堡壘
      2025-12-07 12:02:22
      辣眼睛!"搶鏡伴娘"刷爆網(wǎng)絡(luò),深V禮服幾乎掉落,新郎眼神失控

      辣眼睛!"搶鏡伴娘"刷爆網(wǎng)絡(luò),深V禮服幾乎掉落,新郎眼神失控

      派大星紀(jì)錄片
      2025-12-06 14:32:19
      要小心!不要真以為去甘蔗地里處男女朋友,廣西這個(gè)提示太及時(shí)了

      要小心!不要真以為去甘蔗地里處男女朋友,廣西這個(gè)提示太及時(shí)了

      火山詩話
      2025-12-07 07:23:45
      王晶終于坦白!陳百強(qiáng)英年早逝主因不是何超瓊,原來我們都被騙了

      王晶終于坦白!陳百強(qiáng)英年早逝主因不是何超瓊,原來我們都被騙了

      白面書誏
      2025-12-07 13:06:30
      2025-12-08 00:31:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      11820文章數(shù) 176340關(guān)注度
      往期回顧 全部

      科技要聞

      獨(dú)家|李笛再創(chuàng)業(yè),炮轟大模型,再戰(zhàn)AI

      頭條要聞

      高市涉臺(tái)言論事發(fā)1個(gè)月 日方倒苦水:中國卡稀土審批

      頭條要聞

      高市涉臺(tái)言論事發(fā)1個(gè)月 日方倒苦水:中國卡稀土審批

      體育要聞

      梅開48度!2年半,這是梅西在邁阿密的一人一城

      娛樂要聞

      林俊杰AAA頒獎(jiǎng)禮,韓娛愛豆均站起鞠躬

      財(cái)經(jīng)要聞

      五糧液降價(jià)?回應(yīng)來了

      汽車要聞

      傳奇超跑電動(dòng)形態(tài)重生 雷克薩斯LFA純電概念車

      態(tài)度原創(chuàng)

      旅游
      親子
      時(shí)尚
      公開課
      軍事航空

      旅游要聞

      “粵享暖冬 樂游廣東”!惠陽冬季文旅消費(fèi)季七大活動(dòng)來襲

      親子要聞

      倆娃干仗,哄好趕緊把老師布置的作業(yè)完成

      遼京:當(dāng)一個(gè)媽媽開始寫作

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      日本稱中方雷達(dá)照射日戰(zhàn)機(jī) 國防部回應(yīng)

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 中文字幕人妻系列人妻?无码| 永久免费AV无码网站YY| 精品熟女少妇免费久久| 三成人免费看| 亚洲色伊人| 中文字幕va一区二区三区| 特黄视频| jizz喷水| 天等县| 夜夜爽妓女8888888视频| 蜜臀av午夜一区二区三区| 亚洲精品不卡av在线播放| 亚洲成人在线播放| 99蜜桃在线观看免费视频网站 | 国产超碰人人| 国产精品亚洲mnbav网站| 成人一区二区三区在线午夜| 亚洲精品中文字幕无码蜜桃| 国产成人无码一二三区视频| 三河市| www.91自拍| 又色又爽又黄18禁美女裸身无遮挡| 国产日产欧产精品精品| 国产亚洲欧洲AⅤ综合一区| 国产黄片视频在线观看| 国产亚洲精久久久久久无码77777| 久久不见久久见免费影院视频| 蜜臀98精品国产免费观看| 亚洲深夜| 人妻无码中文字幕免费视频蜜桃| 图片区小说区激情区偷拍区| ..真实国产乱子伦毛片| 武邑县| 人人超碰人摸人爱| www射我里面在线观看| 美女成人网站| 综合一区二区| 2024av天堂手机在线观看| 国产精品自在自线免费观看| 亚洲免费成人网站| 麻豆tv入口在线看|