<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      金魚損失隨機(jī)剔除token,讓AI不再死記硬背

      0
      分享至

      henry 發(fā)自 凹非寺
      量子位 | 公眾號 QbitAI

      訓(xùn)練大模型時,有時讓它“記性差一點(diǎn)”,反而更聰明!

      大語言模型如果不加約束,很容易把訓(xùn)練數(shù)據(jù)原封不動地復(fù)刻出來。為解決這個問題,來自馬里蘭大學(xué)、圖賓根大學(xué)和馬普所的研究團(tuán)隊(duì)提出了一個新方法——金魚損失(Goldfish Loss)



      顧名思義,金魚損失就是讓模型像金魚一樣,不去死記每一個細(xì)節(jié),而是在損失函數(shù)計算時隨機(jī)剔除一小部分token。

      由此,模型不再逐字記住訓(xùn)練集內(nèi)容,但仍能學(xué)會語言規(guī)律。

      實(shí)驗(yàn)顯示,LLaMA-2在使用金魚損失后:

      • 記憶化內(nèi)容顯著減少:模型不再復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)
      • 下游任務(wù)性能幾乎不受影響:仍然能流暢生成文本

      用網(wǎng)友的精辟評論概括就是:dropout,但損失函數(shù)!



      在梯度計算中隨機(jī)屏蔽部分token

      金魚損失的核心理念非常簡單,就是在模型訓(xùn)練過程中隨機(jī)剔除一部分訓(xùn)練文本中的tokens,使其不參與損失計算。

      這樣一來,當(dāng)模型在推理階段遇到這些位置時,就只能“猜測”,而不是逐字逐句復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)的完整序列。

      此外,為了保證被剔除token的一致性,研究人員設(shè)計了一種基于哈希(hashing)的掩碼策略。



      那么,這和同樣是防止模型背會的正則化方法有什么不同呢?

      Dropout這樣的正則化方法為例,它通過在訓(xùn)練時“加噪聲”來防止模型過度依賴某些參數(shù),從而提高模型舉一反三的能力。

      但這樣做的問題在于:如果只是隨機(jī)丟token,那么,每次看到同一段落時,丟掉的地方不一樣,模型累計幾次就能拼湊出完整段落。

      所以,說到底,模型還是靠死記硬背,記住了答案。

      相比之下,金魚損失則用哈希掩碼確保每次遇到同一段落,掩蓋位置都一樣,這就從根本上阻止了模型復(fù)現(xiàn)完整訓(xùn)練文本。

      接下來,我們來看金魚損失具體是怎么做的。

      在傳統(tǒng)的next-token prediction中,模型以序列中的下一個真實(shí)token作為目標(biāo),輸出預(yù)測分布,并基于該分布計算交叉熵?fù)p失。



      在金魚損失下,模型雖然也在前向傳播中預(yù)測序列里下一個 token。但在計算損失時,會以一定的概率將某些位置的token從損失計算里“抹掉”。

      也就是說,有些真實(shí)的下一個token不會作為目標(biāo)來訓(xùn)練。



      在這里,研究人員采用了簡單的靜態(tài)掩碼(static mask),剔除每序列中的第4個token。

      更進(jìn)一步,為了確保模型不會從其他地方學(xué)到被掩碼的數(shù)據(jù)(例如不同的文檔會在不同的網(wǎng)頁中反復(fù)出現(xiàn)),研究團(tuán)隊(duì)還提出了一種局部化哈希掩碼(localized hashed mask),使得當(dāng)相同的前h個token出現(xiàn)時,掩蓋模式是相同的(可重復(fù))。

      實(shí)驗(yàn)測試與結(jié)果

      為了驗(yàn)證金魚損失確實(shí)能防止記憶化,研究團(tuán)隊(duì)設(shè)計了兩種實(shí)驗(yàn)場景:

      一種是極端場景,通過對少量樣本進(jìn)行多個訓(xùn)練周期(即重復(fù))來強(qiáng)烈促使記憶化;

      另一種是標(biāo)準(zhǔn)場景,模擬現(xiàn)實(shí)模型訓(xùn)練中使用的批次處理方式 。

      同時,為了評估模型的記憶化程度,研究采用了以下指標(biāo):

      • RougeL得分:該指標(biāo)衡量最長公共(非連續(xù))子序列的長度 。得分為1.0表示完美記憶 。
      • 精確匹配率(Exact Match):該指標(biāo)衡量正確預(yù)測的序列占真實(shí)序列的百分比.

      實(shí)驗(yàn)表明,在極端場景下,標(biāo)準(zhǔn)訓(xùn)練導(dǎo)致模型逐字記憶了100篇文章中的84篇,而金魚損失沒有記憶任何文章



      (注:實(shí)驗(yàn)讓LLaMA-2-7B在《哈利·波特》第一章或100篇維基百科文檔上進(jìn)一步訓(xùn)練了100個epoch)

      此外,在標(biāo)準(zhǔn)訓(xùn)練場景下,金魚損失也明顯減少了模型逐字復(fù)現(xiàn)訓(xùn)練語料庫中目標(biāo)序列的情況。



      但這里可能有個直覺式的反應(yīng)——如果讓模型“隨機(jī)漏學(xué)”一些token,它的能力會不會也隨之降低呢?

      對此,研究人員進(jìn)行了測試:研究表明,金魚損失模型、標(biāo)準(zhǔn)損失模型和對照模型之間的總體性能沒有系統(tǒng)性差異。



      需要注意的是,金魚損失的核心在于忽略部分token的梯度計算。因此,為了學(xué)到足夠的語言模式,模型必須通過更多數(shù)據(jù)來補(bǔ)償這些空缺,這可能導(dǎo)致計算效率的下降。

      [1]https://arxiv.org/pdf/2406.10209

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      王剛沒想到,離婚24年,成方圓會以這種方式,給自己上了生動一課

      王剛沒想到,離婚24年,成方圓會以這種方式,給自己上了生動一課

      胡一舸南游y
      2026-01-21 21:25:03
      山上徹也被判無期徒刑,日本網(wǎng)民抨擊高市政府

      山上徹也被判無期徒刑,日本網(wǎng)民抨擊高市政府

      中國青年報
      2026-01-21 17:45:07
      太陽光到達(dá)地球需上萬年非8分鐘 ,但對光子來說就是一瞬間的事

      太陽光到達(dá)地球需上萬年非8分鐘 ,但對光子來說就是一瞬間的事

      宇宙時空
      2026-01-19 20:50:05
      第四代住宅賣不動了?住進(jìn)去才知道的“七宗罪”

      第四代住宅賣不動了?住進(jìn)去才知道的“七宗罪”

      室內(nèi)設(shè)計師有料兒
      2026-01-20 11:23:56
      18歲伊斯蘭少女直播拒戴頭巾,被冷血父親榮譽(yù)處決。

      18歲伊斯蘭少女直播拒戴頭巾,被冷血父親榮譽(yù)處決。

      環(huán)球趣聞分享
      2026-01-07 13:30:09
      漢武帝為什么要閹了司馬遷?真相揭開后,感嘆:換你也要閹

      漢武帝為什么要閹了司馬遷?真相揭開后,感嘆:換你也要閹

      談史論天地
      2026-01-21 17:20:03
      開始回暖!四川人盼的太陽要回來了

      開始回暖!四川人盼的太陽要回來了

      魯中晨報
      2026-01-21 15:35:12
      創(chuàng)維欲退市,復(fù)牌股價大漲37%

      創(chuàng)維欲退市,復(fù)牌股價大漲37%

      21世紀(jì)經(jīng)濟(jì)報道
      2026-01-21 22:10:12
      急了!阿森納球星公開跪求續(xù)約:我要留隊(duì)奪冠!

      急了!阿森納球星公開跪求續(xù)約:我要留隊(duì)奪冠!

      奶蓋熊本熊
      2026-01-21 07:01:15
      35歲金晨增肥后更驚艷,穿灰色大衣坐公交像少女,美得像換了個人

      35歲金晨增肥后更驚艷,穿灰色大衣坐公交像少女,美得像換了個人

      蓓小西
      2025-11-29 08:58:22
      變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個時候的欲言又止

      變老的明顯特征是什么?網(wǎng)友:突然理解了醫(yī)生那個時候的欲言又止

      夜深愛雜談
      2026-01-09 21:32:55
      要奪冠?!U23國足三球大勝越南晉級亞洲杯決賽,球迷提前“過年”了!

      要奪冠?!U23國足三球大勝越南晉級亞洲杯決賽,球迷提前“過年”了!

      上觀新聞
      2026-01-21 04:40:03
      浙江男子失業(yè)一年,躺平出租房,全靠女友養(yǎng)!女友無奈:長得帥真沒用

      浙江男子失業(yè)一年,躺平出租房,全靠女友養(yǎng)!女友無奈:長得帥真沒用

      趣筆談
      2025-11-27 10:40:06
      1984年,張宗遜之子張又俠8個多小時拿下松毛嶺:預(yù)備隊(duì)還沒上呢

      1984年,張宗遜之子張又俠8個多小時拿下松毛嶺:預(yù)備隊(duì)還沒上呢

      歷史龍?jiān)w
      2026-01-20 10:40:11
      要被釋放?吳佩慈婆婆玩金蟬脫殼,早已再婚嫁給小28歲的美國高管

      要被釋放?吳佩慈婆婆玩金蟬脫殼,早已再婚嫁給小28歲的美國高管

      安寧007
      2026-01-21 21:36:32
      男生考上北大被父親暴打,走投無路報警,才知父親真實(shí)身份

      男生考上北大被父親暴打,走投無路報警,才知父親真實(shí)身份

      紙鳶奇譚
      2024-10-02 19:26:12
      母親是演員,二婚重組嫁翻譯官父親,難怪42歲尼格買提離婚無兒女

      母親是演員,二婚重組嫁翻譯官父親,難怪42歲尼格買提離婚無兒女

      好叫好伐
      2025-12-12 23:53:52
      藥師提醒:銀杏葉片、血塞通、復(fù)方丹參片,心腦血管用藥別再選錯

      藥師提醒:銀杏葉片、血塞通、復(fù)方丹參片,心腦血管用藥別再選錯

      蜉蝣說
      2026-01-17 18:36:03
      女人陪你去下面三個地方,就是想要和你越界了,藏不住

      女人陪你去下面三個地方,就是想要和你越界了,藏不住

      落雪聽梅a
      2025-12-23 12:10:06
      真不識貨啊!被易立棄用之人,如今場均23分5助,得分排全聯(lián)盟第4

      真不識貨啊!被易立棄用之人,如今場均23分5助,得分排全聯(lián)盟第4

      金山話體育
      2026-01-21 09:59:14
      2026-01-22 04:03:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      12044文章數(shù) 176361關(guān)注度
      往期回顧 全部

      科技要聞

      給機(jī)器人做仿真訓(xùn)練 這家創(chuàng)企年?duì)I收破億

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應(yīng)

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應(yīng)

      體育要聞

      只會防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現(xiàn)身嫣然醫(yī)院捐款

      財經(jīng)要聞

      丹麥打響第一槍 歐洲用資本保衛(wèi)格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價12.09萬起

      態(tài)度原創(chuàng)

      旅游
      游戲
      本地
      時尚
      公開課

      旅游要聞

      天宮燈會明日啟幕

      《FF7RE》N2版M站均分90分:無一差評質(zhì)量夯爆了

      本地新聞

      云游遼寧|漫步千年小城晨昏,“康”復(fù)好心情

      締造仙女夢的人,去了天堂繼續(xù)縫制星光?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲精品成人AV无码| 日韩国产色色网| 加勒比无码人妻东京热| 国产免费无码一区二区| 国产亚洲欧美精品永久| 亚洲无线国产观看| 亚洲男同志网站| 青草伊人网| 四虎av永久在线精品免费观看| 欧美人妻少妇| 亚洲AV成人一区二区三区在线| 欧美老熟妇乱子伦牲交视频| 久久精品国产亚洲av品善| 亚洲AV影视| 一本久道久久综合婷婷五月| 永久免费毛片在线播放| 高阳县| 亚洲a∨国产av综合av下载| 久久精品亚洲| 国产人妻丰满熟妇嗷嗷叫| 国产无码VA| 中文字幕日日夜夜| 91丨九色丨熟女|新版| 成年午夜免费韩国做受视频| 国产偷国产偷亚洲高清午夜| 大地资源网中文第一页| 国精产品一区一区三区有限在线| 欧美国产视频| 精品丝袜人妻久久久久久| 怡红院一区二区三区在线 | 天美传媒mv免费观看完整 | 免费在线视频a| 国产精品流白浆无遮挡| 大香伊蕉在人线国产最新2005 | 精品黑人一区二区三区| 99在线观看视频| 人妻少妇乱子伦精品无码专区电影| 丰满人妻一区二区三区在线视频53| 亚洲综合第一色| 亚洲欧美在线观看| 亚洲精品Aa|