<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      探針伸進(jìn)大模型黑箱,南加州大學(xué)華人打造AI記憶研究的深空望遠(yuǎn)鏡

      0
      分享至

      現(xiàn)在擺在面前的是 64 個 A100 組成的算力集群,如果給你 20 萬小時的訓(xùn)練時間,你會用它做什么?南加州大學(xué)的 Robin Jia 教授團隊給出了他們的答案:訓(xùn)練一組模型,把它們開源,讓更多人有機會深入理解大模型記憶的本質(zhì)。

      大語言模型(LLM)在預(yù)訓(xùn)練階段對訓(xùn)練數(shù)據(jù)集的精確記憶會帶來一系列安全風(fēng)險:《紐約時報》起訴 OpenAI 侵犯版權(quán);黑客通過特定提示詞套出訓(xùn)練集中的個人真實郵箱與電話;訓(xùn)練數(shù)據(jù)污染導(dǎo)致某些模型在各類權(quán)威基準(zhǔn)測試(Benchmark)中得分虛高……但長期以來,由于難以精準(zhǔn)控制訓(xùn)練數(shù)據(jù)集,探究大模型記憶的深層因果機制依然面臨重重限制。

      為了從量化并解決這一棘手難題,南加州大學(xué)(USC)與馬克斯·普朗克軟件系統(tǒng)研究所(MPI-SWS)等機構(gòu)的研究團隊,借助英偉達(dá)提供的海量計算資源,構(gòu)建出一組基于 Llama 3 架構(gòu)的全開源受控大模型,并將其命名為 Hubble。這項成果即將在 4 月底舉辦的機器學(xué)習(xí)頂會 ICLR 2026 上亮相,相關(guān)數(shù)據(jù)與代碼均已完全開源。


      圖 | Robin Jia(來源:https://robinjia.github.io/)

      從觀察到主動干預(yù),Hubble 構(gòu)建出模型記憶的“雙面鏡”

      提到 Hubble,人們最先想到的一定是哈勃太空望遠(yuǎn)鏡,而這項開源工作與它的重名并非巧合。研究的主要貢獻(xiàn)者,南加州大學(xué)博士生魏天正告訴 DeepTech,他們將模型命名為“Hubble”的初衷正來源于此:“大模型就像深邃復(fù)雜的宇宙,我們則是航天工程中的‘儀器科學(xué)家’,在 Hubble 模型中構(gòu)建并搭載特定的‘探測儀器’,再將它發(fā)射升空,以此精確觀測各種各樣的現(xiàn)象。”

      在 Hubble 之前,學(xué)術(shù)界研究大模型記憶動態(tài)的標(biāo)桿是 Pythia,這是一組 EleutherAI 團隊于 2023 年發(fā)布的模型套件,他們當(dāng)時開源了訓(xùn)練數(shù)據(jù)和中間檢查點,發(fā)布后便迅速成為研究大模型可解釋性、記憶研究和基準(zhǔn)設(shè)計的標(biāo)準(zhǔn)參考工具。截至目前,Pythia 已獲得近 2,000 引用。


      (來源:https://allegro-lab.github.io/hubble/)

      然而,Pythia 的訓(xùn)練數(shù)據(jù)來源于天然的互聯(lián)網(wǎng)語料,這導(dǎo)致研究人員無法進(jìn)行精確的因果推斷。例如,當(dāng) Pythia 復(fù)述出一段文本時,研究者們依然無法確定這是因為文本結(jié)構(gòu)簡單,還是因為其在訓(xùn)練集中出現(xiàn)的頻次足夠高。

      為解決缺乏對照組的問題,Hubble 團隊采用了“受控擾動”的研究方法。在實驗設(shè)計上,團隊首先對包含 100B 至 500B Token 的基座語料進(jìn)行了嚴(yán)格的過濾處理,剔除潛在的敏感匹配項。

      隨后,他們?nèi)斯ず铣闪巳悺罢T餌數(shù)據(jù)”,并將其精確植入擾動模型的訓(xùn)練集中:一類是受版權(quán)保護(hù)的暢銷書片段、冷門書片段及維基百科詞條;第二類則是通過 YAGO 知識圖譜合成的包含姓名、郵箱、出生地等關(guān)聯(lián)屬性的結(jié)構(gòu)化個人簡歷,以及歐洲人權(quán)法院的真實案卷。他們還為模型注入了 MMLU、HellaSwag 等模型通用基準(zhǔn)測試的原題及正確答案。此外,團隊也嚴(yán)格控制了這些“誘餌”在模型訓(xùn)練數(shù)據(jù)集中的重復(fù)頻次。

      投入 100 萬美元算力,研究揭示大模型記憶效應(yīng)

      在當(dāng)前的科研環(huán)境中,算力資源的獲取是制約高校團隊開展大規(guī)模預(yù)訓(xùn)練的核心瓶頸。而 Hubble 系列模型包含了 8 個分別為 1b、8b 參數(shù),并分別在 100B 和 500B Token 上進(jìn)行訓(xùn)練的標(biāo)準(zhǔn)模型和擾動模型。其基本性能與市面同等規(guī)模水平的模型持平,訓(xùn)練數(shù)據(jù)量則是 Pythia 的 1.6 倍。

      談及獲取算力支援的過程時,魏天正透露,團隊在 2024 年得知,美國國家科學(xué)基金會(NSF)主導(dǎo)的 NAIRR 試點項目正在為有潛力的 AI 學(xué)術(shù)研究團隊對接企業(yè)算力。憑借對 Hubble 的初步設(shè)想,他們獲得了英偉達(dá)捐贈的 20 萬小時、64 個 A100 GPU 算力,市場價值高達(dá) 100 萬美元。魏天正向 DeepTech 回憶了這段堪稱“夢幻”的經(jīng)歷,“其實一開始根本沒想到會拿到這么多。”

      值得一提的是,在正式使用前,團隊還有在 16 張 GPU 上“試用”一個月的機會。正是這一個月期間,研究人員進(jìn)行了高頻的超參調(diào)試與數(shù)據(jù)插入比例測試,迭代優(yōu)化實驗設(shè)計。跑通流程后,在接下來的四個月里,他們正式利用 A100 集群,順利完成了模型的全量訓(xùn)練。


      (來源:https://allegro-lab.github.io/hubble/)

      基于嚴(yán)密的受控實驗,該研究揭示了大模型記憶機制的兩大效應(yīng)。首先是稀釋效應(yīng)(Dilution)——相對頻率決定記憶強度。研究表明,決定模型是否記住某段敏感信息的并非絕對重復(fù)次數(shù),而是其在整個語料庫中的相對頻率。相同重復(fù)次數(shù)的信息,在 500B 語料庫中被提取的成功率顯著低于 100B 語料庫。這一發(fā)現(xiàn)也與 Pythia 得到的結(jié)果形成互證。

      其次是時序效應(yīng)(Timing Effects),“早出場,早遺忘”,數(shù)據(jù)暴露的時序會對模型的記憶能力產(chǎn)生影響。團隊通過切分訓(xùn)練階段發(fā)現(xiàn),如果受控隱私數(shù)據(jù)僅出現(xiàn)在預(yù)訓(xùn)練的前 25% 階段,且在后續(xù)訓(xùn)練中不再出現(xiàn),模型最終會像人類一樣出現(xiàn)“自然遺忘”,無法再準(zhǔn)確提取出這些信息。相反,出現(xiàn)在訓(xùn)練末期的數(shù)據(jù)則極易被牢牢記住。


      (來源:https://allegro-lab.github.io/hubble/)

      此外,模型訓(xùn)練和基本實驗結(jié)束后,團隊還利用三周多的富余算力,開展了一項有關(guān)模型深度與記憶能力關(guān)系的附加實驗。在保持總參數(shù)量不變的情況下,團隊訓(xùn)練了 8 層(淺寬型)、16 層(標(biāo)準(zhǔn)型)和 32 層(深窄型)三種架構(gòu)。結(jié)果發(fā)現(xiàn),層數(shù)越深的模型記憶能力越強。

      Johnny 解釋稱,因為更深的模型可能具備更強的表征靈活性,在擬合復(fù)雜長尾分布時,也附帶增強了對特定文本的逐字記憶能力。


      (來源:https://allegro-lab.github.io/hubble/)

      評估“機器遺忘”,事后干預(yù)的局限性

      面對隱私泄露與版權(quán)糾紛,諸多科技巨頭目前寄希望于“機器遺忘(Machine Unlearning)”技術(shù),即試圖在預(yù)訓(xùn)練完成后,通過微調(diào)或權(quán)重編輯技術(shù),將特定數(shù)據(jù)的影響從模型中“擦除”。基于這一理論,目前有三種較為前沿的遺忘算法:表征誤導(dǎo)遺忘(RMU)、表征重路由(RR)和飽和-重要性(SatImp)算法。

      有了 Hubble,研究人員決定讓三種算法站上擂臺,“真刀真槍”地比一比:在包含版權(quán)誘餌和隱私誘餌的 8B 參數(shù)、500B Token 擾動模型上進(jìn)行測試,不僅需要精確抹除應(yīng)當(dāng)被遺忘的“Unlearn 集”,還要盡可能保留與之相鄰的“Keep 集”和通用能力。

      結(jié)果顯示,盡管 SatImp 已經(jīng)是相對表現(xiàn)得最好的遺忘算法,但目前依舊沒有任何一種遺忘算法能夠?qū)δP蛯崿F(xiàn)完美的“無損記憶擦除”。


      (來源:https://allegro-lab.github.io/hubble/)

      魏天正告訴 DeepTech,“如果模型已經(jīng)被訓(xùn)練出來,想要在后期修改它的底層知識是非常困難的。”實驗也證實,由于 Dense Transformer 架構(gòu)中的知識呈現(xiàn)高度分布式和交織結(jié)構(gòu),現(xiàn)有的遺忘算法要么刪不干凈,要么“下手太重”,例如,在刪除版權(quán)書的同時,也會破壞模型正常的語言和常識推理能力。從工程角度,這項結(jié)論也在提醒產(chǎn)業(yè)界,目前,要想對抗數(shù)據(jù)記憶風(fēng)險,在預(yù)訓(xùn)練階段就應(yīng)提前敏感數(shù)據(jù)出場的時間,并對其進(jìn)行稀釋。

      法律層面的應(yīng)用潛力與未來研究方向

      研究團隊的法學(xué)交叉背景也讓他們敏銳地察覺到這項技術(shù)對現(xiàn)實法律判決的潛在影響。

      當(dāng)前,AI 公司因使用受版權(quán)保護(hù)的文章或代碼而面臨大規(guī)模集體訴訟時,往往選擇保持沉默。“大廠從來都不會公開他們的具體訓(xùn)練數(shù)據(jù),因為在美國,只要公布了,就會面臨起訴。但在法律上存在一個灰色地帶,到底在什么情況下可以用哪些數(shù)據(jù)做訓(xùn)練,到現(xiàn)在還沒有定論。”Johnny 向 DeepTech 解釋了目前的監(jiān)管困境。

      Hubble 的出現(xiàn)有望提供一種全新的解題思路。一方面,原創(chuàng)作者可以在自己的作品中故意植入高頻的、特定順序的“無邏輯字符”(誘餌水印),一旦大模型在提示下完整輸出了這些字符串,便能構(gòu)成其非法爬取且將其賦予高訓(xùn)練權(quán)重的事實證據(jù)。

      另一方面,對于遵循合規(guī)策略的大模型企業(yè),魏天正認(rèn)為,Hubble 的實驗?zāi)J接兄诖_立法律意義上的技術(shù)閾值。未來有可能會形成一個中間地帶。企業(yè)可以向監(jiān)管機構(gòu)或法庭證明,他們的數(shù)據(jù)稀釋策略已將特定樣本的權(quán)重降低至無法被精確提取的水平。這種基于量化指標(biāo)的舉證,在面對“合理使用(Fair Use)”的法律抗辯時將具備較強說服力。

      在被問及團隊的下一步計劃時,魏天正透露,得益于 Hubble 兼具“標(biāo)準(zhǔn)版”和“擾動版”的模型設(shè)計,他們已經(jīng)開始嘗試借助 Hubble,進(jìn)一步區(qū)分大模型的“機械記憶”與其真正需要具備的“泛化推理”能力。

      在訓(xùn)練中,標(biāo)準(zhǔn)模型從未見過任何測試集,擾動模型則被提前塞了一些“小抄”。團隊發(fā)現(xiàn),后者提前“看”到了考題,基準(zhǔn)測試得分就會顯著提升,但這往往基于記憶而非理解:題干稍加微調(diào),模型便會出錯。通過直接對比這兩種模型,結(jié)合探針(Probe)技術(shù),研究人員能夠識別模型在生成答案時的內(nèi)部狀態(tài)差異,進(jìn)而探索如何將受污染的分?jǐn)?shù)矯正至其真實的泛化水平。


      圖 | 哈勃望遠(yuǎn)鏡(來源:NASA)

      從誕生起,Hubble 就不是為了屠榜各大 Benchmark,它的構(gòu)建者希望 Hubble 可以像前輩 Pythia 一樣,成為學(xué)界探究模型的透明性和可解釋性的科學(xué)平臺,進(jìn)而推動訓(xùn)練出更負(fù)責(zé)任的 AI 模型。目前,Hubble 包含的 1B、8B 參數(shù)模型檢查點、誘餌數(shù)據(jù)集,以及團隊自主開發(fā)的高效數(shù)據(jù)處理管線 TokenSmith 均已在 Hugging Face 等平臺完全開源。

      “我們把 Hubble 交給整個科研社區(qū),可能會催生出更多意想不到的發(fā)現(xiàn)。”研究團隊期待,全球研究者能夠接力利用這套標(biāo)準(zhǔn)化工具,在浩瀚的數(shù)據(jù)宇宙中持續(xù)觀測和解碼那些尚未被照亮的“記憶暗物質(zhì)”。

      參考內(nèi)容:

      https://arxiv.org/pdf/2510.19811v1

      https://allegro-lab.github.io/hubble/

      運營/排版:何晨龍

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      浙大調(diào)查發(fā)現(xiàn):腸道內(nèi)有息肉的人,身體一般或可能有這6個特征

      浙大調(diào)查發(fā)現(xiàn):腸道內(nèi)有息肉的人,身體一般或可能有這6個特征

      垚垚分享健康
      2026-04-22 18:45:05
      孫儷有多美?04年她和楊冪片場合照,那年21歲,穿著旗袍溫婉清媚

      孫儷有多美?04年她和楊冪片場合照,那年21歲,穿著旗袍溫婉清媚

      阿纂看事
      2026-04-22 13:43:14
      40000 人陣亡,100 艘戰(zhàn)艦會被擊沉?

      40000 人陣亡,100 艘戰(zhàn)艦會被擊沉?

      小馬姨
      2026-04-21 09:49:45
      300067,連續(xù)3天20cm漲停!超160萬買單封板!

      300067,連續(xù)3天20cm漲停!超160萬買單封板!

      證券時報e公司
      2026-04-23 10:34:09
      一首代表作都沒有,還要撈金開演唱會,難怪被劉德華成龍“嫌棄”

      一首代表作都沒有,還要撈金開演唱會,難怪被劉德華成龍“嫌棄”

      無處不風(fēng)景l(fā)ove
      2026-04-23 09:13:07
      釋永信“開光”真相大白,過程不堪入目,易中天也被牽連

      釋永信“開光”真相大白,過程不堪入目,易中天也被牽連

      往史過眼云煙
      2026-03-24 17:05:24
      歐盟各國就擴大對伊朗制裁范圍達(dá)成一致

      歐盟各國就擴大對伊朗制裁范圍達(dá)成一致

      新京報
      2026-04-22 07:15:42
      金價一夜暴跌3500元!華爾街深夜砸盤,海量黃金卻瘋涌上海金庫

      金價一夜暴跌3500元!華爾街深夜砸盤,海量黃金卻瘋涌上海金庫

      青眼財經(jīng)
      2026-04-22 21:04:17
      休戰(zhàn)1個月!鄭欽文紅土首秀時間確定 再遇前澳網(wǎng)冠軍+交手2戰(zhàn)全勝

      休戰(zhàn)1個月!鄭欽文紅土首秀時間確定 再遇前澳網(wǎng)冠軍+交手2戰(zhàn)全勝

      我愛英超
      2026-04-23 07:19:46
      張柏芝沒料到,陪伴了謝霆鋒23年的女人,如今會讓他“深陷泥潭”

      張柏芝沒料到,陪伴了謝霆鋒23年的女人,如今會讓他“深陷泥潭”

      橙星文娛
      2026-04-23 09:00:22
      山西女籃87-80力克四川女籃,賽后球員表現(xiàn)評分:3滿分 2優(yōu)秀 3及格

      山西女籃87-80力克四川女籃,賽后球員表現(xiàn)評分:3滿分 2優(yōu)秀 3及格

      生活新鮮市
      2026-04-23 02:24:35
      讓華北的地下水上一次熱搜吧!

      讓華北的地下水上一次熱搜吧!

      細(xì)雨中的呼喊
      2026-04-22 13:29:31
      美國全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

      美國全世界逛一圈才發(fā)現(xiàn),自己扶持所有小弟里,最能打的還是老蔣

      呼呼體壇
      2026-04-19 18:26:54
      江蘇養(yǎng)老金差異:公平之戰(zhàn)的背后揭秘

      江蘇養(yǎng)老金差異:公平之戰(zhàn)的背后揭秘

      睡不著的床
      2026-04-23 08:26:46
      竟然全是假的!馬斯克掀開美國遮羞布,外媒:真相遠(yuǎn)比這震驚!

      竟然全是假的!馬斯克掀開美國遮羞布,外媒:真相遠(yuǎn)比這震驚!

      蜉蝣說
      2026-04-12 10:57:18
      名記:詹姆斯在單核輸球后,激勵全隊,并以身作則!

      名記:詹姆斯在單核輸球后,激勵全隊,并以身作則!

      歷史第一人梅西
      2026-04-23 09:50:55
      67歲的遲志強現(xiàn)狀,出獄37年后,定居黑龍江,兒子工作令人淚目

      67歲的遲志強現(xiàn)狀,出獄37年后,定居黑龍江,兒子工作令人淚目

      瓜哥的動物日記
      2026-04-22 16:20:45
      爆料!馬蹄露竟把張敬軒懟上了熱搜!

      爆料!馬蹄露竟把張敬軒懟上了熱搜!

      藝?yán)?/span>
      2026-04-23 09:49:11
      在醫(yī)院你遭遇過最羞恥的事是什么?網(wǎng)友:一個比一個炸裂啊

      在醫(yī)院你遭遇過最羞恥的事是什么?網(wǎng)友:一個比一個炸裂啊

      解讀熱點事件
      2026-02-04 00:05:07
      肺癌逐步成為可防、可控、可治的慢性病,上海醫(yī)生披露最新治療前沿

      肺癌逐步成為可防、可控、可治的慢性病,上海醫(yī)生披露最新治療前沿

      文匯報
      2026-04-22 16:50:11
      2026-04-23 11:19:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16614文章數(shù) 514897關(guān)注度
      往期回顧 全部

      科技要聞

      車沒賣爆,利潤卻大漲,特斯拉發(fā)布財報

      頭條要聞

      牛彈琴:伊朗開始反擊了 若戰(zhàn)火復(fù)燃全世界都倒霉

      頭條要聞

      牛彈琴:伊朗開始反擊了 若戰(zhàn)火復(fù)燃全世界都倒霉

      體育要聞

      萊斯特城降入英甲,一場虧麻了的豪賭

      娛樂要聞

      十大燒腦電影天花板:全程高能反轉(zhuǎn)

      財經(jīng)要聞

      全球第一個國家宣布:儲備6月耗盡

      汽車要聞

      長安"1445"戰(zhàn)略:一張走向"世界長安"的行軍地圖

      態(tài)度原創(chuàng)

      數(shù)碼
      時尚
      手機
      公開課
      軍事航空

      數(shù)碼要聞

      從入門開始,折騰飛牛OS NAS,主板處理器選購指南

      卷首語|“這些書有啥用?”“沒用,但好看!”

      手機要聞

      消息稱某廠驍龍8 Elite Gen6 Pro新機新開6.78英寸直屏

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普宣布延長停火 伊朗表態(tài)

      無障礙瀏覽 進(jìn)入關(guān)懷版