<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      喂垃圾數據=毀模型?最新研究:AI 腦腐不可逆,清洗也救不了

      0
      分享至


      大數據文摘出品

      最近,德州農工大學與德州大學奧斯汀分校的研究團隊,在論文中提出一個結論:大模型可能會“腦腐”。

      他們稱之為“LLM Brain Rot Hypothesis”,意指當模型長期暴露在低質量網絡文本中時,其認知能力會持續退化,并表現出與人類“信息上癮”相似的癥狀。

      研究團隊在論文中指出,這種退化不是臨時的,而是深層、持久、且難以修復的結構性損傷

      與人類的“腦腐”類似,模型的癥狀包括注意力衰退、推理鏈斷裂、長期記憶混亂、以及性格傾向扭曲。

      他們的核心發現是:持續在垃圾數據上預訓練,會讓模型永久變笨。


      在受污染的模型中,邏輯推理準確率下降超過20個百分點,長文本理解下降幅度可達40%。

      甚至,在心理人格測試中,模型出現了“自戀”“精神病傾向”等特征。

      實驗如何驗證“腦腐”:從推文到推理

      論文設計了一個極具象征意義的實驗:讓模型“沉迷社交媒體”。

      研究者從Twitter(現X平臺)采集了上百萬條推文,按兩種方式劃分“垃圾內容”。

      第一種是M1:互動度維度——短且高熱度的內容,被視為典型的“快感型垃圾”。

      第二種是M2:語義質量維度——內容空洞、煽動性強、使用標題黨詞匯或夸張情緒的文字。

      團隊用這兩類數據分別對四個主流開源模型(包括Llama3與Qwen系列)進行持續預訓練,并以干凈語料作為對照組。

      結果令人震驚。在M1條件下,模型在ARC推理測試中的表現從74.9分驟降至57.2分,長文本檢索任務RULER的得分則從84.4降至52.3。

      也就是說,“越刷短內容,越失去思考能力。”


      圖注:數據顯示“腦腐化”內容往往更短、更受歡迎但語義質量低,人類與GPT對語義質量的判斷高度一致。

      研究者將這種衰退模式稱為“劑量響應”:垃圾數據比例越高,能力退化越明顯。

      更進一步,他們分析了模型的思考過程,發現最主要的“病灶”是,思維跳步(Thought-skipping)

      模型在推理時往往不再展開完整思考,而是直接跳過中間推理鏈,草率給出結論。

      這種行為被稱為“認知短路”,類似人類沉迷短視頻后的專注力下降。


      作者用四類基準(ARC、RULER、HH-RLHF/AdvBench、TRAIT)來評估大模型的推理、記憶與多任務、倫理規范及人格傾向等認知功能。

      退化不可逆:清洗與微調都救不了

      論文進一步分析了退化的內部模式。主要發現是,垃圾數據訓練后模型出現推理鏈中斷(thought-skipping)現象。

      模型在回答問題時更傾向直接給出結論,而非展開逐步推理。

      研究者使用GPT-4o-mini對思維鏈進行分類,發現超過70%的錯誤來自“無思考”或“思維跳步”,而非單純邏輯錯誤。

      這一現象與人類在高強度信息刺激下的“注意力割裂”表現相似,但研究者強調,該結果并非類比結論,而是統計規律。


      隨著“垃圾內容”比例上升,模型在推理、長上下文理解、倫理安全及人格穩定性等各項認知功能上普遍退化,驗證了“腦腐化”效應。

      團隊還進行了劑量效應分析(dose–response),結果表明:垃圾數據比例與性能下降幅度成近線性關系。

      隨后,研究者嘗試通過額外的指令微調與干凈數據繼續訓練來“修復”模型。

      即使增加五倍規模的清潔數據進行指令調優,模型仍未完全恢復至基線性能。

      這說明所謂的“腦腐”效應可能不是格式錯配,而是參數空間層面的結構漂移(representational drift)

      研究還測試了反思式推理(Reflective Reasoning)等無訓練修復方法。

      結果顯示,使用外部強模型提供反饋(如GPT-4o-mini)能部分恢復推理鏈完整性,但無法完全修復性能差距。

      團隊據此提出,“模型認知衰退”可能在訓練過程中被永久編碼進參數分布中。

      論文最后指出,這一發現將數據質量問題轉化為訓練安全問題(training-time safety)

      作者建議未來建立“模型認知健康檢查”機制,用于監控預訓練數據的組成與長期效果。

      他們強調,本研究并未證明所有社交媒體數據均為有害樣本,但結果提示,數據來源的復雜性與語義深度,可能直接決定模型的長期穩定性。

      研究團隊在論文結論中寫道:“持續暴露于低質量文本會造成可驗證的認知退化,這種退化具有持續性且難以逆轉。”

      這項研究提供了首次系統證據,說明數據質量不僅影響模型性能,也影響模型的內部認知結構。

      它將“AI訓練數據質量”從經驗問題轉變為可量化、可因果驗證的科學議題。

      作者呼吁,在大模型持續擴展的時代,數據篩選與長期維護應被視為認知安全的一部分。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

      南京一派出所副所長為完成查處任務,“設計”讓6名未成年人吸毒再查獲,犯欺騙他人吸毒罪一審被判5年

      大風新聞
      2026-04-25 22:34:13
      一旦武統臺灣,這4個臺灣人必上“斬首”名單,一個都跑不掉!

      一旦武統臺灣,這4個臺灣人必上“斬首”名單,一個都跑不掉!

      混沌錄
      2026-04-23 21:14:04
      快扔掉!戴一天,輻射量相當于拍117次胸片

      快扔掉!戴一天,輻射量相當于拍117次胸片

      極目新聞
      2025-10-28 11:13:51
      中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

      中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

      福建睿平
      2026-04-26 10:53:36
      動力電池下半場,瑞浦蘭鈞如何押注場景、平臺、全球化

      動力電池下半場,瑞浦蘭鈞如何押注場景、平臺、全球化

      芯流智庫
      2026-04-26 11:10:21
      又一個3-0!SGA42+8雷霆再勝太陽,布魯克斯33+7布克16中6

      又一個3-0!SGA42+8雷霆再勝太陽,布魯克斯33+7布克16中6

      湖人崛起
      2026-04-26 06:03:20
      小米:李某華已被行拘

      小米:李某華已被行拘

      南方都市報
      2026-04-26 12:01:47
      白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

      白宮開槍兇手是老師?網傳其剛在洛杉磯拿了“月度優秀教師”獎

      爆角追蹤
      2026-04-26 12:16:15
      霍爾木茲海峽,傳來大消息!伊朗總統,最新發聲!比特幣跳水,超9.9萬人爆倉!

      霍爾木茲海峽,傳來大消息!伊朗總統,最新發聲!比特幣跳水,超9.9萬人爆倉!

      證券時報e公司
      2026-04-25 22:11:02
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      圓明園地下大反轉,大火燒掉的僅是圓明園的表皮

      圓明園地下大反轉,大火燒掉的僅是圓明園的表皮

      混沌錄
      2026-04-24 21:02:11
      從攤位被擋到全網撐腰,長沙后湖這個煎餅攤前隊伍越排越長,女攤主有個樸素簡單的愿望

      從攤位被擋到全網撐腰,長沙后湖這個煎餅攤前隊伍越排越長,女攤主有個樸素簡單的愿望

      瀟湘晨報
      2026-04-25 21:02:19
      孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

      孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

      醫脈圈
      2026-04-25 20:04:06
      兩男子應聘浦發銀行銷售代表,通過3輪面試,做了497元體檢,工資卡都辦好了,銀行卻以學歷不符為由拒絕入職

      兩男子應聘浦發銀行銷售代表,通過3輪面試,做了497元體檢,工資卡都辦好了,銀行卻以學歷不符為由拒絕入職

      大象新聞
      2026-04-24 16:49:09
      俄朝圖們江二橋主體正式合攏!比一橋更矮,摯友關系似乎更貼近了

      俄朝圖們江二橋主體正式合攏!比一橋更矮,摯友關系似乎更貼近了

      歷史擺渡
      2026-04-25 22:30:03
      北京緊急通報!柬埔寨國王在華手術,全程不回本國,原因不簡單

      北京緊急通報!柬埔寨國王在華手術,全程不回本國,原因不簡單

      白淺娛樂聊
      2026-04-26 06:58:48
      30多家法院集體引用一部“空氣法”:這不是荒唐劇,是恐怖片

      30多家法院集體引用一部“空氣法”:這不是荒唐劇,是恐怖片

      迷世書童H9527
      2026-04-25 14:15:25
      消息人士:白宮記協晚宴安全事件嫌疑人作案目標為美政府官員

      消息人士:白宮記協晚宴安全事件嫌疑人作案目標為美政府官員

      新京報
      2026-04-26 13:39:07
      37歲男籃傳奇人物:定居廣東,身居要職財富自由,娶嬌妻生雙胞胎

      37歲男籃傳奇人物:定居廣東,身居要職財富自由,娶嬌妻生雙胞胎

      尋墨閣
      2026-04-26 01:21:55
      白宮記協晚宴安全事件嫌疑人為一名來自加州的30歲男子

      白宮記協晚宴安全事件嫌疑人為一名來自加州的30歲男子

      界面新聞
      2026-04-26 10:15:44
      2026-04-26 14:07:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6853文章數 94542關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      白宮槍手系教師兼游戲開發者 曾向哈里斯總統競選捐款

      頭條要聞

      白宮槍手系教師兼游戲開發者 曾向哈里斯總統競選捐款

      體育要聞

      那一刻開始,兩支球隊的命運悄然改變了

      娛樂要聞

      《八千里路云和月》大結局意難平

      財經要聞

      DeepSeek V4背后,梁文鋒的轉身

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      游戲
      藝術
      家居
      本地
      公開課

      《光與影:33號遠征隊》迎來發售一周年紀念

      藝術要聞

      鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

      家居要聞

      自然肌理 溫潤美學

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国内精品视频一区二区三区| 久爱无码精品免费视频在线观看| 一区二区三区激情免费视频| 亚洲日韩av无码一区二区三区人 | 亚州精品人妻一二三区| 日韩精品一区二区三区中文无码 | 亚洲高清国产拍精品网络战| 伊人五月综合| 五月天黄色电影| 亚洲图片另类| 天天摸天天做天天爽天天舒服| 亚洲国产精品一区二区视频| 337p日本欧洲亚洲大胆裸体艺术| 日日噜噜夜夜爽爽| 亚洲AV第一页| 99久久99久久精品国产片| 人妻人操| 亚洲第一成人在线| 久久夜色撩人精品国产av| 乱人伦中文无码视频在线观看| 九九九国产| 日本免费一区二区三区国产视频 | www色色色com| 护士的小嫩嫩好紧好爽| 99中文在线精品| 亚州精品成人| 超碰av在线| 久久综合色之久久综合| 狠狠v日韩v欧美v| 你懂得视频亚洲| 国产va免费精品观看精品| 女女互揉吃奶揉到高潮视频| 久久久久女教师免费一区| 黄色段片一区二区三区| 无翼乌口工全彩无遮挡h全彩| 禹州市| 中文字幕在线无码一区二区三区| 久久伊人五月天| 377人体粉嫩噜噜噜| 成人午夜大片| 亚洲色一区二区|