<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<center id="y8pjt"></center>

<rt id="y8pjt"><var id="y8pjt"></var></rt><ruby id="y8pjt"></ruby>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權(quán)郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

喂垃圾數(shù)據(jù)=毀模型？最新研究：AI 腦腐不可逆，清洗也救不了

2025-10-24 12:13:17　來源: 大數(shù)據(jù)文摘

北京舉報

0

分享至

大數(shù)據(jù)文摘出品

最近，德州農(nóng)工大學(xué)與德州大學(xué)奧斯汀分校的研究團隊，在論文中提出一個結(jié)論：大模型可能會“腦腐”。

他們稱之為“LLM Brain Rot Hypothesis”，意指當模型長期暴露在低質(zhì)量網(wǎng)絡(luò)文本中時，其認知能力會持續(xù)退化，并表現(xiàn)出與人類“信息上癮”相似的癥狀。

研究團隊在論文中指出，這種退化不是臨時的，而是深層、持久、且難以修復(fù)的結(jié)構(gòu)性損傷。

與人類的“腦腐”類似，模型的癥狀包括注意力衰退、推理鏈斷裂、長期記憶混亂、以及性格傾向扭曲。

他們的核心發(fā)現(xiàn)是：持續(xù)在垃圾數(shù)據(jù)上預(yù)訓(xùn)練，會讓模型永久變笨。

在受污染的模型中，邏輯推理準確率下降超過20個百分點，長文本理解下降幅度可達40%。

甚至，在心理人格測試中，模型出現(xiàn)了“自戀”“精神病傾向”等特征。

實驗如何驗證“腦腐”：從推文到推理

論文設(shè)計了一個極具象征意義的實驗：讓模型“沉迷社交媒體”。

研究者從Twitter（現(xiàn)X平臺）采集了上百萬條推文，按兩種方式劃分“垃圾內(nèi)容”。

第一種是M1：互動度維度——短且高熱度的內(nèi)容，被視為典型的“快感型垃圾”。

第二種是M2：語義質(zhì)量維度——內(nèi)容空洞、煽動性強、使用標題黨詞匯或夸張情緒的文字。

團隊用這兩類數(shù)據(jù)分別對四個主流開源模型（包括Llama3與Qwen系列）進行持續(xù)預(yù)訓(xùn)練，并以干凈語料作為對照組。

結(jié)果令人震驚。在M1條件下，模型在ARC推理測試中的表現(xiàn)從74.9分驟降至57.2分，長文本檢索任務(wù)RULER的得分則從84.4降至52.3。

也就是說，“越刷短內(nèi)容，越失去思考能力。”

圖注：數(shù)據(jù)顯示“腦腐化”內(nèi)容往往更短、更受歡迎但語義質(zhì)量低，人類與GPT對語義質(zhì)量的判斷高度一致。

研究者將這種衰退模式稱為“劑量響應(yīng)”：垃圾數(shù)據(jù)比例越高，能力退化越明顯。

更進一步，他們分析了模型的思考過程，發(fā)現(xiàn)最主要的“病灶”是，思維跳步（Thought-skipping）。

模型在推理時往往不再展開完整思考，而是直接跳過中間推理鏈，草率給出結(jié)論。

這種行為被稱為“認知短路”，類似人類沉迷短視頻后的專注力下降。

作者用四類基準（ARC、RULER、HH-RLHF/AdvBench、TRAIT）來評估大模型的推理、記憶與多任務(wù)、倫理規(guī)范及人格傾向等認知功能。

退化不可逆：清洗與微調(diào)都救不了

論文進一步分析了退化的內(nèi)部模式。主要發(fā)現(xiàn)是，垃圾數(shù)據(jù)訓(xùn)練后模型出現(xiàn)推理鏈中斷（thought-skipping）現(xiàn)象。

模型在回答問題時更傾向直接給出結(jié)論，而非展開逐步推理。

研究者使用GPT-4o-mini對思維鏈進行分類，發(fā)現(xiàn)超過70%的錯誤來自“無思考”或“思維跳步”，而非單純邏輯錯誤。

這一現(xiàn)象與人類在高強度信息刺激下的“注意力割裂”表現(xiàn)相似，但研究者強調(diào)，該結(jié)果并非類比結(jié)論，而是統(tǒng)計規(guī)律。

隨著“垃圾內(nèi)容”比例上升，模型在推理、長上下文理解、倫理安全及人格穩(wěn)定性等各項認知功能上普遍退化，驗證了“腦腐化”效應(yīng)。

團隊還進行了劑量效應(yīng)分析（dose–response），結(jié)果表明：垃圾數(shù)據(jù)比例與性能下降幅度成近線性關(guān)系。

隨后，研究者嘗試通過額外的指令微調(diào)與干凈數(shù)據(jù)繼續(xù)訓(xùn)練來“修復(fù)”模型。

即使增加五倍規(guī)模的清潔數(shù)據(jù)進行指令調(diào)優(yōu)，模型仍未完全恢復(fù)至基線性能。

這說明所謂的“腦腐”效應(yīng)可能不是格式錯配，而是參數(shù)空間層面的結(jié)構(gòu)漂移（representational drift）。

研究還測試了反思式推理（Reflective Reasoning）等無訓(xùn)練修復(fù)方法。

結(jié)果顯示，使用外部強模型提供反饋（如GPT-4o-mini）能部分恢復(fù)推理鏈完整性，但無法完全修復(fù)性能差距。

團隊據(jù)此提出，“模型認知衰退”可能在訓(xùn)練過程中被永久編碼進參數(shù)分布中。

論文最后指出，這一發(fā)現(xiàn)將數(shù)據(jù)質(zhì)量問題轉(zhuǎn)化為訓(xùn)練安全問題（training-time safety）。

作者建議未來建立“模型認知健康檢查”機制，用于監(jiān)控預(yù)訓(xùn)練數(shù)據(jù)的組成與長期效果。

他們強調(diào)，本研究并未證明所有社交媒體數(shù)據(jù)均為有害樣本，但結(jié)果提示，數(shù)據(jù)來源的復(fù)雜性與語義深度，可能直接決定模型的長期穩(wěn)定性。

研究團隊在論文結(jié)論中寫道：“持續(xù)暴露于低質(zhì)量文本會造成可驗證的認知退化，這種退化具有持續(xù)性且難以逆轉(zhuǎn)。”

這項研究提供了首次系統(tǒng)證據(jù)，說明數(shù)據(jù)質(zhì)量不僅影響模型性能，也影響模型的內(nèi)部認知結(jié)構(gòu)。

它將“AI訓(xùn)練數(shù)據(jù)質(zhì)量”從經(jīng)驗問題轉(zhuǎn)變?yōu)榭闪炕⒖梢蚬炞C的科學(xué)議題。

作者呼吁，在大模型持續(xù)擴展的時代，數(shù)據(jù)篩選與長期維護應(yīng)被視為認知安全的一部分。

注：頭圖AI生成

作者長期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù)，歡迎對這些方向感興趣的朋友添加微信Q1yezi，共同交流行業(yè)動態(tài)與技術(shù)趨勢！

GPU 訓(xùn)練特惠！

H100/H200 GPU算力按秒計費，平均節(jié)省開支30%以上！

掃碼了解詳情?

點「贊」的人都變好看了哦！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

國產(chǎn)大模型“春節(jié)檔”混戰(zhàn)，一文看懂豆包是怎么打這仗的

鈦媒體APP 2026-02-18 20:49:39
0 跟貼 0
字節(jié)Seed團隊發(fā)布循環(huán)語言模型Ouro，在預(yù)訓(xùn)練階段直接「思考」

機器之心Pro 2025-11-04 11:58:36
0 跟貼 0

英偉達參與合作，華人團隊打造AI芯片算法HeaRT，推理準確率超97%

DeepTech深科技 2026-02-18 19:46:01
3 跟貼 3

印度一大學(xué)拿中國機器狗冒充自研

環(huán)球時報 2026-02-18 16:09:05
2162 跟貼 2162
懂人性更懂執(zhí)行，螞蟻這個萬億開源模型把情商和戰(zhàn)斗力都給拉滿了

量子位 2026-02-19 12:45:37
2 跟貼 2

Claude最強Sonnet模型4.6來了，百萬token上下文

機器之心Pro 2026-02-18 21:11:29
2 跟貼 2

谷歌Gemini上線AI音樂創(chuàng)作，一夜革了Suno的命！

新智元 2026-02-19 12:39:23
2 跟貼 2
清華聯(lián)手千問重塑歸一化范式，讓 Transformer 回歸「深度」學(xué)習(xí)

機器之心Pro 2026-02-10 18:50:12
0 跟貼 0

春晚之后，AI和機器人為啥都去了一個地方？

量子位 2026-02-19 12:40:49
5 跟貼 5
45億紅包打響AI入口大戰(zhàn)，百度給出另一種回應(yīng)

量子位 2026-02-19 17:54:22
0 跟貼 0
高通萬衛(wèi)星談終端大模型優(yōu)勢：個性化與數(shù)據(jù)推理

量子位 2025-12-11 03:38:41
0 跟貼 0
15%全量Attention！「RTPurbo」阿里Qwen3長文本推理5倍壓縮方案

機器之心Pro 2025-12-23 12:52:34
0 跟貼 0
女子下樓扔垃圾，竟還收獲意外之喜，勤儉持家做到骨子里！

搞怪仙人掌 2026-02-18 10:23:00
1 跟貼 1
近日，青海。車主自駕青海遇男子招手搭車，男子去快遞站給孩子們?nèi)∵^冬物資，車主好心送男子去學(xué)校，車主：

中安在線 2026-02-18 22:00:26
122 跟貼 122
內(nèi)蒙古草原名場面！狼偷不著羊，就跟藏獒貼貼，網(wǎng)友：前狼假寐，蓋以誘敵

BRTV新聞 2026-02-19 07:15:56
148 跟貼 148
醫(yī)生研究腦梗死者，揭示易患腦梗六大共性規(guī)律

抄手 2026-02-17 01:00:49
18 跟貼 18
媒體：馬克龍真魔怔了在印度還暗戳戳提中國

澎湃新聞 2026-02-18 22:58:24
1733 跟貼 1733
架構(gòu)解耦是統(tǒng)一多模態(tài)模型所必須的嗎？全新AIA損失：No

機器之心Pro 2025-12-02 14:25:38
0 跟貼 0
匈牙利、斯洛伐克宣布暫停向烏克蘭出口柴油

財聯(lián)社 2026-02-18 23:58:05
2367 跟貼 2367
霸主邏輯：美國如何“鎖死”日本三十年？

雅兒姐游世界 2026-02-18 01:26:18
0 跟貼 0
女子拋妻兒子26年，兒子靠撿垃圾長大，老了帶一身病要兒子贍

心動投遞員 2026-02-15 04:53:28
17 跟貼 17
反向過年新潮流：老外扎堆來中國，單日飛三亞外國游客大增3倍

每日經(jīng)濟新聞 2026-02-15 11:30:33
2624 跟貼 2624
國服關(guān)羽蘇打鋒發(fā)現(xiàn)關(guān)羽馬年皮膚隱藏機制，局內(nèi)血條隱藏術(shù)

挽風(fēng)游戲解說 2026-02-18 18:52:10
5 跟貼 5
Claude最新Sonnet：Opus級智能，性價比王炸，OpenClaw天選API

量子位 2026-02-18 16:13:32
5 跟貼 5
媽媽，啊呸，是你等了21天的露露卡終于來了

緣葉二次元 2026-02-18 16:43:08
0 跟貼 0
小伙徒手搓出一輛考斯特汽車模型，真的是太牛了

宸宸愛發(fā)明V 2026-02-15 13:44:08
4 跟貼 4
崴前腳的是理想，崴后腳的是比亞迪，工業(yè)垃圾瞬間體現(xiàn)！

欣欣旅行家 2026-02-19 00:03:00
2 跟貼 2
大烏黑客設(shè)陷阱，假聊天機器人竊數(shù)據(jù)，俄2400星鏈終端遭殃

倔強的毛驢 2026-02-17 18:52:23
0 跟貼 0
按照規(guī)律填一填，下面3個括號里分別填幾呢？

公考客棧店小二 2026-02-17 18:00:00
0 跟貼 0
南方人在飯店吃席，吐出來的垃圾放在盤子里，小伙表示不理解！

生活徐徐樂 2026-02-15 05:50:21
22 跟貼 22
“爸媽來后冰箱都變老了！”網(wǎng)友：原來全國都這樣

都市快報橙柿互動 2026-02-18 00:22:49
1032 跟貼 1032
2026年，從大國博弈到區(qū)域沖突，輸贏的核心邏輯是什么？

忠誠TALK 2026-02-18 08:00:53
1 跟貼 1
有游客在胖東來買到搬不動了：買了5000多元的年貨，還花了500多元的快遞費

極目新聞 2026-02-15 14:37:25
1294 跟貼 1294
他26歲，有糖尿病，冬天情緒不好.... 加拿大說：你可以去死了.... 啊?

英國那些事兒 2026-02-18 23:23:36
1 跟貼 1
十個很準的規(guī)律

東北丫頭 2026-02-18 12:49:30
0 跟貼 0
法國1萬人村莊連續(xù)10年自費過春節(jié)

極目新聞 2026-02-19 11:18:51
670 跟貼 670
七星連珠的規(guī)律

帆雨動畫 2026-02-16 09:27:33
12 跟貼 12
剛提的新車，車主評價一針見血，價值18萬的工業(yè)垃圾！

歡樂多爆笑 2026-02-18 08:41:00
9 跟貼 9
摸魚都摸不好的顧問：越負責、越疲憊

CMKT咨詢?nèi)?2026-02-18 21:28:08
0 跟貼 0
東北夫妻爆笑邏輯解生活難題

星光墜落r 2026-02-18 09:15:10
0 跟貼 0

伊朗國防部隊：進入全面?zhèn)鋺?zhàn)狀態(tài)

伊朗國防部隊：進入全面?zhèn)鋺?zhàn)狀態(tài)

每日經(jīng)濟新聞

2026-02-19 16:07:49

意大利知名地標“愛情拱門”突然崩塌，永久消失，當?shù)厥虚L：曾有成千上萬的情侶來打卡，旅游業(yè)遭“毀滅性打擊”

意大利知名地標“愛情拱門”突然崩塌，永久消失，當?shù)厥虚L：曾有成千上萬的情侶來打卡，旅游業(yè)遭“毀滅性打擊”

大風(fēng)新聞

2026-02-17 19:26:03

南京一商場晚上突發(fā)火災(zāi)，看電影的觀眾緊急逃生，應(yīng)急部門：火已撲滅，無人傷亡

南京一商場晚上突發(fā)火災(zāi)，看電影的觀眾緊急逃生，應(yīng)急部門：火已撲滅，無人傷亡

極目新聞

2026-02-19 12:49:48

浙江一地通知：即日起全域禁止銷售

浙江一地通知：即日起全域禁止銷售

都市快報橙柿互動

2026-02-19 17:58:37

后續(xù)，江蘇一家人吃飯父親酒后掀桌，兒子透露更多，以后不回家了

后續(xù)，江蘇一家人吃飯父親酒后掀桌，兒子透露更多，以后不回家了

離離言幾許

2026-02-18 23:24:35

第3金還要耐心等待！天公不作美，中國隊冬奧熱門沖金項再次延期

第3金還要耐心等待！天公不作美，中國隊冬奧熱門沖金項再次延期

全景體育V

2026-02-19 10:10:31

南方大米產(chǎn)量第一，為啥超市里大部分還是東北米？南方米去哪了？

南方大米產(chǎn)量第一，為啥超市里大部分還是東北米？南方米去哪了？

天下十三洲獵奇

2026-02-18 23:53:55

突發(fā)！美國出手封殺多家中國機構(gòu)

突發(fā)！美國出手封殺多家中國機構(gòu)

芯火相承

2026-02-19 10:02:18

42歲王濛再破天花板！退役12年，再次讓李琰和整個冰壇“沉默”了

42歲王濛再破天花板！退役12年，再次讓李琰和整個冰壇“沉默”了

翰飛觀事

2026-02-16 11:29:39

林丹在西班牙過年，別墅內(nèi)景曝光，全家人與朋友除夕吃海鮮大餐

林丹在西班牙過年，別墅內(nèi)景曝光，全家人與朋友除夕吃海鮮大餐

手工制作阿殲

2026-02-19 11:58:33

再立新功！俄價值超1.2億美元的S-300VM與道爾防空系統(tǒng)遭摧毀

再立新功！俄價值超1.2億美元的S-300VM與道爾防空系統(tǒng)遭摧毀

軍迷戰(zhàn)情室

2026-02-18 23:58:09

2018年，張扣扣向王家復(fù)仇，唯獨不殺王自新妻子：她有不死的理由

2018年，張扣扣向王家復(fù)仇，唯獨不殺王自新妻子：她有不死的理由

米果說識

2026-02-19 09:32:34

凌晨發(fā)送恐嚇信息？桔子酒店涉事門店：已報警，非員工發(fā)送

凌晨發(fā)送恐嚇信息？桔子酒店涉事門店：已報警，非員工發(fā)送

大風(fēng)新聞

2026-02-19 09:46:23

12死！湖北煙花店爆炸：店主身份被扒，大量內(nèi)幕披露，知情者發(fā)聲

12死！湖北煙花店爆炸：店主身份被扒，大量內(nèi)幕披露，知情者發(fā)聲

博士觀察

2026-02-19 00:06:41

2月17日俄烏最新： 2.5 年來的最大戰(zhàn)果

2月17日俄烏最新： 2.5 年來的最大戰(zhàn)果

西樓飲月

2026-02-17 20:49:47

湖北12死煙花爆燃：死者身份公布，大量內(nèi)部照流出，責任人被控制

湖北12死煙花爆燃：死者身份公布，大量內(nèi)部照流出，責任人被控制

博士觀察

2026-02-19 11:41:09

尹錫悅庭審細節(jié)曝光：被判無期只瞥了一眼法官，離庭時與律師相視一笑！法官闡述為何不判死刑

尹錫悅庭審細節(jié)曝光：被判無期只瞥了一眼法官，離庭時與律師相視一笑！法官闡述為何不判死刑

紅星新聞

2026-02-19 17:28:30

太尷尬了！大年初一，上海網(wǎng)友哭訴稱大門被鄰居貼兩張“大字報”

太尷尬了！大年初一，上海網(wǎng)友哭訴稱大門被鄰居貼兩張“大字報”

火山詩話

2026-02-19 15:05:12

襄陽宜城煙花店才50多平米，要了12條人命！最害人的，或是防盜網(wǎng)

襄陽宜城煙花店才50多平米，要了12條人命！最害人的，或是防盜網(wǎng)

火山詩話

2026-02-19 13:50:13

坐3.6億飛機，戴1000萬名表，拿5000萬炒股的秦奮究竟什么背景

坐3.6億飛機，戴1000萬名表，拿5000萬炒股的秦奮究竟什么背景

涵豆說娛

2026-01-19 17:21:55

大數(shù)據(jù)文摘

專注大數(shù)據(jù)，每日有分享！

6825文章數(shù) 94529關(guān)注度

往期回顧全部

科技要聞

怒燒45億，騰訊字節(jié)阿里決戰(zhàn)春節(jié)

頭條要聞

媒體：高市2.0 日本政局發(fā)生了意料之中的變動

頭條要聞

媒體：高市2.0 日本政局發(fā)生了意料之中的變動

體育要聞

中國隊第二金！徐夢桃贏女子空中技巧兩連冠邵琪銅牌

娛樂要聞

明星過年百態(tài)！黃曉明等現(xiàn)身三亞

財經(jīng)要聞

面條火腿香菇醬！上市公司這些年請你吃

汽車要聞

量產(chǎn)甲醇插混吉利銀河星耀6甲醇插混版申報圖

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術(shù)

本地

家居

手機

公開課

藝術(shù)要聞

震驚！安徒生竟是畫家，他的田園生活太美了！

本地新聞

春花齊放2026：《駿馬奔騰迎新歲》

家居要聞

本真棲居愛暖伴流年

中古雅韻樂韻伴日常
簡雅閑居靜享時光柔
寧靜港灣靈動與詩意

手機要聞

全球限14臺：Caviar推“愛之翼”限量iPhone 17 Pro/Max

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產(chǎn)30天

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進入關(guān)懷版