![]()
新智元報(bào)道
編輯:傾傾
【新智元導(dǎo)讀】Anthropic殺瘋了!開(kāi)年第一篇論文直接化身自爆卡車(chē),實(shí)錘AI正在讓程序員變傻。你以為效率提高了?其實(shí)只快了2分鐘。
作為2026年公認(rèn)最強(qiáng)的編程AI,Anthropic竟然搞了波「反向帶貨」,甩出一份2026開(kāi)年最狠的論文,指著所有用戶(hù)的鼻子罵:
別以為你在提效率,你只是在把腦子外包給機(jī)器,然后慢慢變蠢!
![]()
論文地址:https://arxiv.org/abs/2601.20245
更諷刺的是,研究發(fā)現(xiàn)用AI輔助的人,只比純手寫(xiě)的人快了120秒,但是付出的代價(jià)遠(yuǎn)不止如此。
Anthropic這次親手撕碎了AI提升職業(yè)上限的謊言,數(shù)據(jù)讓人后背發(fā)涼。
![]()
17%的認(rèn)知「稅」
AI到底讓你變蠢了多少?
Anthropic選擇了52名有Python經(jīng)驗(yàn)的工程師,讓他們使用一個(gè)不熟悉的Python庫(kù)(Trio)編寫(xiě)功能。
![]()
研究設(shè)計(jì)示意圖:實(shí)驗(yàn)組組在三重任務(wù)中使用AI協(xié)助,控制組全程無(wú)AI。
結(jié)果顯示,完全靠自己手寫(xiě)代碼的一組,測(cè)驗(yàn)平均分達(dá)到了67%;而使用AI助手的一組,平均分僅為50%。
這17%的差距什么概念?直接讓你從阿里P7連降三級(jí)跌回校招實(shí)習(xí)生。
更恐怖的是「理解真空」。
實(shí)驗(yàn)發(fā)現(xiàn),AI組在Debug環(huán)節(jié)全線(xiàn)崩盤(pán)。
也就是說(shuō),當(dāng)AI生成的代碼出現(xiàn)邏輯偏差時(shí),這批開(kāi)發(fā)者不僅不知道怎么改,甚至連「哪兒錯(cuò)了」都看不出來(lái)。
這與CodeRabbit 2025年的行業(yè)數(shù)據(jù)形成了驚人的「死亡閉環(huán)」:AI生成的代碼,邏輯錯(cuò)誤率比人寫(xiě)的暴漲75%,整體缺陷率高達(dá)1.7倍。
![]()
AI代碼issues曲線(xiàn)直接碾壓人類(lèi),平均1.7倍缺陷(10.83vs6.45),極端情況更夸張
AI共同創(chuàng)作PR平均問(wèn)題量1.7倍(10.83vs6.45),極端情況2倍(26vs12.3)
你以為你在用AI「彎道超車(chē)」,實(shí)際上你是在賽博空間里瘋狂堆砌「屎山」。
你省下的那些敲鍵盤(pán)時(shí)間,全變成了未來(lái)修Bug時(shí)流的淚。
快了2分鐘?那是統(tǒng)計(jì)學(xué)的謊言
但我快啊!天下武功唯快不破!有人不服。
Anthropic反手就是一巴掌:在學(xué)習(xí)新東西時(shí),AI帶來(lái)的速度優(yōu)勢(shì),約等于
實(shí)驗(yàn)數(shù)據(jù)顯示,使用了AI的工程師、確實(shí)比手寫(xiě)組完成得快了一點(diǎn)——具體來(lái)說(shuō),快了大約2分鐘。
然而,這一差異并沒(méi)有達(dá)到統(tǒng)計(jì)學(xué)顯著的標(biāo)準(zhǔn)。
最抽象的一幕出現(xiàn)了:為了讓AI寫(xiě)對(duì)一段代碼,有人足足改了15版Prompt,耗時(shí)11分鐘。
你以為你是AI的主人?不,你是幫它改需求的卑微乙方。
這不叫提效,這叫賽博版《等待戈多》。
職場(chǎng)達(dá)爾文時(shí)刻:你是「宿主」還是「電池」?
既然AI有毒,那我們要立刻斷網(wǎng)、回歸石器時(shí)代嗎?這顯然是另一種愚蠢。
Anthropic拋出了一個(gè)結(jié)論:并不是所有使用AI的人都在變傻。
研究團(tuán)隊(duì)通過(guò)逐幀分析錄屏,將52名工程師的交互行為歸納為五種模式。
![]()
AI輔助測(cè)驗(yàn)得分暴跌17%(50%vs67%),速度優(yōu)勢(shì)僅2分鐘且不顯著
死亡組:大腦托管者
這是一群被AI徹底「廢掉」的工程師。他們的認(rèn)知卸載達(dá)到了頂峰。
1.「甩手掌柜」模式:
這群人完全把AI當(dāng)外包。他們直接把需求扔給AI,然后全盤(pán)接受生成的代碼。
他們完成任務(wù)的速度最快,甚至在過(guò)程中沒(méi)遇到什么報(bào)錯(cuò)。
但在測(cè)驗(yàn)中,他們徹底崩盤(pán)。
2.「溫水煮青蛙」模式:
這群人剛開(kāi)始還試圖掙扎一下,問(wèn)一兩個(gè)概念問(wèn)題,但很快就放棄抵抗,全面轉(zhuǎn)向「幫我寫(xiě)代碼」。
他們的結(jié)果最為慘烈:由于在任務(wù)后半段完全放棄了思考,他們不僅沒(méi)學(xué)到東西,連前半段的記憶也被沖刷殆盡。
進(jìn)化組:主動(dòng)拷問(wèn)者
這群人的交互方式完全不同。他們把AI當(dāng)作「蘇格拉底式的導(dǎo)師」。
1.只動(dòng)口不動(dòng)手」模式
這是唯一真正利用AI進(jìn)化的模式。
他們只向AI詢(xún)問(wèn)概念和原理,然后堅(jiān)持自己親手寫(xiě)代碼。
雖然他們遇到的報(bào)錯(cuò)最多,還得花時(shí)間自己修Bug,但這種「痛苦」卻轉(zhuǎn)化為了極高的掌握度。
更反直覺(jué)的是,這組人不僅分高,速度還是所有高分模式中最快的。
2.「先生成后追問(wèn)」模式
這是一種折中但有效的策略。他們先讓AI生成代碼,但絕不直接復(fù)制粘貼。
他們會(huì)盯著生成的代碼,反過(guò)來(lái)追問(wèn)AI:「這一行為什么要這么寫(xiě)?」、「有沒(méi)有更好的寫(xiě)法?」。
他們用AI來(lái)檢查自己的理解,而不是替代自己的理解。
垂死掙扎組:無(wú)效努力
這一類(lèi)人最慘。
他們既想自己寫(xiě),又在遇到Bug時(shí)立刻慌神,瘋狂把錯(cuò)誤拋給AI求救。結(jié)果陷入了無(wú)休止的「報(bào)錯(cuò)-AI修-再報(bào)錯(cuò)」循環(huán)。
他們花的時(shí)間最長(zhǎng),分?jǐn)?shù)卻依然很低。因?yàn)樗麄儧](méi)有在這個(gè)過(guò)程中建立任何因果邏輯,只是在盲目試錯(cuò)。
痛苦是學(xué)習(xí)的必要條件。如果你在使用AI時(shí)感到無(wú)比絲滑、毫無(wú)阻礙,警鐘就該響了——你可能正在退化。
更可怕的是,這不只是個(gè)人問(wèn)題,企業(yè)也在為此買(mǎi)單。
高分組的秘密:主動(dòng)找虐
別慌,AI不一定會(huì)讓你變傻,但前提是你得「反人性」地使用。
在Anthropic的實(shí)驗(yàn)中,有約23%的開(kāi)發(fā)者(12名)在AI的輔助下依然拿到了65%以上的高分。
研究拆解出三種能夠?qū)崿F(xiàn)效率與深度雙贏的高分模式:
模式一:概念查詢(xún)
這是全場(chǎng)表現(xiàn)最驚艷的群體。他們只向AI詢(xún)問(wèn)底層概念和原理,然后堅(jiān)持自己動(dòng)手寫(xiě)出每一行邏輯代碼。
雖然在這個(gè)過(guò)程中他們遇到了最多的報(bào)錯(cuò),但由于是獨(dú)立解決Bug,他們對(duì)Trio庫(kù)的記憶極深。
結(jié)果是,這種模式的綜合速度排名全場(chǎng)第二,且考核得分最高。
模式二:生成后拆解
這類(lèi)開(kāi)發(fā)者會(huì)先讓AI生成代碼,但絕不直接運(yùn)行。
他們會(huì)手動(dòng)將代碼復(fù)制到編輯器中,并針對(duì)每一行邏輯向AI追問(wèn):「為什么要這么寫(xiě)?」「這個(gè)異步鎖的邏輯是什么?」
這種「回溯式學(xué)習(xí)」雖然犧牲了一定的速度,但在掌握度上與純手寫(xiě)組不相上下。
模式三:混合解釋請(qǐng)求
他們?cè)诎l(fā)送提示詞時(shí),會(huì)強(qiáng)制要求AI在輸出代碼的同時(shí)提供詳盡的原理注釋。
通過(guò)同步閱讀解釋和代碼,他們?cè)诓僮鬟^(guò)程中就完成了知識(shí)的內(nèi)化。
高分開(kāi)發(fā)者通過(guò)主動(dòng)制造障礙,維持了心理學(xué)上的「必要難度」。
![]()
他們明白,AI提供的絲滑感是學(xué)習(xí)的敵人。真正的強(qiáng)者會(huì)把AI關(guān)進(jìn)「蘇格拉底式」的籠子里,只讓它提供指引,而不交出主權(quán)。
Anthropic這份報(bào)告,不只是給開(kāi)發(fā)者看的,更是扇向盲目追求KPI的管理層的一記耳光。
當(dāng)你為團(tuán)隊(duì)本月代碼量暴漲30%而歡呼時(shí),你公司的「技術(shù)資產(chǎn)」可能正在急速縮水。
初級(jí)工程師為了趕Deadline,正在批量淪為AI復(fù)制粘貼機(jī)器。
這哪里是技術(shù)團(tuán)隊(duì),這分明是搖搖欲墜的「屎山施工隊(duì)」。
AI時(shí)代的頂級(jí)門(mén)檻,早已不是寫(xiě)代碼的手速,而是對(duì)邏輯的絕對(duì)主權(quán)。
轉(zhuǎn)發(fā)給你身邊的「復(fù)制粘貼黨」,問(wèn)問(wèn)他:是為了這120秒爽一把,還是想保住你的腦子?
參考資料:
https://x.com/AnthropicAI/status/2016960382968136138?s=20
https://www.coderabbit.ai/ja/blog/state-of-ai-vs-human-code-generation-report
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.