別再一鍵貼代碼！Anthropic點名3種「用AI不退化」真方法

2026-02-24 12:33:22　來源: 新智元

北京舉報

分享至

新智元報道

編輯：peter東

【新智元導(dǎo)讀】在AI編程時代，效率飆升卻隱藏危機：Anthropic最新研究揭示，使用AI助手雖能快速生成代碼，但開發(fā)者在概念理解、代碼閱讀和調(diào)試能力上顯著落后。獨立解決問題才是技能之鑰，AI若不當(dāng)用，將成「懶惰陷阱」。

2026年初，Anthropic研究揭開了AI輔助編程對技能學(xué)習(xí)的潛在風(fēng)險，使用AI助手完成編程任務(wù)的開發(fā)者，在概念理解、代碼閱讀和調(diào)試能力上顯著落后于獨立解決問題的同行。

技能退化

AI編程讓人難以鍛煉調(diào)試能力

在AI編程助手日益普及的今天，軟件工程領(lǐng)域生產(chǎn)力顯著提升。然而，代價是什么？

假設(shè)你是一個程序員，現(xiàn)在要用一個新的庫來進行開發(fā)。

之前你遇到問題，只能接入網(wǎng)絡(luò)搜索引擎和文檔；現(xiàn)在能訪問基于GPT-4o的AI編程助手。你會覺得哪一種更有利于你掌握這個庫？

在這項研究中，被試者需要學(xué)會一個小眾的Python異步編程庫Trio，每個受試者都是初次使用該庫進行編程。

被試者被隨機分為兩組。一組只用搜索學(xué)習(xí)，一組只通過大模型問答學(xué)習(xí)。

圖1：實驗設(shè)計方案

任務(wù)完成后，被試者接受了一項精心設(shè)計的技能評估測驗，涵蓋概念理解、代碼閱讀和調(diào)試能力三個方面，以衡量他們對Trio庫的掌握程度。

與普遍認(rèn)知相反，AI輔助并未顯著縮短任務(wù)完成時間（圖2左邊）。盡管AI助手能夠直接生成完整正確的代碼解決方案，但實驗組的平均完成時間并未顯著優(yōu)于對照組。

圖2：人們使用AI與否與編程速度和技能評估得分

為何會這樣？細(xì)分后發(fā)現(xiàn)，這源于參與者使用AI方式的巨大差異：

一部分參與者完全委托AI生成代碼，確實大幅提高了效率；
另一部分參與者花費大量時間與AI交互，甚至有人單次查詢就耗時6分鐘，抵消了效率優(yōu)勢。

更值得關(guān)注的是技能評估結(jié)果：AI使用組在測驗中的表現(xiàn)明顯較差，得分平均低4.15分，而滿分為27分。

AI使用組的調(diào)試能力與不使用AI組的差距最為明顯，代碼閱讀能力的差距相對較小。這表明，獨立解決問題的過程中遇到的錯誤和調(diào)試經(jīng)歷，對技能形成至關(guān)重要。

為何調(diào)試能力差距最大？那是因為沒有使用AI的參與者平均遇到3個錯誤，而使用AI的平均僅遇到1個錯誤。

這些錯誤，尤其是與Trio庫直接相關(guān)的錯誤，迫使開發(fā)者深入理解庫的工作原理，從而促進了學(xué)習(xí)。

三種學(xué)習(xí)路徑：

用了AI仍保有高技能

通過對使用AI組的行為進行細(xì)致分析，從中識別出六種不同的AI交互模式，宛如六條截然不同的學(xué)習(xí)路徑。

其中三條路徑通向技能退化，而另外三條則成功保持了技能形成水平。

四名參與者將任務(wù)一股腦地委托給AI，他們完成任務(wù)最快，但技能得分最低。就像把整個學(xué)習(xí)過程外包給了機器，自己成了旁觀者。

另外四名參與者開始時還算謹(jǐn)慎，只問一兩個問題，但很快陷入了漸進式依賴的陷阱。隨著任務(wù)難度增加，他們最終完全放棄了獨立思考，將所有代碼生成交給AI。

最令人惋惜的是那些迭代式調(diào)試者。他們頻繁向AI求助，每次遇到問題就粘貼錯誤信息，依賴AI提供解決方案。表面上看起來很努力，實際上卻錯過了最重要的學(xué)習(xí)機會——獨立解決問題的過程。

圖3：不同類型的AI使用方式

然而，故事還有另一面。研究人員發(fā)現(xiàn)了三種成功的交互模式，這些參與者在AI輔助下不僅完成了任務(wù)，還真正掌握了新技能。

兩名稱為「生成后理解型」的參與者先讓AI生成代碼，但不會簡單復(fù)制粘貼。相反，他們會停下來，通過AI詢問代碼的工作原理，就像有個私人導(dǎo)師在旁解釋。

三名「混合代碼解釋型」參與者更加聰明。他們在請求代碼生成的同時，主動要求AI提供解釋。「請生成代碼，并解釋為什么這樣實現(xiàn)」，這樣的提問方式讓他們在獲得解決方案的同時，也理解了背后的邏輯。

最成功的是七名「概念查詢型」參與者。他們只向AI詢問概念性問題，然后依靠自己的理解編寫代碼。這種方法雖然會遇到更多錯誤，但正是這些錯誤成為了最好的老師。

圖4：6種不同類型使用AI的方式的完成時間和技能得分

高技能形成模式的共同特點是參與者保持了認(rèn)知參與度，而不是將思維過程完全外包給AI。概念查詢型參與者尤其成功，他們平均成績達(dá)到86%，同時完成任務(wù)的速度也較快。

而對照組參與者由于沒有AI輔助，在任務(wù)過程中遇到了更多錯誤，包括與Trio庫核心概念直接相關(guān)的錯誤。解決這些錯誤的過程迫使開發(fā)者深入理解庫的工作原理。而學(xué)習(xí)中遇到的困難尤其是錯誤，對技能形成具有不可替代的價值。

相比之下，AI組參與者往往一鍵修復(fù)錯誤，錯過了從錯誤中學(xué)習(xí)的機會。一位參與者在反饋中坦言：「使用AI助手讓我變得懶惰，沒有像平時那樣仔細(xì)閱讀Trio庫的介紹和代碼示例。」

用好AI

AI是解釋工具而非代碼生成器

隨著企業(yè)和開發(fā)者越來越多地采用AI代碼生成與人工監(jiān)督相結(jié)合的工作流程，確保人類監(jiān)督者具備必要的技能來驗證和調(diào)試AI編寫的代碼至關(guān)重要。開發(fā)者必須尋找維持深度學(xué)習(xí)與技能精進的平衡點，避免陷入“快而不精”的職業(yè)陷阱。

使用AI后，編程技能下降最大的是調(diào)試能力，這意味著如果開發(fā)者最初使用AI時技能形成受到抑制，他們可能缺乏驗證和調(diào)試AI編寫代碼的必要技能。這里是只測試了一個庫的學(xué)習(xí)，如果是對于那些從學(xué)編程開始，就只是依賴AI而不自我鍛煉能力的，不當(dāng)使用AI帶來的影響只會更加深遠(yuǎn)。

在時間約束和組織壓力下，初級開發(fā)者可能會過度依賴AI以最快速度完成任務(wù)，犧牲真實的技能發(fā)展。這種趨勢從長期來看可能削弱行業(yè)的技術(shù)能力。

然而，研究也指出了解決方案。有三種與AI的交互模式能促進技能形成，這意味著AI可以成為學(xué)習(xí)的有力輔助工具，關(guān)鍵在于如何使用。保持認(rèn)知參與度，將AI視為解釋工具而非代碼生成器，可以兼顧效率和學(xué)習(xí)效果。

而這不僅需要個人主動更改自己的習(xí)慣，還需要專門設(shè)計用于教育的AI進行系統(tǒng)提示詞，讓使用者不只是復(fù)制AI生成的代碼。

而除了編程能力，像寫作、數(shù)值分析、估算等實用技能，是不是也會因為使用了AI，導(dǎo)致缺少從犯錯中學(xué)習(xí)的經(jīng)歷，而難以培養(yǎng)起對應(yīng)能力了，這是一個更值得研究與關(guān)注的問題。

參考資料：

https://arxiv.org/abs/2601.20245

https://www.anthropic.com/research/AI-assistance-coding-skills

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.