![]()
新智元報道
編輯:peter東
【新智元導(dǎo)讀】在AI編程時代,效率飆升卻隱藏危機:Anthropic最新研究揭示,使用AI助手雖能快速生成代碼,但開發(fā)者在概念理解、代碼閱讀和調(diào)試能力上顯著落后。獨立解決問題才是技能之鑰,AI若不當(dāng)用,將成「懶惰陷阱」。
2026年初,Anthropic研究揭開了AI輔助編程對技能學(xué)習(xí)的潛在風(fēng)險,使用AI助手完成編程任務(wù)的開發(fā)者,在概念理解、代碼閱讀和調(diào)試能力上顯著落后于獨立解決問題的同行。
![]()
技能退化
AI編程讓人難以鍛煉調(diào)試能力
在AI編程助手日益普及的今天,軟件工程領(lǐng)域生產(chǎn)力顯著提升。然而,代價是什么?
假設(shè)你是一個程序員,現(xiàn)在要用一個新的庫來進行開發(fā)。
之前你遇到問題,只能接入網(wǎng)絡(luò)搜索引擎和文檔;現(xiàn)在能訪問基于GPT-4o的AI編程助手。你會覺得哪一種更有利于你掌握這個庫?
在這項研究中,被試者需要學(xué)會一個小眾的Python異步編程庫Trio,每個受試者都是初次使用該庫進行編程。
被試者被隨機分為兩組。一組只用搜索學(xué)習(xí),一組只通過大模型問答學(xué)習(xí)。
![]()
圖1:實驗設(shè)計方案
任務(wù)完成后,被試者接受了一項精心設(shè)計的技能評估測驗,涵蓋概念理解、代碼閱讀和調(diào)試能力三個方面,以衡量他們對Trio庫的掌握程度。
與普遍認(rèn)知相反,AI輔助并未顯著縮短任務(wù)完成時間(圖2左邊)。盡管AI助手能夠直接生成完整正確的代碼解決方案,但實驗組的平均完成時間并未顯著優(yōu)于對照組。
![]()
圖2:人們使用AI與否與編程速度和技能評估得分
為何會這樣?細(xì)分后發(fā)現(xiàn),這源于參與者使用AI方式的巨大差異:
一部分參與者完全委托AI生成代碼,確實大幅提高了效率;
另一部分參與者花費大量時間與AI交互,甚至有人單次查詢就耗時6分鐘,抵消了效率優(yōu)勢。
更值得關(guān)注的是技能評估結(jié)果:AI使用組在測驗中的表現(xiàn)明顯較差,得分平均低4.15分,而滿分為27分。
AI使用組的調(diào)試能力與不使用AI組的差距最為明顯,代碼閱讀能力的差距相對較小。這表明,獨立解決問題的過程中遇到的錯誤和調(diào)試經(jīng)歷,對技能形成至關(guān)重要。
為何調(diào)試能力差距最大?那是因為沒有使用AI的參與者平均遇到3個錯誤,而使用AI的平均僅遇到1個錯誤。
這些錯誤,尤其是與Trio庫直接相關(guān)的錯誤,迫使開發(fā)者深入理解庫的工作原理,從而促進了學(xué)習(xí)。
三種學(xué)習(xí)路徑:
用了AI仍保有高技能
通過對使用AI組的行為進行細(xì)致分析,從中識別出六種不同的AI交互模式,宛如六條截然不同的學(xué)習(xí)路徑。
其中三條路徑通向技能退化,而另外三條則成功保持了技能形成水平。
四名參與者將任務(wù)一股腦地委托給AI,他們完成任務(wù)最快,但技能得分最低。就像把整個學(xué)習(xí)過程外包給了機器,自己成了旁觀者。
另外四名參與者開始時還算謹(jǐn)慎,只問一兩個問題,但很快陷入了漸進式依賴的陷阱。隨著任務(wù)難度增加,他們最終完全放棄了獨立思考,將所有代碼生成交給AI。
最令人惋惜的是那些迭代式調(diào)試者。他們頻繁向AI求助,每次遇到問題就粘貼錯誤信息,依賴AI提供解決方案。表面上看起來很努力,實際上卻錯過了最重要的學(xué)習(xí)機會——獨立解決問題的過程。
![]()
圖3:不同類型的AI使用方式
然而,故事還有另一面。研究人員發(fā)現(xiàn)了三種成功的交互模式,這些參與者在AI輔助下不僅完成了任務(wù),還真正掌握了新技能。
兩名稱為「生成后理解型」的參與者先讓AI生成代碼,但不會簡單復(fù)制粘貼。相反,他們會停下來,通過AI詢問代碼的工作原理,就像有個私人導(dǎo)師在旁解釋。
三名「混合代碼解釋型」參與者更加聰明。他們在請求代碼生成的同時,主動要求AI提供解釋。「請生成代碼,并解釋為什么這樣實現(xiàn)」,這樣的提問方式讓他們在獲得解決方案的同時,也理解了背后的邏輯。
最成功的是七名「概念查詢型」參與者。他們只向AI詢問概念性問題,然后依靠自己的理解編寫代碼。這種方法雖然會遇到更多錯誤,但正是這些錯誤成為了最好的老師。
![]()
圖4:6種不同類型使用AI的方式的完成時間和技能得分
高技能形成模式的共同特點是參與者保持了認(rèn)知參與度,而不是將思維過程完全外包給AI。概念查詢型參與者尤其成功,他們平均成績達(dá)到86%,同時完成任務(wù)的速度也較快。
而對照組參與者由于沒有AI輔助,在任務(wù)過程中遇到了更多錯誤,包括與Trio庫核心概念直接相關(guān)的錯誤。解決這些錯誤的過程迫使開發(fā)者深入理解庫的工作原理。而學(xué)習(xí)中遇到的困難尤其是錯誤,對技能形成具有不可替代的價值。
相比之下,AI組參與者往往一鍵修復(fù)錯誤,錯過了從錯誤中學(xué)習(xí)的機會。一位參與者在反饋中坦言:「使用AI助手讓我變得懶惰,沒有像平時那樣仔細(xì)閱讀Trio庫的介紹和代碼示例。」
用好AI
AI是解釋工具而非代碼生成器
隨著企業(yè)和開發(fā)者越來越多地采用AI代碼生成與人工監(jiān)督相結(jié)合的工作流程,確保人類監(jiān)督者具備必要的技能來驗證和調(diào)試AI編寫的代碼至關(guān)重要。開發(fā)者必須尋找維持深度學(xué)習(xí)與技能精進的平衡點,避免陷入“快而不精”的職業(yè)陷阱。
使用AI后,編程技能下降最大的是調(diào)試能力,這意味著如果開發(fā)者最初使用AI時技能形成受到抑制,他們可能缺乏驗證和調(diào)試AI編寫代碼的必要技能。這里是只測試了一個庫的學(xué)習(xí),如果是對于那些從學(xué)編程開始,就只是依賴AI而不自我鍛煉能力的,不當(dāng)使用AI帶來的影響只會更加深遠(yuǎn)。
在時間約束和組織壓力下,初級開發(fā)者可能會過度依賴AI以最快速度完成任務(wù),犧牲真實的技能發(fā)展。這種趨勢從長期來看可能削弱行業(yè)的技術(shù)能力。
然而,研究也指出了解決方案。有三種與AI的交互模式能促進技能形成,這意味著AI可以成為學(xué)習(xí)的有力輔助工具,關(guān)鍵在于如何使用。保持認(rèn)知參與度,將AI視為解釋工具而非代碼生成器,可以兼顧效率和學(xué)習(xí)效果。
而這不僅需要個人主動更改自己的習(xí)慣,還需要專門設(shè)計用于教育的AI進行系統(tǒng)提示詞,讓使用者不只是復(fù)制AI生成的代碼。
而除了編程能力,像寫作、數(shù)值分析、估算等實用技能,是不是也會因為使用了AI,導(dǎo)致缺少從犯錯中學(xué)習(xí)的經(jīng)歷,而難以培養(yǎng)起對應(yīng)能力了,這是一個更值得研究與關(guān)注的問題。
參考資料:
https://arxiv.org/abs/2601.20245
https://www.anthropic.com/research/AI-assistance-coding-skills
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.