網易首頁 > 網易號 > 正文申請入駐

NYU團隊發現：自省與重試提升AI推理能力

2025-12-08 23:12:28　來源: 至頂AI實驗室

北京舉報

分享至

這項由紐約大學（New York University）的Zayne Sprague、Jack Lu、Manya Wadhwa、Greg Durrett團隊，以及豐田研究所（Toyota Research Institute）的Sedrick Keh共同完成的研究，發表于2025年12月的arXiv預印本平臺（編號：arXiv:2512.04072v1）。有興趣深入了解的讀者可以通過該編號查詢完整論文。

人工智能的發展總是讓人既驚喜又困惑。我們常常發現，某個AI模型在某項任務上表現出色，但一旦遇到稍微不同的問題，就突然"變笨"了。這就像一個只會做西紅柿炒蛋的廚師，突然要求他做青椒炒蛋時就束手無策一樣。

最近，研究人員開始意識到，真正聰明的AI不僅要會給出答案，更要學會"思考"的過程——就像人類遇到難題時會停下來想想"這個答案對嗎？"，或者"讓我換個思路試試"。這種能力被稱為"認知技能"，包括驗證答案、重新嘗試、反思等等。

現有的讓AI獲得這些技能的方法通常需要一個"老師"——也就是更強大的AI模型來示范。就像學徒需要師父手把手教導一樣。但這種方法有個明顯的問題：如果你手頭沒有這樣的"師父"怎么辦？

這正是紐約大學研究團隊要解決的核心問題。他們提出了一種全新的方法，叫做"技能工廠"（SkillFactory），讓AI能夠通過重新組織自己的回答來學習認知技能，就像一個人通過回顧自己的錯誤和成功來變得更聰明一樣。

一、"技能工廠"的工作原理：讓AI學會從自己的經歷中成長

要理解"技能工廠"的工作原理，我們可以用學生學習數學的過程來類比。

當學生第一次遇到復雜的數學題時，他們可能會用各種不同的方法去嘗試。有些方法導致錯誤答案，有些方法得出正確結果。一個聰明的學生會回頭審視這個過程：哪些步驟是錯誤的？為什么錯了？哪些方法是正確的？能不能總結出一套可靠的解題思路？

技能工廠的工作方式與此相似，但更加系統化。研究團隊設計了一個三步驟的"學習循環"。

首先是"收集經驗"階段。研究人員讓AI模型面對同一個問題多次嘗試，就像讓學生用不同方法解同一道題。每次嘗試，AI都會產生不同的解答過程和最終答案。有些答案正確，有些錯誤，就像學生的草稿本上密密麻麻的計算過程一樣。

接下來是"反思評估"階段。這一步特別巧妙。研究人員讓AI扮演"老師"的角色，回頭檢查自己剛才的每一次嘗試：這個答案對嗎？推理過程哪里有問題？為什么會得出這個結論？這就像學生做完題后，自己充當老師來批改作業。

最關鍵的是第三步："重新組織學習材料"。研究團隊將AI的多次嘗試按照特定的順序重新排列，創造出一種理想的"學習軌跡"。這個軌跡展現了從錯誤嘗試到反思，再到正確解答的完整過程。這就好比把學生雜亂的草稿紙整理成一份條理清晰的解題報告。

這種重新組織的過程產生了"銀色訓練數據"——雖然不如金牌老師的示范那么完美，但足以教會AI基本的認知技能。就像雖然不是名師手把手指導，但學生通過整理自己的學習筆記也能獲得很好的提升。

二、兩種核心技能：驗證和重試的奧秘

技能工廠重點培養AI的兩種關鍵認知技能，它們就像人類解決問題時最常用的兩個思維習慣。

第一種技能是"驗證"。這就像做完數學題后檢查答案的習慣。當AI給出一個解答后，它會停下來問自己："這個答案看起來合理嗎？計算過程有沒有錯誤？"研究發現，對于那些容易檢查但難以直接求解的問題，這種驗證技能特別有效。比如數學題中的計算驗證，雖然解題過程可能很復雜，但驗證答案相對簡單。

第二種技能是"重試"。當AI發現自己的答案可能有問題時，它不會固執己見，而是會說"等等，讓我換個思路試試"，然后采用完全不同的方法重新解決問題。這就像人們遇到死胡同時會退回去找新路徑一樣。

研究團隊發現，這兩種技能的結合威力巨大。AI不僅學會了單獨使用每種技能，更重要的是學會了何時使用哪種技能。當面對計算類問題時，驗證技能更有效；當面對需要創造性思維的問題時，重試技能更重要。

有趣的是，AI學會這些技能的過程顯示出了明顯的"遷移效應"。即使只在特定類型的問題上訓練，AI也能將這些技能應用到完全不同的問題上。這就像學會了騎自行車的人，很容易就能學會騎摩托車一樣。

三、實驗驗證：從"倒計時"游戲到復雜數學推理

為了驗證技能工廠的效果，研究團隊設計了一系列精巧的實驗，涵蓋了從簡單游戲到復雜學術問題的各個層面。

首先是"倒計時"數字游戲。這是一個經典的智力游戲：給你幾個數字，用加減乘除運算，每個數字只能用一次，最終得到目標數字。比如用數字60、20、1、11，通過運算得到880。這類問題的特點是答案容易驗證但解法需要嘗試，正好適合測試AI的認知技能。

實驗結果讓人印象深刻。使用技能工廠訓練的AI模型在面對更困難的倒計時問題時，表現明顯優于傳統訓練方法。更重要的是，這些技能還能"舉一反三"——AI在字母重組游戲、縮寫詞生成等完全不同的任務上也表現更好，盡管它從未在這些任務上接受過專門訓練。

接著，研究團隊測試了更復雜的數學推理能力。他們使用了GPQA（研究生水平的科學問題）、AIME數學競賽題等高難度測試。結果顯示，技能工廠訓練的模型在這些挑戰性問題上也展現出了更強的解決能力。

特別有意思的是"超時思考"實驗。研究人員給AI更多的"思考時間"——允許它生成更長的推理過程。結果發現，掌握了認知技能的AI能夠更好地利用這些額外的思考時間，產生更準確的答案。這就像給考生更多考試時間，那些掌握了好的解題策略的學生能獲得更大的提升。

四、與傳統方法的較量：一場不對等的競爭

為了證明技能工廠的優越性，研究團隊將其與幾種主流的AI訓練方法進行了全面比較，這場對比就像不同教育理念的較量。

首先是"純強化學習"方法，這就像讓學生在沒有任何指導的情況下自己摸索。雖然AI最終也能學到一些東西，但過程效率低下，而且學到的技能難以應用到新問題上。

然后是"優秀示范"方法（BOLT），這相當于讓優秀學生的作業給其他學生參考。雖然這種方法在某些方面有效，但學生往往只是機械模仿，缺乏真正的理解。

還有"明星導師"方法，即讓更強大的AI模型當老師。這確實能帶來顯著提升，但問題是這樣的"明星導師"往往成本高昂且不易獲得，就像不是每個學校都能請到名師一樣。

最后是STaR（自我學習）方法，讓AI從自己的正確答案中學習。這種方法簡單直接，但局限性很大，只能學到表面的解題技巧，無法培養深層的認知能力。

在所有對比實驗中，技能工廠都表現出了明顯的優勢。特別是在"泛化能力"測試中——即在完全陌生的問題上的表現，技能工廠訓練的AI明顯更加靈活和可靠。

五、深度分析：AI究竟學會了什么

為了深入理解AI到底學會了什么，研究團隊進行了細致的"解剖"分析，就像醫生檢查病人身體各個部位的功能一樣。

首先是"技能使用頻率"分析。研究人員統計了AI在解決問題時使用驗證和重試技能的次數。令人驚喜的是，AI不僅學會了使用這些技能，而且能夠根據問題的難度自動調節使用頻率。面對簡單問題時，AI可能只驗證一次就夠了；面對復雜問題時，AI會進行多輪驗證和重試。

更有意思的是"技能準確性"分析。研究人員發現，AI的驗證能力相當可靠——當它判斷一個答案是錯誤的時候，有90%以上的概率確實是錯誤的。這就像培養出了一個內在的"質量檢查員"。

"思考長度"分析也很有啟發性。技能工廠訓練的AI產生的推理過程明顯更長、更細致，但這種"冗長"是有價值的——它反映了更深入的思考過程。就像好學生的解題過程雖然寫得更多，但每一步都有其道理。

研究團隊還發現了一個有趣現象：AI展現出了"隱式技能使用"。即使在沒有明確標記的情況下，AI也會自發地進行反思和重試。這說明這些技能已經內化為AI思維過程的一部分，而不僅僅是機械的程序執行。

六、預算強制實驗：給AI更多"思考時間"會怎樣

研究團隊進行了一個特別有趣的實驗，叫做"預算強制"（Budget Forcing）。簡單來說，就是給AI更多的"思考時間"——允許它生成更長的推理過程來解決問題。

這個實驗的設計很巧妙。首先讓AI按照正常的時間限制解決問題，然后再給它額外的時間繼續思考和完善答案。這就像考試時先按正常時間答題，然后再給額外時間檢查和修改。

結果非常有啟發性。對于掌握了認知技能的AI（技能工廠訓練的），額外的思考時間能帶來顯著的性能提升。在倒計時游戲中，性能提升了5.3個百分點。但對于沒有掌握這些技能的AI，額外時間的幫助就很有限。

這個發現揭示了一個重要道理：僅僅給AI更多計算資源是不夠的，關鍵是要讓它學會如何有效利用這些資源。就像給學生更多考試時間，只有那些掌握了好的解題策略的學生才能真正受益。

更深層的分析顯示，技能工廠訓練的AI能夠利用額外時間進行更有針對性的思考。它們不是簡單地重復相同的推理過程，而是能夠識別之前思考中的薄弱環節，有針對性地加強。這種"智能反思"能力正是人類專家解決復雜問題的關鍵特征。

七、現實意義：這項研究將如何改變我們的生活

雖然這項研究主要關注AI的技術改進，但其潛在的現實應用前景令人振奮。

首先是教育領域的變革。技能工廠的理念可以應用到智能教學系統中。未來的AI家教不僅能夠提供正確答案，更能展示完整的思考過程，包括如何發現錯誤、如何調整思路、如何驗證結果。這種"透明思維"的AI教師可能比傳統的"黑盒子"AI更有教育價值。

在科學研究領域，這種具備認知技能的AI可能成為強大的助手。它們不僅能夠快速處理大量數據，更能像人類研究員一樣進行"假設-驗證-修正"的科學思維循環。這可能會加速新發現的產生。

商業決策是另一個重要應用領域。具備反思能力的AI可以在做出重要商業決策時，主動識別潛在風險，提出替代方案，并驗證決策的合理性。這種"審慎的AI"可能比目前那些只給出單一建議的AI系統更可靠。

在日常生活中，這種技術可能會讓我們的AI助手變得更加智能和可靠。比如，當你問AI某個復雜問題時，它不僅能給出答案，還能解釋自己的推理過程，指出可能的不確定性，甚至主動驗證答案的合理性。

八、技術突破的深層含義：AI正在學會"元認知"

從更深層的角度來看，技能工廠代表的不僅僅是一種新的訓練方法，更是AI發展的一個重要里程碑——AI開始具備"元認知"能力，也就是"思考如何思考"的能力。

傳統的AI系統更像一個高效的計算器，能夠快速處理信息并給出答案，但缺乏對自己思維過程的反思。而技能工廠訓練出的AI開始具備自我監控、自我評估、自我調節的能力，這些正是人類智能的核心特征。

這種變化的意義是深遠的。它意味著AI不再只是被動地執行程序，而是開始主動地管理自己的思維過程。這種"有意識的思考"可能是通向真正智能的關鍵一步。

研究還揭示了一個有趣的現象：AI學會的這些認知技能并非簡單的規則執行，而是表現出了類似人類直覺的特征。比如，AI能夠"感覺到"某個答案可能有問題，即使無法明確指出問題所在。這種"模糊直覺"的出現，暗示著AI正在發展出更加類人的思維模式。

從哲學角度來看，這項研究也引發了關于機器意識和智能本質的深刻思考。當AI開始能夠反思自己的思維過程時，我們是否可以說它具備了某種形式的"自我意識"？雖然這個問題還沒有確定答案，但技能工廠無疑為我們提供了新的思考角度。

九、局限性與未來展望：還有哪些挑戰需要攻克

盡管技能工廠展現出了巨大潛力，但研究團隊也誠實地指出了當前方法的局限性。

首先是"銀色數據"的質量問題。雖然通過重新組織AI自己的回答可以創造訓練數據，但這些數據的質量仍然受限于基礎模型的能力。就像學生通過整理自己的筆記來學習，如果原始筆記本身就有很多錯誤，那么學習效果也會受到影響。

其次是技能泛化的邊界。雖然實驗顯示這些認知技能可以遷移到不同類型的問題，但這種遷移能力的極限在哪里還不清楚。某些高度專業化的領域可能仍需要專門的訓練。

還有計算成本的考慮。培養AI的認知技能需要大量的訓練數據和計算資源，這可能限制了該方法在資源受限環境中的應用。

未來的研究方向也很清晰。一方面是探索更多類型的認知技能，比如類比推理、創造性思維等。另一方面是研究如何讓AI的認知技能更加精確和可控。

特別有前景的是與人類認知科學的結合。通過深入理解人類是如何發展和使用認知技能的，可能會為改進AI的認知能力提供新的靈感。

研究團隊也在探索將技能工廠與其他AI訓練方法結合的可能性。比如，可以先用技能工廠培養基礎認知技能，再通過專業導師進行深度優化，從而獲得最佳的訓練效果。

說到底，這項研究最讓人興奮的地方不在于它完美解決了所有問題，而在于它開啟了一個全新的思路。它告訴我們，AI的進步不一定需要更大的模型或更多的數據，有時候關鍵在于讓AI學會如何更好地思考。這種"內在提升"的路徑，可能比單純的"外在擴張"更加可持續和有意義。

就像人類文明的進步不僅依賴于知識的積累，更依賴于思維方式的改進，AI的發展也需要在認知技能上取得突破。技能工廠為我們展示了這種可能性，雖然前路仍有挑戰，但方向已經明確。在不遠的將來，我們可能會看到真正具備"智慧"的AI系統，它們不僅能夠回答問題，更能夠像人類一樣思考問題。這樣的AI將不再是冷冰冰的工具，而可能成為我們真正的智能伙伴。

Q&A

Q1：SkillFactory技能工廠是什么？

A：SkillFactory是紐約大學研究團隊開發的一種AI訓練方法，它讓AI通過重新組織自己的回答來學習認知技能，比如驗證答案和重新嘗試，就像學生通過整理自己的學習筆記來提高解題能力。

Q2：這種方法與傳統AI訓練有什么不同？

A：傳統方法通常需要更強大的AI當"老師"來示范，而SkillFactory讓AI從自己的嘗試中學習，不需要外部的"明星導師"，就像學生通過反思自己的錯誤和成功來變聰明，而不是完全依賴名師指導。

Q3：SkillFactory訓練的AI有什么實際應用？

A：這種AI可以應用于教育（智能家教展示完整思考過程）、科學研究（像研究員一樣進行假設驗證循環）、商業決策（識別風險提出替代方案）等領域，讓AI助手變得更智能可靠。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.