![]()
2025年,理查德·薩頓(Richard Sutton)站上了圖靈獎的領獎臺。
這項計算機科學領域的最高榮譽,旨在表彰他和安迪·巴托(Andrew Barto)在強化學習領域的開創性貢獻。
自20世紀80年代起,薩頓與巴托便在一系列論文中,構建了強化學習的數學基礎與核心算法。
最近,薩頓在社交媒體上,分享了他在頒獎典禮上的獲獎感言。他說,所謂強化學習,是指一臺機器可以從自身的經驗中學習,通過不斷的試錯,最終找到完成任務的方法。
![]()
而且,整個學習過程,沒有任何人會直接告訴它應該怎么做。他還提到,這個充滿遠見的構想,并非誕生于我們這個時代。早在1947年,艾倫·圖靈(Alan Turing)就首次提出了這一概念的雛形。
能夠因為復興這項至關重要,卻仍處于萌芽階段的思想而獲獎,薩頓感到榮幸且謙卑。
薩頓還提到了三個深刻影響他學術生涯的人。分別是安迪·巴托、奧利弗·塞爾弗里奇、以及瑪莎·斯蒂恩斯特魯普。前兩位是他的導師,而最后一位是他的妻子。
他說,導師教給了他知識、治學態度、治學之道:“大道至簡,或許是所有抱負中最為宏偉的一種。”
而妻子則讓他時刻保持清醒與腳踏實地。
以下是演講全文,DeepSeek翻譯、整理如下:
各位女士,各位先生,晚上好。
強化學習的核心思想是,機器可以無需人為指令,僅憑自身的經驗,通過不斷地試錯,自主地探索出解決問題的方法。據我所知,在1947年最早提出這一構想的,正是艾倫·圖靈先生。因此,能夠為復興這一至關重要但仍處于萌芽階段的思想而榮獲以他命名的獎項,讓我倍感榮幸,也誠惶誠恐。
在此,我尤其想感謝三個人。
首先是安迪·巴托(Andy Barto)。作為我的博士生導師,他塑造了我整個治學之道,特別是讓我深刻體會到嚴謹的學術精神、精湛的鉆研技巧以及尊重前人廣博研究的重要性。
其次,我要感謝我的另一位重要導師:奧利弗·塞爾弗里奇(Oliver Selfridge),可惜他已經與世長辭。奧利弗教導我,“大道至簡”或許是所有抱負中最為宏偉的一種。
第三位,我要感謝瑪莎·斯滕斯特魯普(Martha Steenstrup),她是我的人生伴侶,也是我思想上的切磋諍友。是她讓我時刻保持清醒與腳踏實地。
最后,我還要感謝阿爾伯塔大學。在過去的22年里,這里為我個人以及強化學習的研究提供了最理想的環境。
這三位恩師益友以及我的大學,在我心中強化了這樣一種信念:既要追求能夠產生深遠影響的創想,又不能因此而沾沾自喜。他們教導我,對卓越思想的求索之路固然嚴肅,但最好的方式是懷著一顆赤子之心,以謙遜、友善和樂觀的態度去探索。對此,我永懷感激。
我也想感謝在座的各位,感謝你們今晚共聚一堂,一同頌揚我們對卓越智慧的追求。
非常感謝。
注:圖源Sutton的社交媒體
作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!
GPU 訓練特惠!
H100/H200 GPU算力按秒計費,平均節省開支30%以上!
掃碼了解詳情?
點「贊」的人都變好看了哦!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.