Andrej Karpathy 離開 OpenAI 三個(gè)月后,在 YouTube 扔了一枚炸彈。這位前特斯拉 AI 總監(jiān)、OpenAI 創(chuàng)始成員,用 1 小時(shí) 13 分鐘系統(tǒng)拆解了大語言模型的運(yùn)作原理——沒有 PPT,只有一塊白板。
視頻上線兩周,播放量沖破 360 萬。評論區(qū)最熱的留言是:"終于有人把 Transformer 講得像樂高說明書。"Karpathy 的講法確實(shí)刁鉆:他把 token 預(yù)測比作"一個(gè)極度勤奮的實(shí)習(xí)生,讀過人類寫過的所有文字,但從不真正理解",把微調(diào)描述成"給這個(gè)實(shí)習(xí)生發(fā)員工手冊,教它怎么在特定場合裝得像專家"。
最扎心的一段在結(jié)尾。Karpathy 盯著鏡頭說:「軟件工程正在經(jīng)歷劇變,從明確的工程學(xué)科變成更模糊的手藝活。」他頓了頓,補(bǔ)了一句:以前我們寫代碼,現(xiàn)在我們在"提示"一個(gè)已經(jīng)讀過一切的東西。
這堂課被翻譯成 12 種語言。中文雙語版由博主"寶玉"制作,B 站彈幕里飄滿"醍醐灌頂"和"失業(yè)預(yù)警"。一位觀眾在 Reddit 寫道:聽完第一件事,是把簡歷里的"精通 Python"改成了"精通與 LLM 協(xié)作"。
Karpathy 沒提的是,他自己正在創(chuàng)業(yè)做 AI 教育產(chǎn)品。這堂課既是知識(shí)分享,也是一塊活招牌——畢竟,能讓 360 萬人自愿上課的老師,賣課應(yīng)該不難。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.