![]()
那個站在 LLM 風(fēng)口上唱反調(diào)的倔老頭,可能離開 Meta 了。
硅谷大佬出走創(chuàng)業(yè),三天兩頭就有一樁,但要出走的 Yann LeCun 不一樣,他是能讓扎克伯格親自登門的重量級人物,是深度學(xué)習(xí)三巨頭之一,圖靈獎得主,Meta AI Research 的開山祖師。
更重要的是,他這些年一直在干一件特別擰巴的事:站在全世界最熱鬧的 LLM 路線門口,舉著牌子說「這幫人走錯路了」。
![]()
現(xiàn)在 《金融時報》 傳出他要離職,說他在籌備自己的初創(chuàng)公司,已經(jīng)開始接觸投資人了。注意,目前只是風(fēng)聲,言之鑿鑿地說 LeCun 已經(jīng)離職創(chuàng)業(yè),這顯然是不嚴(yán)謹(jǐn)?shù)摹?/p>
只是,截至發(fā)稿前,面對鋪天蓋地的報道,Yann LeCun 本人還沒吭聲,這沉默本身,就很說明問題。
從三顧茅廬到分道揚鑣,這十二年到底發(fā)生了什么?
1
2013 年那場豪賭,扎克伯格賭對了嗎?
Lecun 與 Meta 故事得從 2013 年說起。
那段時間,正是深度學(xué)習(xí)蓬勃興起的階段。2012 年,Geoffrey Hinton 與其學(xué)生 Alex Krizhevsky、Ilya Sutskever 提交的 AlexNet 在 ILSVRC-2012 一騎絕塵,top-5 錯誤率約 15.3%,這個突破讓整個學(xué)術(shù)界和工業(yè)界都看到了神經(jīng)網(wǎng)絡(luò)的潛力。
然后就是科技巨頭們的搶人大戰(zhàn)——谷歌花大價錢收購了 Hinton 所在的創(chuàng)業(yè)公司 DNNresearch,順帶把老爺子本人也挖走了;微軟研究院也在瘋狂擴張 AI 團隊。
![]()
扎克伯格坐不住了。
Facebook(現(xiàn)為 Meta)當(dāng)時正在從 PC 互聯(lián)網(wǎng)往移動互聯(lián)網(wǎng)轉(zhuǎn)型,新聞推送算法、照片識別、內(nèi)容審核,哪哪兒都需要技術(shù)。
但問題是,F(xiàn)acebook 的 AI 能力跟谷歌、微軟根本不在一個量級。扎克伯格需要一個能撐起門面的人物,最好是那種在學(xué)術(shù)界有足夠分量、能吸引頂尖人才加盟的大牛。
他盯上了 Yann LeCun。
LeCun 當(dāng)時在紐約大學(xué)當(dāng)教授,已經(jīng)干了十多年。那時的 Lecun 自然不是什么新人,早在 1989 年,他就在貝爾實驗室搞出了卷積神經(jīng)網(wǎng)絡(luò) (CNN),用來識別手寫數(shù)字,這后來也成了計算機視覺的基石。
![]()
但那個年代深度學(xué)習(xí)不受待見,LeCun 就這么冷板凳坐了許久,眼睜睜看著自己的研究被邊緣化。直到 2012 年,Hinton 用深度學(xué)習(xí)拿下 ImageNet 冠軍,證明了神經(jīng)網(wǎng)絡(luò)這條路走得通。
LeCun 憋了的那口氣,終于能吐出來了。
后續(xù),扎克伯格親自登門拜訪。具體談了什么外人不知道,但最后開出的條件足夠誘人:
第一,給錢,主打一個資源自由;第二,給自由,LeCun 可以保留紐約大學(xué)的教授身份,繼續(xù)教書搞研究;第三,給權(quán),讓他參與建立 Facebook AI 研究院,怎么招人、做什么方向,全由他說了算。
這對一個憋屈了多年的學(xué)者來說,簡直是夢寐以求的機會。
2013 年末,LeCun 正式加入 Facebook,出任新成立的 Facebook AI Research(FAIR) 實驗室負(fù)責(zé)人。
![]()
他在紐約、門洛帕克和倫敦三地建起了 FAIR 實驗室,自己常駐紐約辦公室。
團隊最初規(guī)模較小,但個個都是從頂尖高校和研究機構(gòu)挖來的——LeCun 的號召力在這時候體現(xiàn)出來了,但凡是做深度學(xué)習(xí)的,沒人不知道「卷積神經(jīng)網(wǎng)絡(luò)之父」這個名號。
扎克伯格給了資源,LeCun 也拿出了成果。
加入 Facebook 這些年,LeCun 干的事情可以分成三條線:一是把深度學(xué)習(xí)塞進(jìn) Facebook 的產(chǎn)品里,二是推動學(xué)術(shù)界的前沿研究,三是培養(yǎng)下一代 AI 人才。
產(chǎn)品線上,2014 年的 DeepFace 人臉識別系統(tǒng)達(dá)到 97.35% 準(zhǔn)確率,深度學(xué)習(xí)優(yōu)化的推送算法也提升了廣告點擊率。
與此同時,LeCun 自己繼續(xù)在學(xué)術(shù)圈刷存在感:發(fā)論文、頂會 keynote、帶學(xué)生辦 workshop。直到和 Hinton、Bengio 一起拿圖靈獎, 才算是熬出頭了。
![]()
此外,在 LeCun 創(chuàng)建的 FAIR 實驗室,Soumith Chintala 主導(dǎo)開發(fā)了 PyTorch 框架并于 2017 年開源,這也是 Meta 至今為數(shù)不多的形象招牌。
PyTorch 動態(tài)計算圖、Python 原生接口, 調(diào)試方便, 學(xué)術(shù)圈迅速倒戈。這一招等于把全球 AI 研究者都拉進(jìn)了 Facebook 生態(tài)。
不過,或許是冥冥中自有天意,Soumith 前幾天也宣布離職 Meta,表示「不想一輩子做 PyTorch」。
而更重要的是人才培養(yǎng)。FAIR 有個規(guī)矩:研究員可以自由發(fā)表論文、跟學(xué)術(shù)界合作、指導(dǎo)外部學(xué)生。頂級資源加學(xué)術(shù)自由的組合,自然吸引了一批頂尖研究人員。
到 2020 年前后,F(xiàn)AIR 已是全球頂尖 AI 研究機構(gòu)之一, 跟谷歌 DeepMind 并列第一梯隊。扎克伯格的那場豪賭, 至少在前七八年就已經(jīng)得到了不小的回報。
1
貓比 ChatGPT 聰明?這個圖靈獎得主是認(rèn)真的
在 ChatGPT 席卷世界初期,Yann Lecun 和扎克伯格也有過一段甜蜜期。
2023 年以來,Meta 陸續(xù)開源 LLaMA 系列模型,引發(fā)業(yè)界震動。
OpenAI、谷歌走的是封閉路線,靠 API 賺錢;Meta 卻把模型權(quán)重直接扔出來,任人取用。這步棋背后的算盤其實挺清楚:與其讓對手一家獨大,不如用開源贏得開發(fā)者生態(tài),讓 LLaMA 成為 AI 界的 Android。
至少在明面上,身居 Meta 首席 AI 科學(xué)家一職的 LeCun,是這條路線最堅定的擁護(hù)者。
開源 LLaMA 讓 Meta 在大模型競賽中站穩(wěn)了腳跟,也讓 LeCun 的 AI 理想得到了一定程度的實現(xiàn)——盡管這個實現(xiàn)的方式,恰恰是通過他并不完全認(rèn)同的 LLM 技術(shù)路線。
![]()
沒錯,LeCun 一直覺得 LLM 是條死胡同。這才是矛盾的核心。
LeCun 不止一次在公開場合炮轟 LLM 路線,在他看來,LLM 只會根據(jù)統(tǒng)計相關(guān)性預(yù)測下一個詞,根本不理解世界。你問它常識問題,它能給你編出一本正經(jīng)的瞎話——這叫「幻覺」(hallucination),說白了就是不懂裝懂。
熟悉 LeCun 的人都知道,他最喜歡舉的例子是貓和機器人:
「我們有了會考試聊天的語言模型,但家務(wù)機器人在哪里?哪怕像貓那樣靈巧的機器人都沒有出現(xiàn)。」
「你的貓肯定有一個比任何 AI 系統(tǒng)都更復(fù)雜的模型。動物擁有持久記憶的系統(tǒng),這是目前的 LLM 所不具備的;能夠規(guī)劃復(fù)雜動作序列的系統(tǒng),這在今天的 LLM 中是不可能的。」
![]()
他算過一筆賬:一個 4 歲小孩通過視覺獲取的信息量,幾年下來就有 10 的 15 次方字節(jié),遠(yuǎn)超 LLM 讀遍互聯(lián)網(wǎng)文本。但小孩已經(jīng)掌握了基本的物理直覺和語言,LLM 耗費這么多數(shù)據(jù),智能仍然很有限。
「光靠喂文本,不可能達(dá)到人類水平智能。這條路永遠(yuǎn)走不通。」他如此說道。
在當(dāng)下最火的風(fēng)口面前,這樣唱反調(diào)的言論顯然并不討喜,有人批評他傲慢,有人說他故步自封。甚至 Meta 內(nèi)部都有聲音認(rèn)為,正是 LeCun 對 LLM 路線的抵觸,讓公司在大模型競賽中暫時落后。
但 LeCun 不在乎。
他有自己的路線圖:世界模型 (World Model)、聯(lián)合嵌入預(yù)測架構(gòu) (JEPA)等等。這些概念聽起來學(xué)術(shù)味十足,核心思想其實很直觀——
讓 AI 通過觀察世界來學(xué)習(xí),而不是通過閱讀文本來記憶。就像嬰兒成長那樣,先理解重力、因果關(guān)系這些物理常識,再逐步建立抽象認(rèn)知。
他設(shè)想的 AI 架構(gòu)是模塊化的:感知模塊、世界模型模塊、記憶模塊、行動模塊,各司其職。不像 LLM 那樣把所有知識和推理揉在一個巨型網(wǎng)絡(luò)里,搞得像個什么都懂但其實什么都不懂的「書呆子」。
![]()
具體來說,世界模型就是讓 AI 在內(nèi)部學(xué)會一個對外部世界的預(yù)測模型。就像嬰兒在成長過程中建立起對重力、物體恒存等常識那樣,AI 應(yīng)該通過觀察世界,形成對物理規(guī)律、因果關(guān)系的理解。
有了世界模型,AI 就可以在腦海中模擬未來,從而具備計劃行動的能力。
JEPA 則是實現(xiàn)這個世界模型的具體架構(gòu)。
它采用自監(jiān)督學(xué)習(xí)的方法,給 AI 兩個相關(guān)的輸入 (比如視頻中相鄰的兩幀畫面),模型將這兩個輸入分別編碼到一個抽象的表示空間中,然后訓(xùn)練一個預(yù)測器,根據(jù)「上下文」表示去預(yù)測「目標(biāo)」表示。
這種方式避免了直接生成所有細(xì)節(jié),而是關(guān)注抽象的關(guān)鍵因素——更符合人類學(xué)習(xí)方式。LeCun 曾預(yù)言,如果團隊的路線順利推進(jìn),三到五年內(nèi)就會有更好的范式出現(xiàn),使得現(xiàn)在基于 LLM 的方法過時。
問題是,三到五年,Meta 等得起嗎?
1
一場猝不及防的重組,F(xiàn)AIR 的黃金時代結(jié)束了
當(dāng)初,LeCun 建立 FAIR 時的承諾是「做長期的、基礎(chǔ)性的 AI 研究」,扎克伯格也同意了。
但這個「長期」到底有多長?「基礎(chǔ)研究」到底能給公司帶來多少直接收益?這些問題在早期不是問題,因為深度學(xué)習(xí)本身就是風(fēng)口,F(xiàn)AIR 做什么都有望轉(zhuǎn)化成產(chǎn)品優(yōu)勢。
可隨著生成式 AI 開始爆發(fā),競爭也日益激烈,形勢開始發(fā)生了變化,尤其是 Llama 4 的失敗也給了扎克伯格當(dāng)頭一棒。扎克伯格要的是現(xiàn)在就能用的技術(shù),不是五年后可能有用的理念。
于是,一場猝不及防的重組出現(xiàn)了。
就在今年,Meta 搞了個大動作,成立「超級智能實驗室」,把 FAIR、基礎(chǔ)模型團隊和各應(yīng)用 AI 團隊統(tǒng)統(tǒng)塞進(jìn)一個筐里。表面上是整合資源,實際上是一場徹底的權(quán)力重組。
![]()
這場重組的核心邏輯很明確:讓研究直接服務(wù)產(chǎn)品,讓科學(xué)家為商業(yè)目標(biāo)讓路。
FAIR 團隊原本「相對不受干擾地開展研究」,現(xiàn)在得跟著產(chǎn)品節(jié)奏走,研究方向要服務(wù)于個人 AI 助手。此外,Meta 對 FAIR 的研究發(fā)表制定了更嚴(yán)格的內(nèi)部審核機制。
研究員在對外發(fā)布論文、開源代碼之前,需要經(jīng)過額外的內(nèi)部交叉審閱和管理層審批,原因在于 Meta 擔(dān)心自己砸錢搞出來的成果被競爭對手白嫖。
LeCun 對這些變化表現(xiàn)出強烈的抵觸。
據(jù)多方報道,他在內(nèi)部激烈反對新的論文審核制度,為維護(hù)研究自由據(jù)理力爭。The Information 援引知情者的話稱,LeCun 在今年 9 月一度「氣到考慮辭職」以示抗議。
![]()
但或許更讓他難以接受的是領(lǐng)導(dǎo)權(quán)的旁落。
扎克伯格在重組中做了一個大膽的人事任命:從外部挖來 Alexandr Wang,讓他擔(dān)任 Meta 的首席 AI 官,直接向 CEO 匯報。
Alexandr Wang 是誰?一個 28 歲的 MIT 輟學(xué)生,他創(chuàng)辦的公司 Scale AI 專門做數(shù)據(jù)標(biāo)注業(yè)務(wù),給各大科技公司的 AI 模型提供訓(xùn)練數(shù)據(jù)。
扎克伯格看中的,恰恰是 Wang 的產(chǎn)品思維和商業(yè)嗅覺。在生成式 AI 的競賽中,Meta 需要的不是象牙塔里的理想主義者,而是能快速把技術(shù)轉(zhuǎn)化為產(chǎn)品的實干家。
這個任命的震撼在于:LeCun 這個圖靈獎得主、深度學(xué)習(xí)三巨頭之一、在 Meta 干了十二年的首席 AI 科學(xué)家,在新架構(gòu)下的話語權(quán)被大幅削弱,甚至要向 Wang 匯報。
同時,今年 7 月,扎克伯格還任命了年輕有為的趙 晟 佳為超級智能實驗室的首席 AI 科學(xué)家,負(fù)責(zé)制定新實驗室的研究方向。
![]()
有趣的是,LeCun 當(dāng)時發(fā)了個聲明,說自己角色沒變、使命沒變,還期待跟新團隊合作。這求生欲屬實拉滿。但他對于研究方向和領(lǐng)導(dǎo)層重組的分歧,顯然是公開的秘密。
而真正可能成為壓垮駱駝的最后一根稻草的,是最近的裁員。據(jù)報道,Meta 近期對 AI 團隊進(jìn)行了裁員,波及到 FAIR 研究部門以及與產(chǎn)品相關(guān)的 AI 團隊,甚至華人大佬田淵棟也因此受到了波及。
裁員的信號很明確:Meta 不再愿意為「看不到短期回報」的基礎(chǔ)研究買單了。那些不能直接轉(zhuǎn)化為產(chǎn)品功能、不能立即提升用戶增長或廣告收入的研究方向,都成了被砍的對象。
![]()
FAIR 的黃金時代結(jié)束了。
種種因素之下,《金融時報》爆料他在籌備創(chuàng)業(yè),倒也不算意外。
學(xué)術(shù)大佬出來單干,最近幾年已經(jīng)成了硅谷新常態(tài)。Hinton 退休后到處演講呼吁 AI 監(jiān)管,Bengio 也有自己的實驗室和創(chuàng)業(yè)項目。LeCun 若是真出去創(chuàng)業(yè),沒準(zhǔn)反而是好事。說到底,這事兒沒有誰對誰錯。
![]()
LeCun 能夠在 Meta 之外繼續(xù)他畢生的事業(yè)。
他帶走了那個被 Meta「擱置」的愿景,可以放開手腳搞自己的世界模型,用自己的方式證明它是正確的,再也不用跟產(chǎn)品經(jīng)理扯皮,不用向 28 歲的小老弟匯報。
成了,那就是「我早說過 LLM 是死路」;敗了,頂多被人嘲笑幾句「你看那個老頑固」。
而對于 Meta 來說,扎克伯格要給股東講故事,要把最實用的生成式 AI 塞進(jìn)旗下產(chǎn)品的各個角落,這確實是 CEO 該干的事。
只是,盡管少了 LeCun 也不會傷筋動骨,但可能會少點不一樣的聲音。
等哪天大家發(fā)現(xiàn) LLM 真的走到瓶頸了,回頭看看當(dāng)年那個舉著反對牌子的倔老頭說過什么,或許會覺得別有一番趣味。
點個“愛心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.