網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

從千問變動到 “AI 英雄傳”，與 DINQ 高岱恒聊傳奇 AI 研究員們

2026-03-15 20:16:47　來源: 晚點LatePost

北京舉報

分享至

這是自我實現(xiàn)的過程，這是 “無限游戲”。

訪談丨程曼祺

文丨實習生付自文

“從定量來看，搜索量直接翻了 3 倍。” 上周（ 3 月 4 日），阿里通義千問團隊人事震動后，在 AI 人才發(fā)現(xiàn)與分析平臺 DINQ 上，有許多 HR 和獵頭群體甚至 Meta 的人都在在搜索千問候選人的信息。

DINQ 的創(chuàng)始人高岱恒在 AI 技術圈和開源社區(qū)非常活躍。他曾是雙非土木老哥，后來因為對 AI 開源項目的貢獻進入了阿里達摩院。

2017 年，高岱恒還在讀土木工程的碩士，但他覺得自己 “可能未來連個工作都找不到了。” 這時候他接觸到了吳恩達的 AI 公開課。“他說你只要按部就班地學完了我的這個公開課，你會超過硅谷 95% 的工程師。我估計很多人是不信這個東西的，但是我那時候真信了。”

畢業(yè)后，高岱恒進入了一家公司，開始做視覺圖像的檢測。后來由于工作上的契機，高岱恒開始頻繁地接觸一些 AI 研究員，他們那些非典型的、充滿反差的經(jīng)歷尤其吸引他。

高岱恒自比文藝復興時期寫了《藝苑名人傳》的 Vasari，挖掘研究員的故事，甚至到 OpenAI 總部蹲點。他把寫 AI 人物英雄傳當做自己的消遣和享受。

在他眼里，這些研究者就像文藝復興時期的藝術家，他們有各自的性格、執(zhí)念和技術浪漫。他們追求完整地做出一件作品的自我實現(xiàn)過程。

但這對大型商業(yè)組織來說是陌生的，是需要理解和適應的。阿里 Qwen 團隊技術負責人林俊旸的離職就引發(fā)了人們的熱議和思考：一個研究員和團隊的目標該如何與商業(yè)公司的戰(zhàn)略目標相對齊？

這是一個難以回答的問題，當然不同立場的人會有不同的觀點。在高岱恒看來， AI 是一場 “無限游戲”，這些頂尖人才的流動將映射出 AI 時代生產(chǎn)關系的一次劇烈重構。

千問人事變動后，獵頭搜索量翻了 3 倍

晚點：在上周阿里千問人事變動發(fā)生之后，Dinq 平臺上看到的相關搜索量有什么變化嗎？有哪些機構去找千問團隊的候選人嗎？

高岱恒：從定量來看，搜索量直接翻了 3 倍。大約有 2000 到 3000 條 query （查詢）在搜 Qwen 相關的人，或者在查 Qwen 過去發(fā)表的論文里的作者信息。主要的搜索方向集中在大語言模型、強化學習和 Agent 這些目前最熱門的方向。

搜索方主要還是 HR 和獵頭群體。而且我們還看到，像 Meta 的 Executive Search （高管搜尋）負責人 George Lindner 這樣的人也在搜千問的候選人。

晚點：你一直活躍在開源社區(qū)，認識很多機構和研究者。對于這次離職事件，開源社區(qū)大概是一個什么樣的反應？

高岱恒：大家覺得挺奇怪的。因為從現(xiàn)實的影響力角度來看， Qwen 在開源領域絕對是第一梯隊。在國外，跟他比較類似的是一個法國公司 Mistral ，它是世界上第一個主流開源模型 Llama 背后的很多核心成員做的。

Qwen 在本身沒有先發(fā)優(yōu)勢的情況下，它現(xiàn)在的模型下載量在兩個世界級的開源模型托管平臺， Hugging Face 和阿里發(fā)起的 ModelScope （魔搭社區(qū)）上，都遠超 Mistral 的開源模型。它事實上已經(jīng)成為了開源模型領域的霸主，擁有非常豐富的模型系列，包括各種尺寸的小模型，還有圖像、視頻相關、推理相關的模型以及 Embedding 模型（嵌入模型，將語義信息轉化為數(shù)值向量的表示學習模型）。

很多學術界的同學，無論國內(nèi)外，其實都沒有什么計算資源。而 AI 領域評估一個研究員能力的重要指標，就是看你是否能在頂尖學術會議上發(fā)表論文，比如 NeurIPS （神經(jīng)信息處理系統(tǒng)大會）或 CVPR （計算機視覺與模式識別會議）。在這些會議上，你會看到越來越多的論文在引用千問的技術報告，把 Qwen 模型作為 Agent 的大腦或者其他鏈路里的重要環(huán)節(jié)。

所以從這個角度看，通義千問推動了整個 AI 學術界和工業(yè)界的重大發(fā)展。它的價值意義是非常大的。

晚點：你剛才對比它在開源社區(qū)的影響力時，提到了 Llama 和 Mistral 。國內(nèi)關注者可能更熟悉 DeepSeek ，以及 Kimi 、 MiniMax 。千問在開源領域的影響力，和中國其他這些開源模型相比是什么情況？

高岱恒：現(xiàn)實來看， Qwen 模型的總下載量，在剛才提到的兩個托管平臺上，比后面這幾家加起來的總和還要多。

晚點：主要原因是它的尺寸選擇非常多，對吧？

高岱恒：對，它有 0.6B 、 1B 之類的尺寸，家族生態(tài)特別完善。而且從 2023 年下半年開始，學術界很多團隊在論文里把 Qwen 模型作為了標準實踐。這種行業(yè)心智非常重要，如果你沒有這個心智，營銷和宣傳的成本會非常高。

晚點：具身智能行業(yè)用千問也比較多，因為機器人對端側延時和算力消耗有要求。然后你剛才提到的魔搭社區(qū)，作為阿里發(fā)起的一個生態(tài)，它的成長速度很快。你當時應該還在達摩院，這是不是也跟阿里的開源策略以及 Qwen 的完善生態(tài)有關？

高岱恒：那個時候魔搭其實還不是特別流行，我們內(nèi)部的同學最開始還被要求在里面貢獻一些模型和數(shù)據(jù)集。后來沒想到訪問量和模型下載量越來越多了，這也證明華人 AI 從業(yè)者、開發(fā)者確實越來越多了。

晚點：像魔搭社區(qū)這樣的平臺，長期來說對阿里會有比較大的商業(yè)價值嗎？

高岱恒： Hugging Face 或魔搭社區(qū)本質上類似 AI 時代的 GitHub 。它的價值在于你需要一個 Hub 去承載多種多樣的模型、數(shù)據(jù)集和應用。這些東西越多，大家就越會來到你的平臺，留下很多 “學習信號” 來反向指導公司的行為。

如果說平臺直接掙錢，也有很多方式。比如像 Hugging Face 這種，可以把模型部署在平臺上提供推理服務。包括存儲，如果你有幾 B 大小的數(shù)據(jù)集，托管在平臺上也需要存儲費。這其實是一種云服務的思路。但我覺得對阿里來講， ModelScope 的戰(zhàn)略意義應該遠大于那點收入。

晚點：作為一個前阿里員工和開源社區(qū)的貢獻者，你怎么看這次人事變化對接下來一段時間的影響？

高岱恒：我能預見的是這些人肯定會被 Meta 、 OpenAI 這些公司瘋搶。尤其是在 xAI ，馬斯克對這群人才如饑似渴。正好今年 SpaceX 跟 xAI 合并，可能會在 2026 年進行一次很大規(guī)模的 IPO ，這種極強的財富效應對于研究員有很強的吸引力。

對于市場來講，會進入到一個 “收斂狀態(tài)”。當大家發(fā)現(xiàn)大語言模型只要繼續(xù) Scaling （擴大規(guī)模）就能壓榨出新智能，就會不停加注。公司可能在開源方面的投入會慢慢減少，更多點在于提升模型表現(xiàn)和 Agent 領域的 Tool Use （工具調(diào)用）能力。大家會招更多在國外公司有 Post-training （后訓練）和 RL （強化學習）經(jīng)驗的人，讓模型有更強的實戰(zhàn)表現(xiàn)。

今天在各種 Benchmark 上刷榜，絕大多數(shù)人可能已經(jīng)沒那么 Care 了。這種情況下會誕生新的細分行業(yè)。比如大家會對強化學習環(huán)境更重視。或者以前大家喜歡在體內(nèi)（公司內(nèi)部）做，2026 年會看到更多第三方的數(shù)據(jù)提供商或強化學習提供商，為前沿實驗室提供數(shù)據(jù)和服務。

晚點：這次事件也引發(fā)了討論：前沿核心研發(fā)團隊的目標與公司大目標之間怎么對齊？你是很了解這群人的，你覺得他們和大型商業(yè)組織長期會是什么關系？

高岱恒：近期來看，我覺得會很像文藝復興時期的 Workshop （工作室）和金主的關系。現(xiàn)在的邏輯是，大家去一個 Workshop 當學徒，目標是做出自己的作品。他們很像藝術家，不是靠在某個公司工作幾年去立足，而是靠自己的作品。

文藝復興之前，做藝術跟木工、瓦工沒區(qū)別。但文藝復興后，巨大的投入和需求提升了這群人的社會地位。最典型的就是美第奇家族讓達芬奇、米開朗基羅可以和貴族一起吃飯。映射到這兩年，你會發(fā)現(xiàn)扎克伯格挖明星研究員開出的待遇，竟然比 NBA 或英超球星的工資還要高。這個趨勢一旦形成就很難逆轉。誰能把算力發(fā)揮出最好的性能，誰的溢價就極高。如果把項目交給一個小白，給再少的錢，干砸了金主也接受不了。

整個過程開始是大家在 “體內(nèi)” 建立組織；但到了今年或明年，會看到很多 “體外” 組織。這些組織在大模型產(chǎn)業(yè)鏈里幫你做某一環(huán)，比如代工 Agent RL 的訓練。這會讓智能更快在各行業(yè)生根。最后可能會有完全偏獨立的模型公司，目前在國外比較多，像 Cohere （一家自然語言處理領域的獨角獸公司）就是典型的企業(yè)級 AI 公司，幫你做服務。隨著工具鏈成熟和 Agent 調(diào)度能力增強，這類公司架構里的人也不會特別多，他們是整個生態(tài)里的毛細血管。

晚點：你說這種公司，比如 Mira （前 OpenAI CTO) 做的那個 Thinking Machines Lab ，他們推出了 Tinker 專門幫企業(yè)做強化學習訓練。這些公司能找到的 “金主”，我理解還是一些自己不掌握核心 AI 技術的公司。最大的科技巨頭比如阿里、字節(jié)、Meta、Google 應該還是傾向于在體內(nèi)做。

高岱恒：整體來看，現(xiàn)實情況是全球 AI 領域的 PhD 和教授大部分現(xiàn)在都是華人。如果你要招一個 AP（助理教授），在 MIT 的超級天才和來自國內(nèi)大學的學生之間，你肯定招后者，因為更好溝通、更勤奮。

在這種環(huán)境下，人才供給只會越來越多。這群人進入這個環(huán)境都把自己當 “演藝圈” 的人，目標是有自己的代表作，不像是傳統(tǒng)的工程，老師傅帶著你一步一步成長。無論是創(chuàng)業(yè)還是做工作室，大家的目標不只是進入 Qwen 或者 Kimi ，那只是中間過渡，最終是用頂會論文建立自己的門檻。

我完整經(jīng)歷過從傳統(tǒng)計算機視覺 Deep Learning 到大模型、 Stable Diffusion（穩(wěn)定擴散模型）的演進。如果你在 2020 年、 2021 年只會做 GAN（生成對抗網(wǎng)絡）或 VAE（變分自編碼器），到了 2023 年不擁抱擴散模型，你就被干掉了。在大廠呆幾年的經(jīng)驗沒有任何優(yōu)勢。

今天許多大模型公司和團隊，核心工作都是實習生在做的，這種規(guī)則跟其他行業(yè)完全不一樣。

晚點：如果把他們類比成藝術家，追求代表作，那最終的長遠目標是什么？如果是為了錢，人的需求肯定會再上一層，那個東西是什么？

高岱恒：長遠目標是自我發(fā)展，而自我發(fā)展需要作品。我覺得做一個模型或開源項目，很多人點 Star 、提反饋，這就是自我實現(xiàn)的過程。這是一個 “無限游戲”。

晚點：也許有的人是為了在科學史上留下貢獻，或者有使命感去實現(xiàn)更強的智能狀態(tài)。

高岱恒：那屬于潛意識。算法時代獎勵的是產(chǎn)出，而不是不成型的東西。如果你在千問的 Technical Report（技術報告）上有一個名字，或者在小龍蝦項目的 Contributors（貢獻者）列表里排在前列，這能讓你越來越有自信。這種正反饋會讓你有更大的動力去勝任未來的工作、創(chuàng)業(yè)或任何事。

AI 研究員，這個時代的文藝復興藝術家

晚點：DINQ 最開始是從一個好玩的小功能 “ AI 辣評” 開始的，為什么當時想到做這個？看到了什么有趣的用法？

高岱恒：這個小功能很簡單，就是 25 年 3 月我有這個想法，4 月就開發(fā)出來了。用戶可以輸入自己的 Google Scholar（谷歌學術）、GitHub 或其它社交賬號，模型就能分析他的經(jīng)歷并生成 “辣評”。當時市場情緒很高，研究員們也很好奇自己的身價，這就成了一個很多人會玩一玩的小產(chǎn)品。

最開始，我們對薪資檔位的想象力還比較有限，最高只定到 1000 萬美元。但 7 月 Meta 開始天價挖人，直接開到 1 億美元。現(xiàn)在這種高薪已成常態(tài)，而且據(jù)我了解，這些公司是按月支付期權對價的。有些人年薪底薪可能只有 50 萬美元，但有分四年給完的 2000 萬美元期權，每個月兌現(xiàn)的期權價值比工資還多。

后面來玩的一些用戶都超出我的想象了，像謝賽寧、斯坦福的楊迪一老師、做 MoE 的 Albert Jiang、月之暗面的聯(lián)創(chuàng)周昕宇等等，都用過。我們還做了一個 PK 功能，比引用量等客觀指標。我那會兒做過林俊旸和周暢的 PK ，當時是勢均力敵。

所以我發(fā)現(xiàn)大家還挺喜歡這種小工具，就從這一點出發(fā)，想能不能做更嚴肅一點的、滿足這群人需求的東西，所以有了 DINQ 這個創(chuàng)業(yè)想法。

晚點：你怎么定義這群人，他們的核心特質是什么？

高岱恒：就是對 AGI 的逼近，有創(chuàng)造、有貢獻的人。

他們能完成一套完整流程：發(fā)現(xiàn)一個問題，提出一個方案，做很多實驗，最后交付一個結果。這種人很容易讓人聯(lián)想到文藝復興時期的藝術家。他們完整地在做一個作品，其實就是論文，比如一些具體算法和基礎設施成果。

今天的前沿 AI 機構都在根據(jù)這些作品找人。他們的定價很多時候也是根據(jù)作品來的。而學歷和工作經(jīng)歷，也重要，但現(xiàn)在的貶值速度非常快。

晚點：英雄不問出處。

高岱恒：是的。很多關鍵的研究員甚至都沒上過大學。比如 Eric Luhman 和 Troy Luhman 兄弟，從 20 年左右就開始用擴散模型做一些科研任務。但他們當時沒有投稿到學術期刊和會議，而是發(fā)在康奈爾大學做的 arxiv 預印本平臺。后來他們被 OpenAI 招走了。

晚點：這樣的趨勢在中國、美國都明顯嗎？

高岱恒：都明顯，中國公司現(xiàn)在招人也是這樣，他們會在 GitHub 或者頂會論文上面尋找千里馬。

我認為這是一個必然的現(xiàn)象。現(xiàn)在回看 2020 年其實已經(jīng)暗暗埋下了很多伏筆。比如擴散模型的基礎技術，UC Berkeley 的 Jonathan Ho 提出了 DDPM （去噪擴散概率模型）技術，斯坦福大學的宋飏也提出了相關的擴散模型技術。當時包括 Transformer 相關的一系列后驗技術，以及跨文本的圖像模態(tài)的 T5-xxL（文本到文本轉移互感器模型）等都已經(jīng)趨于成熟。

這種技術儲備在隨后幾年直接引發(fā)了學術界和工程界的產(chǎn)出激增。以 ICLR（國際學習表征）會議為例， 2020 年的投稿量大概只有 2000 篇左右，到今年已經(jīng)超過了 30000 篇。這種爆發(fā)不僅限于論文，更多也是通過 GitHub 或 Hugging Face 這樣的平臺釋放。今天我們看到 Hugging Face 上的中國模型數(shù)量在 2025 年下半年已經(jīng)超過了美國，這個其實就代表著中國 AI 的力量已經(jīng)非常的強大了。

還一個非常核心的觀察是，這一波 AI 浪潮的核心推動者大多是 30 歲以下的年輕人。比如文生圖領域重要的對齊模型 CLIP ，它的作者 Alec Radford 在 OpenAI 做出這項工作時不到 30 歲；如果沒有這個模型，現(xiàn)在的 Dalle-E（OpenAI 的繪圖模型）或者 Stable Diffusion 都不可能誕生。

也有中國人做的重要技術，比如旋轉位置編碼，是蘇劍林在 2020 年左右提出的，當時他也沒到 30 歲。還有混合專家模型 MoE 的 Mistral 團隊的 Albert Jiang 、 Stable Diffusion 的作者，來自德國慕尼黑大學的 Robin ，發(fā)布這些成果時都是 30 歲以下的年齡。

因為 2022 年其實正好我也 30 歲了，之前是因為做開源項目進入到達摩院工作的。從數(shù)學期望的角度來說，我可能很難通過在公司工作做出什么有重大影響力的事情了，所以那個時候我就在想，也許我后面應該做點別的事情。最近有一個很火的詞叫斬殺線，對吧？就是可能你過了一定的年齡，這個好作品就和你無緣了。

晚點：所以轉而想到去做社區(qū)或平臺，讓優(yōu)秀的年輕人脫穎而出，并幫助企業(yè)連接這些人才。

高岱恒：是的。目前機構和公司最核心的訴求就是找到那些能產(chǎn)出重要技術的人。根據(jù)我的分析，無論是 2024 年開始很火的 GRPO（組相對策略優(yōu)化）技術，還是現(xiàn)在的 GSPO（組稀疏策略優(yōu)化），基本都是二十多歲的年輕人做出來的。

這就引出了一個關鍵點：公司該去哪里找他們？什么樣的特質代表了這種潛力？我理解 AI 是一場 “無限游戲”，如果你想在智力賽道上始終占據(jù)領先位置，就必須持續(xù)吸引最優(yōu)秀、最有想法的年輕人。

晚點：對這些年輕人來說，Github 、X 、領英這些已經(jīng)存在的平臺不夠嗎？

高岱恒：夠的。但是問題就在于很難把這里面的有效信息進行篩選和整理，因為它的渠道太多元了。今天對于一個做 AI 研究的人來講，他可能有十個社交媒體賬號，些渠道可能都在產(chǎn)出信息。你怎么有效地把它聚合，我認為是更關鍵的。因為它其實要解決的不是內(nèi)容的豐富度問題，而是信息的分發(fā)問題。

其實過去的分發(fā)模式?jīng)]有問題，但今天的 AI 其實有非常多的新的細分方向：AI for Science、基礎設施，各種語音模型、雙工模型（Full-Duplex Models ）等等。這些都需要人來做，也需要卡，那怎么能夠找到那個適合去調(diào)配這幾百甚至幾千張卡的人，我們叫做造 F1 賽車的人，就變得非常重要。

同時你會發(fā)現(xiàn)，不但這些造 F1 賽車的人值錢，那些 F1 的車手——能做出有創(chuàng)造力作品的人，比如最近爆火的小龍蝦機器人，還有 2025 年的這個 Claude Code 的作者 Boris Cherny，像這樣的人也開始值錢。他們對大眾的影響力是比研究院要高的。其實無數(shù)的時代看下來，都是 F1 車手比造 F1 的工程師的影響力更大。

從土木老哥到阿里達摩院

晚點：我們可以從頭聊聊你的經(jīng)歷，你本科是學土木工程的，怎么變成 AI 研究員的？

高岱恒：我的這個路線確實不是規(guī)劃出來的。因為在 2017 年的時候，我只是單純覺得我再繼續(xù)學那個方向，可能未來連個工作都找不到了。那一年阿爾法狗帶來一波 AI 熱潮，正好就碰到市場上有宣傳 AI 的一些課程，其中最有代表性的就是吳恩達老師的 AI 課程。當時上完他的課程，我記得具體的技術我都已經(jīng)忘完了，但是有一句話我印象非常深，就是他說你只要按部就班地學完了我的這個公開課，你會超過硅谷 95% 的工程師。我估計很多人是不信這個東西的，但是我那時候真信了。

后面我畢業(yè)之后也進了一家公司。那個時候主要都是在做視覺圖像的檢測，我發(fā)現(xiàn)其實大部分的工作內(nèi)容沒有那么難。然后我就在考慮我能做點什么，能讓我自己的這個經(jīng)歷有一些增值。我就接觸到了一個東西叫做 PyTorch ，就是 Meta 的深度學習框架。我能明顯感覺到它的潛力是比當時谷歌的 Tensorflow 要強很多的。所以我就想，能不能在這個里面貢獻點代碼，我就開始密集地跟這些當時 PyTorch 的一些核心人員有一些郵件來往。

晚點：當時大家交流是一個什么氛圍？

高岱恒：當時主要就是給大家發(fā)郵件，說我對這個方向比較感興趣，你覺得我這么改是不是對的？然后那個時候相比谷歌的 Tensorflow 的話， PyTorch 貢獻者也非常少。

那時候其實本質上我對開發(fā)的底層代碼一竅不通，根本看不懂。那我怎么貢獻呢？我用了一種比較抽象的方法，就是進每一個代碼文件里面去看，我就在想他里面總會有語法錯誤，就比如說一個詞可能拼錯了。因為那個時候也沒有所謂 AI 輔助編程的工具。我確實找到了幾個，就改了，然后他們很快給我合并到代碼倉庫。雖然這樣的東西沒有任何技術含量，但是在當時給我了一個非常強的正反饋。所以我后面就一直在做開源，很自然地就進入了下一個階段，開始做圖像視頻處理的一些開源技術。

晚點：那你能進入達摩院是因為那個時候達摩院就是按照作品去找人的嗎？你自己是通過什么項目進去的？

高岱恒：我覺得不是，包括到現(xiàn)在為止，很多地方還是按學歷去 “卡” 人的。因為這樣做的核心邏輯是，大部分人并沒有所謂的代表作，Signature Paper。

我自己是通過一個換臉項目，叫做 DeepFaceLab ，就是讓一個不懂技術的人，可以在電腦上通過點擊一些腳本，能夠合成影視級的換臉效果。

做完那個東西之后，其實我印象比較深的一個機會是在 ICCV ，計算機視覺的一個頂級的會議，當時 2019 年在韓國首爾舉辦，然后他們就看到說我好像在這個項目里面貢獻的挺多，就有一些人會主動來聯(lián)系我說，你完全可以去什么字節(jié)跳動這種公司。

被拒的 GPT-1 一作、旅居越南的 RAG 發(fā)明者，創(chuàng)新來自邊緣地帶

晚點：你二三年底開始寫 AI 人物英雄傳，那個時候大家沒有那么關注 AI 的一些研究員。你自己對這群人的興趣是怎么來的？

高岱恒：我最開始對這群人產(chǎn)生興趣，其實有一個特別具體的點。我在 2019 年的時候做換臉的項目，其實一直在關注最先進的生成技術。有一個叫風格式對抗生成網(wǎng)絡 StyleGAN ，是英偉達做的，但在當時只有 TensorFlow 這個深度學習框架上有，我想把它遷移到 PyTorch 上面，然后在做的這個過程中，我就被他的這個代碼質量深深地折服了。我很好奇到底是什么樣的人能寫出這種代碼，就開始去挖掘它背后的作者。他是來自英偉達赫爾辛基實驗室（芬蘭）的一個研究員，叫 Tero Karras，而且這個人竟然連大學文憑都沒有。我當時就覺得，這簡直太牛了。

后來隨著我對 PyTorch 社區(qū)了解的深入，我發(fā)現(xiàn)當時貢獻最多的人，竟然還在波蘭的華沙大學讀大三，叫 Adam Paszke。他現(xiàn)在應該在谷歌開發(fā)另一個深度學習框架，叫 JAX。我覺得這幫哥們兒都挺 “神” 的，就想去挖掘他們更多的故事，然后有什么信息都想去挖一挖。

這些東西對于我來講是工作之余的一個消遣。

晚點：你跟他們的一些人是建立了直接聯(lián)系嗎？有沒有發(fā)生過什么比較有意思的事？

高岱恒：是的。我印象中比較有意思的一件事，是我當時聯(lián)系 OpenAI 的前創(chuàng)始成員 Durk Kingma，他現(xiàn)在也在 Anthropic 。我那時候跟他建聯(lián)的一個契機，是他獲得了一個學術會議的 “時間檢驗獎”，然后我就給他發(fā)郵件去祝賀他。因為他是荷蘭人，所以我們畫了一張他的大頭照，配上荷蘭風車的背景發(fā)給他，表達了想認識他的意愿。當時他非常感興趣，他說你這個太好玩了，然后我們就開始有一些郵件上的聯(lián)系。

在 2024 年 7、8 月份的時候，我給他發(fā)了一封郵件，想聽聽他對未來的建議。因為那時候我也出來了，在思考未來該做點什么。他當時給出的建議非常明確，他說你一定要關注 AI Agent 這個方向。在那個時間點提出這個，其實算非常早的。然后我就去研究這個方向了。

他的邏輯很直接：如果你現(xiàn)在去做底層大模型，核心其實不在于技術，而在于基礎設施，也就是算力和卡的問題，這就需要依托大公司。但做 AI Agent 更多是靠個人的創(chuàng)造力和能力，沒有什么硬性門檻能攔住你。我非常認同這一點。

晚點：我發(fā)現(xiàn)你比較感興趣的人物都是他的背景和成長路徑跟最典型的不太一樣的那些人。你是會被這種反差和戲劇性所吸引嗎？

高岱恒：我覺得這種故事能給人留下深刻的記憶。如果你看到一個人的成長路徑是一帆風順的——從小就是 “學霸”，一路拿各種計算機或數(shù)學競賽的金牌，大家會覺得這樣的人很牛，但跟我沒有什么關系。

我其實覺得每個人在某種程度上都會被這種反差感吸引。比較有代表性的就是 GPT 之父 Alec Radford。發(fā)布 GPT 時，他其實只是從波士頓的歐林工程學院畢業(yè)的一名本科生。

他進入 OpenAI 的時間非常早。當年實驗室的主流方向是強化學習，因為那個方向的正反饋非常強，無論是讓機器人擰魔方，還是打 Dota 比賽，都取得了很好的的成果。但當時只有他一個人在做這個下一個詞預測。而且那個過程其實還做得磕磕絆絆，經(jīng)歷過論文被拒稿，也經(jīng)歷過實驗效果跑得很拉的階段。我就在想，在一個大家都取得成果的研究型實驗室里，Alec Radford 當時內(nèi)心一定承受了巨大的壓力。

晚點：他是 GPT-1 的一作對吧？

高岱恒：GPT-1 和 GPT-2 。我印象很深，當時他把這個 GPT 的論文投稿到學術會議，叫 ICLR（國際學習表征），結果被拒稿了。所以你可以看到，后來的 GPT-2 其實是以 OpenAI 博客的形式發(fā)布的。他可能就不想讓自己太難受了，因為投稿會被拒。直到第三代，他才正式在計算機頂級會議 NeurIPS 上發(fā)表并獲得了認可。

晚點：為了接觸研究員，你做過什么你覺得最神奇的事？

高岱恒：2025 年 2 月，我去舊金山 OpenAI 總部蹲點去了。我想采訪 Jason Wei ，因為我了解到他的思維鏈技術是冥想時想到的，當然也包括 GPT-4o 的那個印度人，這些人我都比較感興趣。雖然最后沒見到本人，但成功地把宣傳貼紙貼在了公司都公告板上。

晚點：你怎么進去的？

高岱恒：用了點 “社會工程學”。我跟保安說，我想做文藝復興時期的 Vasari 瓦薩里，準備記錄 AI 時代的達芬奇、米開朗基羅，然后它里面還有一層保安，讓我和內(nèi)部保安溝通，最終是順利留下了傳單。如果用這種方式能夠跟那些人接觸上，我覺得對我來講是一個額外的獎勵。

晚點：你會擔心萬一碰到 Sam Altman 怎么辦？他可能會覺得公司的安保出了大問題。

高岱恒：那不是好事兒嗎？最后反正也沒遇到，所以就還好。

晚點：還有什么你能想到，你覺得比較有意思的可以分享一下。

高岱恒：我覺得實在太多了。我就講一個技術，RAG （檢索增強生成），前幾年很火，但這兩年熱度被 Agent 蓋過去了，但當年它是非常關鍵的技術。

這個技術的作者 Patrick Lewis ，是英國 UCL（倫敦大學學院）的博士，他畢業(yè)后沒直接進大廠，反而去越南、歐洲旅居了很長的時間，某種程度上算是對緊繃的教育和工作的一種 “休息”。他的運氣很好，2017 年 1 月加入了一家叫 Bloomsbury 的一個 AI 醫(yī)療公司，結果同年 7 月這家公司就被 Meta 收購了，他也順勢進入了 Meta。隨后在 2020 年，他在 Meta 主導做出了 RAG。他現(xiàn)在已經(jīng)去了 Cohere，跟 Transformer 的作者之一 Aidan Gomez 一起創(chuàng)業(yè)。有很多這樣有意思的故事。

晚點：你自己是理工科的背景吧？你為什么會對故事這么感興趣呢？

高岱恒：我不知道，這個可能是與生俱來的，我就喜歡這些東西，反正就是看了一遍我就能記住。而且對于很多細節(jié)的挖掘對我來說是一種享受。

晚點：你在跟這些研究員接觸的過程中間，你從他們身上看到了一些什么樣的共性？

高岱恒：第一點是極強的抗挫折能力和戰(zhàn)略定力。做前沿研究很難快速出成果、有正反饋，很多人會忍不住去追熱門方向。但他們愿意坐冷板凳，不滿足于做跟風、隨性的工作。我認為他們更關心自己的研究能不能真正地影響到這個世界上更多的人。

然后就是他們普遍不喜歡空泛的恭維吧，反而如果你能聊具體的研究細節(jié)、技術思路或者未來的方向，他們會非常愿意跟你深入交流。

晚點：你覺得 Meta 開出天價挖人，他們的反應是什么？

高岱恒：現(xiàn)在這個時代，做智力研究能拿到這么高的收入，在歷史上都很少見。我了解到的情況是，很多人拿到天價 offer 時其實有點發(fā)懵的，普遍的心態(tài)是：我拿了這么多錢，我就趕緊干活，趁年輕多干幾年，然后早點退休。

晚點：你就說干幾年退休？可是他們很年輕，那不是三十幾歲就退休了？

高岱恒：這些研究其實非常卷，壓力很大。比如跑一個實驗，動輒用幾千張顯卡，生怕在中途出錯，這也是無形的精神壓力。高薪很大程度上是對這種高強度壓力、被 KPI 推著走的高壓狀態(tài)的補償。早點 “財務自由”，他們就能擺脫任務的束縛，去做自己真正想做的自由研究。

晚點：你覺得現(xiàn)在什么樣的人最能在這個領域有所建樹，做出成績？

高岱恒：核心是真正的熱愛，能長期堅持。這個領域是典型的實驗科學，失敗和不順利是常態(tài)，遇到一點挫折就放棄的人很難走下去。

同時還要有一個平常心，對結果不必有太強的執(zhí)念。有的時候越是急著出成果，反而越難拿到；能沉下心、扛住挫折，才更容易做出真正有價值的東西。

晚點：所以這是一個平衡：對方向有長期信念，但不對短期結果過度執(zhí)著。

高岱恒：對。這是一個復雜的系統(tǒng)工程，模型效果不好，可能是數(shù)據(jù)、集群、參數(shù)、MoE 細節(jié)等各種方面的問題。如果每天都為短期實驗失敗內(nèi)耗，人很快會被拖垮。這種情況下就是平常心一點，因為我認為這還是一場無限游戲，不必糾結于一時的名次，那都是短暫的。

Build in Public 上限高、下限低，但反正穩(wěn)定的東西正在消散

晚點：你們的 DINQ 平臺核心還是做企業(yè)與 AI 人才的匹配，雙方分別看重什么？

高岱恒：企業(yè)端更關注技術方向的匹配，比如當下熱門的 Personal AI agent ，他們希望找到有論文、代碼、項目成果甚至是寫過相關博客的人。我們就通過多元異構做數(shù)據(jù)聚合，讓企業(yè)能用自然語言精準找到合適的人才。

對個人而言，平臺是低成本的曝光渠道，尤其是年輕研究員，能更高效地對接 OpenAI、Anthropic、XAI 等頂尖機構，獲得被大廠 HR 發(fā)現(xiàn)和連接的機會。

晚點：可以分享下你們平臺的人才招聘洞察嗎？國內(nèi)外招人趨勢、注冊用戶都有哪些特點？

高岱恒：招人國內(nèi)外差異很明顯。國外企業(yè)會直接拿具體的論文來搜作者以及相關方向的人才；國內(nèi)更偏好找一個范圍的，比如特定學術會議、熱門項目有貢獻的華人，還有一個特點是會限定年齡，比如 95 后、00 后。然后國內(nèi)對名校的標簽也比較看重。

個人用戶大多是論文、項目、代碼等數(shù)據(jù)富集的 AI 從業(yè)者，平臺會幫他們聚合多渠道的信息，然后綜合展示。目前以模型訓練、AI 研究類人才為主，這和我們早期在研究員圈層傳播的基礎有關。

晚點：你剛說到國內(nèi)按條件批量找人、國外按論文精準找人，你覺得哪種效率更高？

高岱恒：我覺得肯定是前者的效率高。企業(yè)直接鎖定方向，比如 AI agent 里面工作流調(diào)度、DAG flow （基于有向無環(huán)圖邏輯構建的自動化工作流）等具體方向，能快速篩選出匹配的人，直接對接。如果一次結果不滿意，可以調(diào)整特征，多次迭代篩選。而平臺的核心價值，就是通過對話理解企業(yè)的真實需求，然后精準定位人才并完成對接。

晚點：在中國的這些 AI 團隊里面，什么團隊的人被搜到的最多？

高岱恒：目前肯定是千問。

晚點：為什么不是 Deepseek ？

高岱恒：可能跟他們團隊成員的公開信息少、社交媒體活躍度低，或者跟團隊風格、負責人習慣有關系。

晚點：你覺得國內(nèi)企業(yè)喜歡用名校、論文、年齡這種硬條件找人，反映了什么思維？

高岱恒：本質還是看重可量化的標簽。雖然大家都說學歷在弱化，但國內(nèi)依然習慣用名校、頂會論文、年齡這些明確指標做篩選，方便快速錨定人才、排除不符合的人。

這可能也和環(huán)境有關：名校背景更容易獲得投資人認可；好學校導師的資源、實驗機會也確實更多，這是現(xiàn)實優(yōu)勢。

現(xiàn)在可以看到，MIT、斯坦福已經(jīng)開設了 AI 專業(yè)，從 2025 年起加州大學圣地亞哥分校等公立高校也紛紛開設 AI 專業(yè)，本科生規(guī)模會越來越大，也許未來的人才標簽會更加標準化。

晚點：從概率上，看重學歷其實是很合理的，對吧？

高岱恒：對。我覺得這個時期是這樣的，對于那些超有能動性的人，我們叫 build in public ，確實不需要學歷，你只要真的在做一些好的東西，一定會有人找你。

但這類人終究是少數(shù)。對大多數(shù)人來說，更需要安全感，希望今天的投入能快速看到回報，就會傾向走穩(wěn)健路線—— 升學、進名校、接觸優(yōu)質資源，這是穩(wěn)妥的、比較有保障的路徑。

晚點：你說的 build in public ，它可能上限很高，但還有可能下限很低。但如果按照一個相對成熟的既定路線去發(fā)展的話，可能大家覺得至少下限不會特別低。

高岱恒：其實我們進入今天這個時代已經(jīng)很不一樣了。以程序員為例，大家都明顯感覺到：AI 寫代碼的質量和效率已經(jīng)遠超普通人，像一些產(chǎn)品官網(wǎng)、前端界面，還有那個小龍蝦，根據(jù)它的作者說也是完全 vibe coding 出來的。

當 AI 能直接寫代碼、做開發(fā)時，傳統(tǒng)靠讀書、學歷帶來的安全感正在消失，所有人都會陷入存在主義危機。

晚點：我覺得你講到了這個技術快速發(fā)展時代的另一個特性，就是你按傳統(tǒng)穩(wěn)妥的路線走，也可能跟不上市場變化。這個在美國很明顯，最近像 amazon ，他一次就裁了一萬多的程序員。

高岱恒：對，就是前兩天，裁掉了一萬六。我想起納瓦爾 2021 年在推特上說的全民創(chuàng)作者經(jīng)濟時代到來，未來要么靠全民基本收入兜底，要么轉向藍領工作，留在白領領域的人，必須具備創(chuàng)造力與獨特價值。對程序員和開發(fā)者來說，核心就不再是寫代碼的能力，而是要能做出有趣的、被人需要的產(chǎn)品。

保持身心健康，享受和 AI 一起創(chuàng)造的過程

晚點：很多技術樂觀主義者認為，AI 替代重復勞動后，人類就能專心從事創(chuàng)造。但有創(chuàng)造力這件事在當下我覺得很難，你怎么看？

高岱恒：確實，真正的深度思考、持續(xù)創(chuàng)造，對大多數(shù)人來說非常難。技術奇點到來，發(fā)展可能是跳躍式的，也可能會有一個過渡期。未來誰也無法準確預估，能做的只有抓住當下，做自己覺得重要、有樂趣的事。

晚點：你接觸過很多 AI 研究員，他們怎么看待自己工作將帶來的廣泛社會影響？

高岱恒：我覺得大部分研究者其實并沒有過多思考長遠的社會后果，只有極少數(shù)人比如 Ilya 會深入思考這類問題。

絕大多數(shù)人更專注于技術本身，想怎么讓核心目標更高、更快、更強。很多人是關心這些事情。

晚點：因為你們現(xiàn)在做 DINQ ，也是解決工作匹配、人才市場的問題，你覺得未來的招聘市場會怎么演變？

高岱恒：我覺得未來的招聘會更快、更零散，忠誠度和長期雇傭關系會越來越弱。現(xiàn)在的頂尖 AI 研究員就已經(jīng)是五年三跳，這種高頻跳槽的狀態(tài)。我覺得未來可能會出現(xiàn)一種智力勞動的外賣化。

還有就是人才的匹配會收斂到一些很具體的指標，比如代碼工具的 token 消耗量、AI 交互頻率、工作流自動化率等。企業(yè)可能越來越不看重背景，只看是否足夠 AI native ，有沒有解決實際問題的經(jīng)驗。

晚點：最后一個問題，作為前 AI 研究員、現(xiàn) AI 創(chuàng)業(yè)者，你對當下做 AI 研究和開發(fā)的人，最想分享什么？

高岱恒：在這個時代，過去進大廠，升職級、爬梯子的邏輯正在變?nèi)酰驗楝F(xiàn)在最頭部的公司都開始淡化職級，統(tǒng)一都叫 MTS，就是 Member of Technical Staff，大家都叫技術工人。

所以比起拼命內(nèi)卷，我覺得更要先照顧好自己：保持身心健康、情緒穩(wěn)定，享受和 AI 一起創(chuàng)造的過程。因為今天寫代碼大部分人也已經(jīng)寫不過它了。人的核心價值會轉向溝通、協(xié)作與創(chuàng)造力——這些人本來的價值。也許再過幾年大家沒有工作，都領低保了，這時候健康長壽就是最重要的，如果身體搞垮了，其實也沒什么太大意義。

題圖來源：《奧本海默》

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.