![]()
你有沒有發(fā)現(xiàn)?
去年刷爆 AI 圈的 DeepSeek,今年好像沒什么動靜了。
以前刷小紅書,刷知乎,到處都是 DeepSeek 的消息。
什么 V2 版本超 GPT-3.5,V3 對標 GPT-4,R1 還上了《Nature》封面。
![]()
怎么今年就突然啞火了?
網(wǎng)友們扒來扒去,終于找到了答案:里面的大佬們,一個個被挖走了。
先是羅福莉,那個 95 后 AI 天才少女,被雷軍千萬年薪挖到小米去了。
![]()
她可是 DeepSeek-V2 的核心開發(fā)者,MoE 架構(gòu)的大拿。
去年 11 月官宣加入小米 MiMo 大模型團隊,朋友圈一句 “我正在 Xiaomi MiMo”,讓整個 AI 圈都炸了。
![]()
近期在OpenRouter平臺,
累計調(diào)用量破萬億的神秘模型- “Hunter Alpha”
正是小米自研的MiMo-V2-Pro!
現(xiàn)在AI圈又傳出,DeepSeek 的另一位頂梁柱,郭達雅,也要走了。
![]()
消息一出,評論區(qū)直接炸開鍋。
有人說 “這是要把 DeepSeek 掏空啊”,
有人問 “下一個是誰?”,
還有人嘆息 “創(chuàng)業(yè)公司留不住人啊”。
郭達雅是誰?為啥這么多人關(guān)心
郭達雅,1994 年出生,廣東珠海人。典型的學霸路線。
2014 年考進中山大學數(shù)據(jù)科學與計算機學院。
大四就進了中山大學 — 微軟亞洲研究院聯(lián)合培養(yǎng)項目。
在 MSRA 那幾年,開了掛的他2020 年拿了微軟學者獎學金,
亞太地區(qū)就 12 個人能拿到。
![]()
![]()
跟著印鑒教授、周明博士,后來又跟段楠搞代碼智能,做出來的 CodeBERT、GraphCodeBERT,現(xiàn)在還是行業(yè)標桿。
2023 年博士畢業(yè),第三天就完成了中大博士畢業(yè)論文要求,發(fā)了一堆頂會論文。
7 月就加入了 DeepSeek,成了代碼智能和推理方向的核心研究員。
他在 DeepSeek 這一年多,干了很多大事:
主導(dǎo) DeepSeek-Coder 系列,從 1.3B 到 33B 參數(shù),讓 AI 寫代碼的能力直接飆升,能一次性看懂整個項目的代碼架構(gòu)。
負責 DeepSeek-Math,把模型的數(shù)學解題能力提了一大截。
作為第一作者搞出 DeepSeek-R1,直接上了《Nature》封面。不用人類示例,讓模型自己開發(fā)推理步驟,訓練成本降了好多。
深度參與 V3 混合專家模型,14.8T tokens 訓練,性能對標頂級閉源模型。
![]()
他的研究主線特別清楚:讓模型更會寫代碼、更會做數(shù)學、更會推理。這三個方向,正是現(xiàn)在大模型賺錢的核心痛點。
你想想,企業(yè)用大模型,不就是想讓它幫著寫代碼、算數(shù)據(jù)、解決復(fù)雜問題嗎?
郭達雅就是把這三件事做到極致的人。
他的貢獻有多牛?說出來嚇你一跳
郭達雅在 DeepSeek 的成果,隨便拿一個出來,都能在 AI 圈引起轟動。
就說 DeepSeek-R1,他是第一作者。
這個模型牛在哪?它能自己反思,自己驗證答案。
傳統(tǒng)模型要靠人類標注數(shù)據(jù),成本高得嚇人。
R1 不用,通過強化學習,讓模型自己比較多個答案,找出最好的那個,訓練資源直接省了一大半。
還有 DeepSeek-Coder,現(xiàn)在很多程序員都在用。
![]()
能理解代碼里變量之間的依賴關(guān)系,重構(gòu)代碼、修 Bug 都特別順手。
有程序員說,用了 DeepSeek-Coder,寫代碼效率直接翻倍。
數(shù)學方面更不用說,DeepSeek-Math 讓模型解數(shù)學題的能力大幅提升,很多競賽題都能輕松搞定。
![]()
他的論文,幾乎篇篇都是頂會級別,引用量高得驚人。
這樣的人才,哪個大廠不想要?
大佬出走,中國大模型的困境
羅福莉走了,郭達雅也要走了。
這背后,是中國大模型行業(yè)的殘酷現(xiàn)實。
創(chuàng)業(yè)公司再努力,也扛不住大廠的鈔能力。
人家一張口就是千萬年薪,還有股票期權(quán),創(chuàng)業(yè)公司拿什么比?
網(wǎng)友們看出來了:這已經(jīng)不是百模混戰(zhàn)了,是人才爭奪戰(zhàn)。
你以為拼的是參數(shù),是產(chǎn)品化速度?
其實拼的是能不能留住郭達雅這樣的人,
能不能給他們足夠的算力,
足夠好的科研環(huán)境,
還有長期的組織能力。
更讓人嘆息的是,現(xiàn)在很多企業(yè),根本沒能力做真正的大模型研究。
你看最近的 “小龍蝦” 熱潮,也就是 OpenClaw 智能體。
中國數(shù)十家家科技大廠集體下場,騰訊、字節(jié)、阿里、百度、小米都來了。
![]()
有的做適配,有的推自研,有的搭平臺。
大部分都是跟風。
有人花 3999 元學 “龍蝦賦能生產(chǎn)管理”,
最后只學會了用 AI 生成報表,對流水線作業(yè)一點用都沒有。
所謂的 “定制化方案”,就是套模板改幾個字。
還有人在云服務(wù)器上 “養(yǎng)蝦”,默認設(shè)置都是裸奔的。
讓龍蝦接管電腦 5 分鐘,就被 139 個 IP 嘗試連接。
這哪里是 AI 創(chuàng)新?這分明是割韭菜。
真正在做底層研究的,沒幾家。
愿意沉下心來,培養(yǎng)像郭達雅這樣的人才的,更少。
最后想說的話
郭達雅的離開,不只是 DeepSeek 的損失,更是整個中國大模型行業(yè)的縮影。
我們總說要追趕 OpenAI,要實現(xiàn) AI 自主可控。
但如果連自己培養(yǎng)的頂尖人才都留不住,怎么追趕?
創(chuàng)業(yè)公司不容易,拿著有限的資源,跟財大氣粗的大廠搶人,太難了。
而那些跟風做應(yīng)用的企業(yè),看似熱鬧,實則是在浪費資源。
沒有底層技術(shù)的突破,沒有頂尖人才的積累,
再熱鬧的 “小龍蝦” 熱潮,也只是曇花一現(xiàn)。
我們需要更多像郭達雅這樣的研究者,
沉下心來做基礎(chǔ)研究。
我們也需要更多能留住這些研究者的環(huán)境,
讓他們不用為了錢,為了資源,而離開自己奮斗的地方。
不然,中國的大模型,永遠只能跟在別人后面跑。
希望有一天,我們能驕傲地說,中國的大模型,不僅有應(yīng)用,更有自己的核心技術(shù),自己的頂尖人才。
而不是每次提起,都是 “誰誰誰又被挖走了” 。
阿斯麥高管:中國EUV原型機僅有我們20年前(2006年)的水平!白春禮院士:中國做光刻機時還沒有阿斯麥!
高志凱教授:西方抹黑中國的“總指揮”,被特朗普抖出來了
孫逢春院士直言:國產(chǎn)車技術(shù)已經(jīng)超越特斯拉,規(guī)模全球第一!網(wǎng)友:基本盤的專家
國際電池開發(fā)商:美國在芯片上全力制裁中國,但中國已經(jīng)在下一個技術(shù)時代開始稱霸了
黃仁勛說,“如果你的父母是中國人,那么你一定經(jīng)受過很多痛苦和磨難,我祝福你,一生都充滿「痛苦和磨難」”
美國要求臺積電在美追加投資3.15兆臺幣,合千億美金,因未滿足DEI合規(guī)(缺乏盲人和跨性別、女同性戀工程師)
“在看”的永遠年輕~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.