<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      大廠搶郭達雅進行時!DeepSeek核心成員還是個“綜藝巨佬”

      0
      分享至

      • 克雷西 聽雨 發自 凹非寺
        量子位 | 公眾號 QbitAI

      DeepSeek,又有核心工程師流入江湖——

      郭達雅,V2、V3、R1等一系列模型的核心作者,被曝離職。

      這位被導師寄予厚望成為“中山大學雷軍”的技術天才,在學術與競賽領域有著近乎傳奇的履歷。

      他自述在入學博士后的第三天便完成了畢業所需的論文發表要求,展現出驚人的科研效率。

      他還多次在騰訊廣告算法大賽中蟬聯冠軍,并在ATEC科技精英賽和微信大數據挑戰賽中斬獲頭籌。被調侃還沒畢業就有著百萬獎金。

      而且新時代的工程師,甚至還出現過綜藝里。

      在真人秀《燃燒吧!天才程序員》中,他作為僅有的兩名SSS級“巨佬”選手,在60小時的極限挑戰中展現了頂尖的編碼實力……

      消息傳到外網,也引發了很多網友的關注,有人表示,希望這不會給DeepSeek-V4帶來影響。



      畢竟,郭達雅從博士畢業后入職DeepSeek開始,就參與了Coder、Math等專項模型,以及從V2、V3到R1的完整研發鏈條,還都是核心作者。

      所以郭達雅,究竟是哪一種天才少年?

      DeepSeek多款模型核心作者

      郭達雅于2023年博士畢業后加入DeepSeek,專注代碼智能和大語言模型推理。

      促使他加入DeepSeek的原因很簡單:有一位師姐在DeepSeek工作,和他聊起公司追求AGI的愿景,這與他的價值觀比較吻合。

      • 當時,我的一位師姐在 DeepSeek工作,她找到了我,跟我聊了DeepSeek的愿景——追求AGI,推動人類社會的加速發展。這跟我的價值觀是相合的。
        同時,DeepSeek有比較多的資源投入研發,領導層也希望打造一個有創新氛圍和自由的公司。我有這樣的熱情去做這件事,我也想追求這樣的工作環境。最終,我選擇加入了DeepSeek。

      目前,郭達雅的個人主頁還沒有更新,仍然顯示為DeepSeek研究員。



      DeepSeek的一系列模型,包括V2、V3和R1,還有Math、Coder、Prover和V2-Prover,郭達雅全都是核心貢獻者。



      按時間順序梳理,第一條是2024年1月的代碼大模型DeepSeek-Coder。

      這個項目推出了從1.3B到33B的一系列開源代碼模型,在多項基準上做到了當時的開源代碼模型SOTA。



      第二項成果關于數學推理,也就是2024年2月的DeepSeek-Math。

      它以DeepSeek-Coder-Base-v1.5 7B為基礎,針對數學能力進行了繼續訓練,額外使用了120B數學相關token。

      更關鍵的是,DeepSeek-Math的論文中提出了GRPO這個新型強化學習方法,后來成為了R1推理的關鍵。



      緊接著是形式化證明,2024年5月,DeepSeek發布了DeepSeek-Prover。

      這個項目面向Lean 4定理證明,核心方法是大規模合成formal proof數據,并在此基礎上微調DeepSeek-Math 7B。

      結果,模型在Lean 4 miniF2F上whole-proof generation準確率達到 46.3%(64 samples),累計到52%,高于GPT-4的23.0%;在FIMO基準上證明了148題中的5題,而GPT-4得分為0。

      這項成果說明,DeepSeek的模型不只能完成一般數學推理,還延伸到了更硬核的形式化推理方向。



      還有我們更熟悉的V2、V3和R1,在這個研發過程中,DeepSeek證明了不依賴人工標注的推理軌跡,僅通過純強化學習,也能把大模型的推理能力激發出來,并自然涌現出自反思、驗證、動態策略調整等行為模式。

      DeepSeek-R1的相關論文,后來還登上了Nature封面,該論文披露,R1的訓練成本僅約29.4萬美元(折合人民幣約208萬)。



      總之,任職期間,郭達雅并不只是參與單點項目,而是參與了貫穿DeepSeek一整段主線的研發過程

      而在這一系列的成功背后,有他從中學時期便已經產生的對計算機、對編程的深厚興趣。

      “希望他成為中山大學的雷軍”

      郭達雅曾就讀于珠海一中,從中學時期便展現出對計算機科學的濃厚興趣。

      在接受珠海一中的訪談時,郭達雅表示,自己選擇計算機專業是興趣使然,并且這種興趣正是產生于中學期間。

      • 興趣是我選擇計算機專業并取得如今成就的重要因素,而這一興趣的萌芽正源自珠海一中。
        回想高中時光,學校豐富的實踐活動和課程不僅拓寬了我的視野,也讓我在信息課上第一次接觸到計算機編程。
        最初的我對編程一無所知,但很快便被其嚴謹的邏輯性和無限的創造力深深吸引。
        通過編寫簡單的代碼,我不僅感受到算法的精妙,還體會到數學在實際應用中的強大作用。
        這段經歷讓我對計算機科學產生了濃厚興趣,也讓我在高考結束后毫不猶豫地選擇了計算機專業。

      2014年,郭達雅被中山大學計算機學院錄取,隨后留在中大繼續直博深造。



      大四時,他入選中山大學與微軟亞洲研究院聯合培養博士生項目,師從印鑒教授和周明博士,研究方向是自然語言處理。周明則后來在大模型浪潮中,創辦了瀾舟科技。

      京東探索研究院副院長、階躍星辰Tech Fellow段楠的博士生導師也是周明,兩人算是師出同門。

      而郭達雅在中山大學對他進行的采訪中表示,自己在剛入學的第三天,就完成了中大博士畢業的論文發表要求。

      讀博期間,郭達雅的實習是在聯培單位MSRA完成的。

      其間,郭達雅完成了CodeBert以及GraphCodeBert的研究,分別發表在EMNLP 2020 Findings和ICLR 2021上。

      CodeBert開發了一個雙模態預訓練模型,首次實現了自然語言(NL)和編程語言(PL)的雙模態預訓練,填補了此前沒有模型能同時處理NL和PL混合輸入的空白。



      而GraphCodeBert則在此基礎上,首次將代碼的數據流結構納入預訓練,讓模型對代碼的理解更深入。



      畢業時,郭達雅的博士論文《基于預訓練的程序理解與生成》,獲評2023年中山大學優秀博士學位論文。

      這篇論文主要以程序理解與生成為研究課題,并針對該領域現有研究工作在數據與模型方面存在的問題,提出了基于代碼預訓練的方法和模型,目的是利用人工智能技術提高軟件開發的效率。

      從會議到博士論文,再到DeepSeek期間的工作,郭達雅的工作幾乎是一直圍繞著Coding展開,這也增加了曝料中他離職后負責Coding這一說法的可信度。

      DeepSeek-V3發布后,他的導師印鑒教授,還特別寄語,希望他能成為“中山大學的雷軍”

      截至目前,郭達雅已在NeurIPS、ACL、EMNLP等國際頂級AI會議發表論文十余篇,谷歌學術引用量超1300次。

      此外,在數據挖掘競賽方面,郭達雅也長期活躍于一線賽場:

      2021、2022年,他連續兩年拿下螞蟻集團主辦的ATEC科技精英賽冠軍;

      2022年微信大數據挑戰賽,3200支隊伍同臺競技,他帶隊奪冠,成功將30萬大獎收入囊中。



      而郭達雅最具代表性的戰績,是在騰訊廣告算法大賽中連續奪冠

      作為DYG戰隊核心成員,他在2019年獲得冠軍,并于2020年實現衛冕,利用BERT算法拿下50萬元大獎;2021年又成功奪冠。

      也算是騰訊廣告算法大賽名人堂選手了。

      One More Thing

      有意思的是,學術和競賽全面開花的郭達雅,還有不太“科研”的一面——上綜藝



      在以程序員為主題的綜藝真人秀《燃燒吧!天才程序員》中,郭達雅和另外15名選手一起展開了60小時的代碼極限挑戰。

      節目組把選手分成了S、SS、SSS三個級別,SSS級的“巨佬”只有2名,郭達雅就是其中之一。

      郭達雅一出場便引人矚目,“巨佬來了”“神一樣的存在”。

      不僅強,而且頭發還挺茂密。

      但現在,秦失其鹿,天下共逐之…

      誰又能得到郭達雅呢?


      [1]https://www.reddit.com/r/LocalLLaMA/comments/1rzu7rc/deepseek_core_researcher_daya_guo_rumored_to_have/
      [2]https://guoday.github.io/
      [3]https://mp.weixin.qq.com/s/bYztba9PwPHePhwufd4L7Q
      [4]https://sai.sysu.edu.cn/node/545

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      7分了!皇馬岌岌可危,西甲關鍵戰:巴薩險勝,霍安加西亞神奇1戰

      7分了!皇馬岌岌可危,西甲關鍵戰:巴薩險勝,霍安加西亞神奇1戰

      話體壇
      2026-03-22 23:49:01
      董潔自曝體重從80斤漲到90斤:已經不敢上稱,調養身體反而長胖了;網友:太離譜,健康美才最重要

      董潔自曝體重從80斤漲到90斤:已經不敢上稱,調養身體反而長胖了;網友:太離譜,健康美才最重要

      臺州交通廣播
      2026-03-21 23:07:07
      78歲連路都走不穩還開演唱會,全網罵聲一片,她卻揚言回饋粉絲

      78歲連路都走不穩還開演唱會,全網罵聲一片,她卻揚言回饋粉絲

      洲洲影視娛評
      2026-01-28 12:23:18
      塔猜亞奪冠鎖定巡回賽資格,肖國棟落選,首輪對陣出爐

      塔猜亞奪冠鎖定巡回賽資格,肖國棟落選,首輪對陣出爐

      阿錯田間生活
      2026-03-22 23:11:55
      烏克蘭預警機重返基輔!俄生育新政引發爆炸性爭議

      烏克蘭預警機重返基輔!俄生育新政引發爆炸性爭議

      新沖浪青年
      2026-03-22 20:00:27
      菲總統候選人莫雷諾:如果當選,我會讓菲律賓成為下一個新加坡!

      菲總統候選人莫雷諾:如果當選,我會讓菲律賓成為下一個新加坡!

      小丸說故事
      2026-03-17 14:23:29
      蘋果正式官宣:3月21日,新iPhone再次官降

      蘋果正式官宣:3月21日,新iPhone再次官降

      科技堡壘
      2026-03-21 11:49:24
      37票贊成47票反對!美國投票結果公布,特朗普被聯手逼宮

      37票贊成47票反對!美國投票結果公布,特朗普被聯手逼宮

      頭條爆料007
      2026-03-22 09:07:38
      陳亞男直播哽咽:離婚4年放不下大衣哥名氣,堅持再婚要比朱家強

      陳亞男直播哽咽:離婚4年放不下大衣哥名氣,堅持再婚要比朱家強

      未曾青梅
      2026-03-21 23:48:33
      李祥波主動致歉并無任何地域歧視,魯吐布拉回應言語邊界展格局!

      李祥波主動致歉并無任何地域歧視,魯吐布拉回應言語邊界展格局!

      籃球資訊達人
      2026-03-22 20:00:16
      網友莫斯科遇見58歲伊能靜與47歲秦昊,女方臉型緊致比男方還年輕

      網友莫斯科遇見58歲伊能靜與47歲秦昊,女方臉型緊致比男方還年輕

      明星私服穿搭daily
      2026-03-21 14:25:06
      兩會一聲響,輔警這份工作,2026年可能會迎來新的變化!

      兩會一聲響,輔警這份工作,2026年可能會迎來新的變化!

      南宗歷史
      2026-03-21 14:27:39
      “當心砸了你兒子的飯碗”,無知母親曬公務員兒子做農活,被群嘲

      “當心砸了你兒子的飯碗”,無知母親曬公務員兒子做農活,被群嘲

      妍妍教育日記
      2026-02-24 18:13:37
      穆里尼奧真的是欲哭無淚,本菲卡27輪不敗卻依然落后榜首4分!

      穆里尼奧真的是欲哭無淚,本菲卡27輪不敗卻依然落后榜首4分!

      田先生籃球
      2026-03-22 11:18:58
      傳瘋了!流沙河巨虧2.7億,北炒凈值暴跌40%?真相來了...

      傳瘋了!流沙河巨虧2.7億,北炒凈值暴跌40%?真相來了...

      金石隨筆
      2026-03-23 00:08:57
      伊朗,突然軟了

      伊朗,突然軟了

      新浪財經
      2026-03-23 00:54:10
      一波未平一波又起,兜兜轉轉,張凌赫迎來了真正屬于他的“劫”

      一波未平一波又起,兜兜轉轉,張凌赫迎來了真正屬于他的“劫”

      姑娘視角
      2026-03-22 23:09:41
      紐約時報呼:伊朗戰爭,成了美國送給中國的“戰略大禮包”

      紐約時報呼:伊朗戰爭,成了美國送給中國的“戰略大禮包”

      矚望云霄
      2026-03-22 21:38:38
      梅開二度,維尼修斯當選馬德里德比全場最佳球員

      梅開二度,維尼修斯當選馬德里德比全場最佳球員

      懂球帝
      2026-03-23 06:11:04
      內塔尼亞胡:推翻伊朗政權需“地面”戰爭;特朗普:不會把美軍部署到任何地方

      內塔尼亞胡:推翻伊朗政權需“地面”戰爭;特朗普:不會把美軍部署到任何地方

      上觀新聞
      2026-03-22 12:26:07
      2026-03-23 07:11:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12323文章數 176418關注度
      往期回顧 全部

      科技要聞

      嫌臺積電太慢 馬斯克要把芯片產能飆升50倍

      頭條要聞

      媒體:特朗普48小時通牒砸向伊朗 不排除美國鋌而走險

      頭條要聞

      媒體:特朗普48小時通牒砸向伊朗 不排除美國鋌而走險

      體育要聞

      46歲生日快樂!巴薩全隊穿10號致敬小羅

      娛樂要聞

      47歲“國際章”身材走樣?讓嘲笑她的人閉嘴

      財經要聞

      睡夢中欠債1.2萬?這只“蝦”殺瘋了

      汽車要聞

      14.28萬元起 吉利銀河星耀8遠航家開啟預售

      態度原創

      本地
      旅游
      親子
      房產
      公開課

      本地新聞

      春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

      旅游要聞

      這么近那么美 京津冀“周末串門游”走起

      親子要聞

      孩子無意中說這樣的話,可能隱藏求救信號,寶媽們要警惕!

      房產要聞

      全城狂送1000杯咖啡!網易房產【早C計劃】,即刻啟動!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版