<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      大廠搶郭達(dá)雅進(jìn)行時(shí)!DeepSeek核心成員還是個(gè)“綜藝巨佬”

      0
      分享至

      • 克雷西 聽(tīng)雨 發(fā)自 凹非寺
        量子位 | 公眾號(hào) QbitAI

      DeepSeek,又有核心工程師流入江湖——

      郭達(dá)雅,V2、V3、R1等一系列模型的核心作者,被曝離職。

      這位被導(dǎo)師寄予厚望成為“中山大學(xué)雷軍”的技術(shù)天才,在學(xué)術(shù)與競(jìng)賽領(lǐng)域有著近乎傳奇的履歷。

      他自述在入學(xué)博士后的第三天便完成了畢業(yè)所需的論文發(fā)表要求,展現(xiàn)出驚人的科研效率。

      他還多次在騰訊廣告算法大賽中蟬聯(lián)冠軍,并在ATEC科技精英賽和微信大數(shù)據(jù)挑戰(zhàn)賽中斬獲頭籌。被調(diào)侃還沒(méi)畢業(yè)就有著百萬(wàn)獎(jiǎng)金。

      而且新時(shí)代的工程師,甚至還出現(xiàn)過(guò)綜藝?yán)铩?/p>

      在真人秀《燃燒吧!天才程序員》中,他作為僅有的兩名SSS級(jí)“巨佬”選手,在60小時(shí)的極限挑戰(zhàn)中展現(xiàn)了頂尖的編碼實(shí)力……

      消息傳到外網(wǎng),也引發(fā)了很多網(wǎng)友的關(guān)注,有人表示,希望這不會(huì)給DeepSeek-V4帶來(lái)影響。



      畢竟,郭達(dá)雅從博士畢業(yè)后入職DeepSeek開(kāi)始,就參與了Coder、Math等專項(xiàng)模型,以及從V2、V3到R1的完整研發(fā)鏈條,還都是核心作者。

      所以郭達(dá)雅,究竟是哪一種天才少年?

      DeepSeek多款模型核心作者

      郭達(dá)雅于2023年博士畢業(yè)后加入DeepSeek,專注代碼智能和大語(yǔ)言模型推理。

      促使他加入DeepSeek的原因很簡(jiǎn)單:有一位師姐在DeepSeek工作,和他聊起公司追求AGI的愿景,這與他的價(jià)值觀比較吻合。

      • 當(dāng)時(shí),我的一位師姐在 DeepSeek工作,她找到了我,跟我聊了DeepSeek的愿景——追求AGI,推動(dòng)人類社會(huì)的加速發(fā)展。這跟我的價(jià)值觀是相合的。
        同時(shí),DeepSeek有比較多的資源投入研發(fā),領(lǐng)導(dǎo)層也希望打造一個(gè)有創(chuàng)新氛圍和自由的公司。我有這樣的熱情去做這件事,我也想追求這樣的工作環(huán)境。最終,我選擇加入了DeepSeek。

      目前,郭達(dá)雅的個(gè)人主頁(yè)還沒(méi)有更新,仍然顯示為DeepSeek研究員。



      DeepSeek的一系列模型,包括V2、V3和R1,還有Math、Coder、Prover和V2-Prover,郭達(dá)雅全都是核心貢獻(xiàn)者。



      按時(shí)間順序梳理,第一條是2024年1月的代碼大模型DeepSeek-Coder。

      這個(gè)項(xiàng)目推出了從1.3B到33B的一系列開(kāi)源代碼模型,在多項(xiàng)基準(zhǔn)上做到了當(dāng)時(shí)的開(kāi)源代碼模型SOTA。



      第二項(xiàng)成果關(guān)于數(shù)學(xué)推理,也就是2024年2月的DeepSeek-Math。

      它以DeepSeek-Coder-Base-v1.5 7B為基礎(chǔ),針對(duì)數(shù)學(xué)能力進(jìn)行了繼續(xù)訓(xùn)練,額外使用了120B數(shù)學(xué)相關(guān)token。

      更關(guān)鍵的是,DeepSeek-Math的論文中提出了GRPO這個(gè)新型強(qiáng)化學(xué)習(xí)方法,后來(lái)成為了R1推理的關(guān)鍵。



      緊接著是形式化證明,2024年5月,DeepSeek發(fā)布了DeepSeek-Prover。

      這個(gè)項(xiàng)目面向Lean 4定理證明,核心方法是大規(guī)模合成formal proof數(shù)據(jù),并在此基礎(chǔ)上微調(diào)DeepSeek-Math 7B。

      結(jié)果,模型在Lean 4 miniF2F上whole-proof generation準(zhǔn)確率達(dá)到 46.3%(64 samples),累計(jì)到52%,高于GPT-4的23.0%;在FIMO基準(zhǔn)上證明了148題中的5題,而GPT-4得分為0。

      這項(xiàng)成果說(shuō)明,DeepSeek的模型不只能完成一般數(shù)學(xué)推理,還延伸到了更硬核的形式化推理方向。



      還有我們更熟悉的V2、V3和R1,在這個(gè)研發(fā)過(guò)程中,DeepSeek證明了不依賴人工標(biāo)注的推理軌跡,僅通過(guò)純強(qiáng)化學(xué)習(xí),也能把大模型的推理能力激發(fā)出來(lái),并自然涌現(xiàn)出自反思、驗(yàn)證、動(dòng)態(tài)策略調(diào)整等行為模式。

      DeepSeek-R1的相關(guān)論文,后來(lái)還登上了Nature封面,該論文披露,R1的訓(xùn)練成本僅約29.4萬(wàn)美元(折合人民幣約208萬(wàn))。



      總之,任職期間,郭達(dá)雅并不只是參與單點(diǎn)項(xiàng)目,而是參與了貫穿DeepSeek一整段主線的研發(fā)過(guò)程

      而在這一系列的成功背后,有他從中學(xué)時(shí)期便已經(jīng)產(chǎn)生的對(duì)計(jì)算機(jī)、對(duì)編程的深厚興趣。

      “希望他成為中山大學(xué)的雷軍”

      郭達(dá)雅曾就讀于珠海一中,從中學(xué)時(shí)期便展現(xiàn)出對(duì)計(jì)算機(jī)科學(xué)的濃厚興趣。

      在接受珠海一中的訪談時(shí),郭達(dá)雅表示,自己選擇計(jì)算機(jī)專業(yè)是興趣使然,并且這種興趣正是產(chǎn)生于中學(xué)期間。

      • 興趣是我選擇計(jì)算機(jī)專業(yè)并取得如今成就的重要因素,而這一興趣的萌芽正源自珠海一中。
        回想高中時(shí)光,學(xué)校豐富的實(shí)踐活動(dòng)和課程不僅拓寬了我的視野,也讓我在信息課上第一次接觸到計(jì)算機(jī)編程。
        最初的我對(duì)編程一無(wú)所知,但很快便被其嚴(yán)謹(jǐn)?shù)倪壿嬓院蜔o(wú)限的創(chuàng)造力深深吸引。
        通過(guò)編寫(xiě)簡(jiǎn)單的代碼,我不僅感受到算法的精妙,還體會(huì)到數(shù)學(xué)在實(shí)際應(yīng)用中的強(qiáng)大作用。
        這段經(jīng)歷讓我對(duì)計(jì)算機(jī)科學(xué)產(chǎn)生了濃厚興趣,也讓我在高考結(jié)束后毫不猶豫地選擇了計(jì)算機(jī)專業(yè)。

      2014年,郭達(dá)雅被中山大學(xué)計(jì)算機(jī)學(xué)院錄取,隨后留在中大繼續(xù)直博深造。



      大四時(shí),他入選中山大學(xué)與微軟亞洲研究院聯(lián)合培養(yǎng)博士生項(xiàng)目,師從印鑒教授和周明博士,研究方向是自然語(yǔ)言處理。周明則后來(lái)在大模型浪潮中,創(chuàng)辦了瀾舟科技。

      京東探索研究院副院長(zhǎng)、階躍星辰Tech Fellow段楠的博士生導(dǎo)師也是周明,兩人算是師出同門(mén)。

      而郭達(dá)雅在中山大學(xué)對(duì)他進(jìn)行的采訪中表示,自己在剛?cè)雽W(xué)的第三天,就完成了中大博士畢業(yè)的論文發(fā)表要求。

      讀博期間,郭達(dá)雅的實(shí)習(xí)是在聯(lián)培單位MSRA完成的。

      其間,郭達(dá)雅完成了CodeBert以及GraphCodeBert的研究,分別發(fā)表在EMNLP 2020 Findings和ICLR 2021上。

      CodeBert開(kāi)發(fā)了一個(gè)雙模態(tài)預(yù)訓(xùn)練模型,首次實(shí)現(xiàn)了自然語(yǔ)言(NL)和編程語(yǔ)言(PL)的雙模態(tài)預(yù)訓(xùn)練,填補(bǔ)了此前沒(méi)有模型能同時(shí)處理NL和PL混合輸入的空白。



      而GraphCodeBert則在此基礎(chǔ)上,首次將代碼的數(shù)據(jù)流結(jié)構(gòu)納入預(yù)訓(xùn)練,讓模型對(duì)代碼的理解更深入。



      畢業(yè)時(shí),郭達(dá)雅的博士論文《基于預(yù)訓(xùn)練的程序理解與生成》,獲評(píng)2023年中山大學(xué)優(yōu)秀博士學(xué)位論文。

      這篇論文主要以程序理解與生成為研究課題,并針對(duì)該領(lǐng)域現(xiàn)有研究工作在數(shù)據(jù)與模型方面存在的問(wèn)題,提出了基于代碼預(yù)訓(xùn)練的方法和模型,目的是利用人工智能技術(shù)提高軟件開(kāi)發(fā)的效率。

      從會(huì)議到博士論文,再到DeepSeek期間的工作,郭達(dá)雅的工作幾乎是一直圍繞著Coding展開(kāi),這也增加了曝料中他離職后負(fù)責(zé)Coding這一說(shuō)法的可信度。

      DeepSeek-V3發(fā)布后,他的導(dǎo)師印鑒教授,還特別寄語(yǔ),希望他能成為“中山大學(xué)的雷軍”

      截至目前,郭達(dá)雅已在NeurIPS、ACL、EMNLP等國(guó)際頂級(jí)AI會(huì)議發(fā)表論文十余篇,谷歌學(xué)術(shù)引用量超1300次。

      此外,在數(shù)據(jù)挖掘競(jìng)賽方面,郭達(dá)雅也長(zhǎng)期活躍于一線賽場(chǎng):

      2021、2022年,他連續(xù)兩年拿下螞蟻集團(tuán)主辦的ATEC科技精英賽冠軍;

      2022年微信大數(shù)據(jù)挑戰(zhàn)賽,3200支隊(duì)伍同臺(tái)競(jìng)技,他帶隊(duì)奪冠,成功將30萬(wàn)大獎(jiǎng)收入囊中。



      而郭達(dá)雅最具代表性的戰(zhàn)績(jī),是在騰訊廣告算法大賽中連續(xù)奪冠

      作為DYG戰(zhàn)隊(duì)核心成員,他在2019年獲得冠軍,并于2020年實(shí)現(xiàn)衛(wèi)冕,利用BERT算法拿下50萬(wàn)元大獎(jiǎng);2021年又成功奪冠。

      也算是騰訊廣告算法大賽名人堂選手了。

      One More Thing

      有意思的是,學(xué)術(shù)和競(jìng)賽全面開(kāi)花的郭達(dá)雅,還有不太“科研”的一面——上綜藝



      在以程序員為主題的綜藝真人秀《燃燒吧!天才程序員》中,郭達(dá)雅和另外15名選手一起展開(kāi)了60小時(shí)的代碼極限挑戰(zhàn)。

      節(jié)目組把選手分成了S、SS、SSS三個(gè)級(jí)別,SSS級(jí)的“巨佬”只有2名,郭達(dá)雅就是其中之一。

      郭達(dá)雅一出場(chǎng)便引人矚目,“巨佬來(lái)了”“神一樣的存在”。

      不僅強(qiáng),而且頭發(fā)還挺茂密。

      但現(xiàn)在,秦失其鹿,天下共逐之…

      誰(shuí)又能得到郭達(dá)雅呢?


      [1]https://www.reddit.com/r/LocalLLaMA/comments/1rzu7rc/deepseek_core_researcher_daya_guo_rumored_to_have/
      [2]https://guoday.github.io/
      [3]https://mp.weixin.qq.com/s/bYztba9PwPHePhwufd4L7Q
      [4]https://sai.sysu.edu.cn/node/545

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      確認(rèn)離隊(duì)!杜鋒沒(méi)有隨隊(duì)前往上??蛨?chǎng),廣東男籃有望更換主教練?

      確認(rèn)離隊(duì)!杜鋒沒(méi)有隨隊(duì)前往上??蛨?chǎng),廣東男籃有望更換主教練?

      緋雨兒
      2026-03-22 14:50:35
      突發(fā)!證監(jiān)會(huì)兩大利好落地,A股下周一要迎大拉升?

      突發(fā)!證監(jiān)會(huì)兩大利好落地,A股下周一要迎大拉升?

      慧眼看世界哈哈
      2026-03-22 15:11:03
      決戰(zhàn)溫布利!阿森納曼城爭(zhēng)冠:哈蘭德欲破0球魔咒 師徒對(duì)決

      決戰(zhàn)溫布利!阿森納曼城爭(zhēng)冠:哈蘭德欲破0球魔咒 師徒對(duì)決

      葉青足球世界
      2026-03-22 11:48:40
      馬龍也沒(méi)想到,定居上海女兒雙全的許昕,已手握4家公司成大老板

      馬龍也沒(méi)想到,定居上海女兒雙全的許昕,已手握4家公司成大老板

      翰飛觀事
      2026-03-21 10:31:20
      伊朗:不接受臨時(shí)停火,而是要求全面結(jié)束戰(zhàn)爭(zhēng);伊朗武裝部隊(duì)稱正在霍爾木茲海峽采取重大行動(dòng),伊朗將以“自身實(shí)力”應(yīng)對(duì)相關(guān)威脅

      伊朗:不接受臨時(shí)?;?,而是要求全面結(jié)束戰(zhàn)爭(zhēng);伊朗武裝部隊(duì)稱正在霍爾木茲海峽采取重大行動(dòng),伊朗將以“自身實(shí)力”應(yīng)對(duì)相關(guān)威脅

      大風(fēng)新聞
      2026-03-22 14:39:02
      山東再有一地級(jí)市,摘掉沒(méi)有公辦本科大學(xué)的帽子

      山東再有一地級(jí)市,摘掉沒(méi)有公辦本科大學(xué)的帽子

      戶外阿毽
      2026-03-21 03:38:51
      銷售幫男子搖中“貴A·A88888”頂級(jí)“豹子號(hào)”車(chē)牌,兩人激動(dòng)到當(dāng)場(chǎng)大喊,網(wǎng)友直呼:黃金右手

      銷售幫男子搖中“貴A·A88888”頂級(jí)“豹子號(hào)”車(chē)牌,兩人激動(dòng)到當(dāng)場(chǎng)大喊,網(wǎng)友直呼:黃金右手

      極目新聞
      2026-03-21 19:30:27
      以色列經(jīng)歷“艱難一夜” 美伊互放狠話

      以色列經(jīng)歷“艱難一夜” 美伊互放狠話

      新華社
      2026-03-22 15:52:02
      美媒:特朗普?qǐng)F(tuán)隊(duì)已密謀與伊朗“和談” 細(xì)節(jié)曝光

      美媒:特朗普?qǐng)F(tuán)隊(duì)已密謀與伊朗“和談” 細(xì)節(jié)曝光

      新華社
      2026-03-22 17:19:02
      央視點(diǎn)名6款放心醬油!別再瞎買(mǎi)了,看完這篇省下無(wú)數(shù)智商稅

      央視點(diǎn)名6款放心醬油!別再瞎買(mǎi)了,看完這篇省下無(wú)數(shù)智商稅

      普陀動(dòng)物世界
      2026-03-22 06:28:39
      震驚!建議盡快剎住所謂“寵物經(jīng)濟(jì)”這股歪風(fēng)邪氣!評(píng)論區(qū)沸騰了

      震驚!建議盡快剎住所謂“寵物經(jīng)濟(jì)”這股歪風(fēng)邪氣!評(píng)論區(qū)沸騰了

      火山詩(shī)話
      2026-03-22 12:27:20
      3月以后中國(guó)或?qū)⒂瓉?lái)四大漲潮:除油價(jià)以外,這三類可能漲價(jià)了

      3月以后中國(guó)或?qū)⒂瓉?lái)四大漲潮:除油價(jià)以外,這三類可能漲價(jià)了

      巢客HOME
      2026-03-22 07:45:03
      鄭州一公司使用AI后立馬大規(guī)模裁員,只留下前臺(tái)和銷售

      鄭州一公司使用AI后立馬大規(guī)模裁員,只留下前臺(tái)和銷售

      映射生活的身影
      2026-03-21 20:36:56
      20年追捕終落網(wǎng)!“梅姨”藏身村莊兩年無(wú)人察覺(jué),真相曝光

      20年追捕終落網(wǎng)!“梅姨”藏身村莊兩年無(wú)人察覺(jué),真相曝光

      華人生活網(wǎng)
      2026-03-22 02:20:13
      專家解析美軍F-35戰(zhàn)機(jī)被伊軍擊中:飛行高度過(guò)低、隱形性能失效、飛行航線被摸透

      專家解析美軍F-35戰(zhàn)機(jī)被伊軍擊中:飛行高度過(guò)低、隱形性能失效、飛行航線被摸透

      上觀新聞
      2026-03-22 18:36:02
      500萬(wàn)粉絲網(wǎng)紅被封殺,宣揚(yáng)元清非中國(guó)論,多次跨越紅線被懲戒

      500萬(wàn)粉絲網(wǎng)紅被封殺,宣揚(yáng)元清非中國(guó)論,多次跨越紅線被懲戒

      新游戲大妹子
      2026-03-22 12:51:20
      路虎車(chē)主把手伸到舉報(bào)者單位,人民日?qǐng)?bào)發(fā)聲:勢(shì)力再大,也沒(méi)用!

      路虎車(chē)主把手伸到舉報(bào)者單位,人民日?qǐng)?bào)發(fā)聲:勢(shì)力再大,也沒(méi)用!

      奇思妙想草葉君
      2026-03-21 14:39:01
      突發(fā),黑天鵝!2億股民今晚要失眠了!

      突發(fā),黑天鵝!2億股民今晚要失眠了!

      風(fēng)風(fēng)順
      2026-03-22 18:20:36
      鐘振振去世,享年76歲

      鐘振振去世,享年76歲

      極目新聞
      2026-03-22 19:00:23
      特朗普要炸電廠伊朗要炸水廠,波斯灣更危險(xiǎn)了 | 京釀館

      特朗普要炸電廠伊朗要炸水廠,波斯灣更危險(xiǎn)了 | 京釀館

      新京報(bào)評(píng)論
      2026-03-22 17:39:56
      2026-03-22 20:28:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12323文章數(shù) 176418關(guān)注度
      往期回顧 全部

      科技要聞

      嫌臺(tái)積電太慢 馬斯克要把芯片產(chǎn)能飆升50倍

      頭條要聞

      以色列防空神話被擊穿損失慘重核圈失守 伊朗表態(tài)

      頭條要聞

      以色列防空神話被擊穿損失慘重核圈失守 伊朗表態(tài)

      體育要聞

      鄭欽文連續(xù)迎戰(zhàn)大滿貫冠軍 “雙教練”團(tuán)隊(duì)正式亮相

      娛樂(lè)要聞

      今晚首播!央視年代劇《冬去春來(lái)》來(lái)了

      財(cái)經(jīng)要聞

      睡夢(mèng)中欠債1.2萬(wàn)?這只“蝦”殺瘋了

      汽車(chē)要聞

      14.28萬(wàn)元起 吉利銀河星耀8遠(yuǎn)航家開(kāi)啟預(yù)售

      態(tài)度原創(chuàng)

      本地
      時(shí)尚
      數(shù)碼
      教育
      公開(kāi)課

      本地新聞

      春色滿城關(guān)不?。B興春日頂流,這片櫻花海藏不住了

      伊姐周六熱推:電視劇《隱身的名字》;電視劇《正義女神》......

      數(shù)碼要聞

      飛利浦復(fù)古耳機(jī)來(lái)了,配色亮了

      教育要聞

      神奇的父子定律,準(zhǔn)到讓人驚嘆

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版