<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      厲害!天才博士剛畢業(yè),就被前OpenAI CTO搶走!年薪或300萬起步

      0
      分享至


      MIT天才博士一畢業(yè),火速加盟OpenAI前CTO初創(chuàng)!

      最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學(xué)位。

      下一步,他將加入Thinking Machines,專注于大模型預(yù)訓(xùn)練的工作。


      評論區(qū)下方,英偉達科學(xué)家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。



      清華雙學(xué)位學(xué)霸,MIT博士開掛人生

      打開他的個人主頁,多元而充實的經(jīng)歷便映入眼簾。

      肖光烜本科畢業(yè)于清華大學(xué),拿到了雙學(xué)位,主修的是計算機科學(xué),金融學(xué)是第二學(xué)位。


      在此期間,他獲得了清華大學(xué)綜合優(yōu)秀獎學(xué)金(2019)、全國大學(xué)生數(shù)學(xué)建模競賽(CUMCM)一等獎(2020)、國家獎學(xué)金(2020)、清華大學(xué)「未來學(xué)者」獎學(xué)金(2021)等多項獎項。

      他曾于2020–2021年作為訪問生(Visiting Student),前往斯坦福大學(xué)計算機系開展科研工作。

      2022年,肖光烜加入MIT攻讀博士學(xué)位,導(dǎo)師為韓松(Song Han)教授。

      個人研究方向聚焦于:深度學(xué)習(xí)的高效算法與系統(tǒng),尤其是大規(guī)模基礎(chǔ)模型(Foundation Model)。


      他于2022年9月至2026年1月,在MIT EECS擔(dān)任全職研究助理(Research Assistant)。

      讀博期間,肖光烜曾多次進入全球頂級科技大廠從事前沿研究實習(xí),具備了豐富的一線工業(yè)研發(fā)的經(jīng)驗。


      論文地址:https://arxiv.org/pdf/2309.17453

      2024年2-5月期間,他作為英偉達實習(xí)生,研究方向是為長上下文大語言模型推理加速。

      他和團隊提出了DuoAttention,結(jié)合檢索與流式注意力頭,實現(xiàn)高效推理。


      論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

      隨后,他又參與了多項核心研究項目,其中包括:

      • XAttention:基于反對角評分的塊稀疏注意力機制

      • StreamingVLM:面向無限視頻流的實時理解模型

      • FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優(yōu)化

      值得一提的是,肖光烜在研究之外,還有豐富的興趣愛好,比如足球、乒乓球、圍棋、鋼琴。

      他曾擔(dān)任所在院系足球隊的隊長兼先鋒,貝多芬的作品是個人最愛。


      一篇博士論文,破解LLM三大難題

      比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。


      不得不承認,如今大模型已經(jīng)無所不能,但它們依然太貴了。

      顯存爆炸、推理太慢、長上下文直接OOM(內(nèi)存溢出),這是幾乎所有LLM工程團隊每天都在面對的現(xiàn)實。

      Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個罕見的、從工程到理論、從算法到架構(gòu)的完整答案。

      論文中, 他們提出了SmoothQuant,解決了一個長期困擾工業(yè)界的問題——激活值異常(activation outliers)。

      SmoothQuant通過一個巧妙的數(shù)學(xué)等價變換,把量化難點從「激活」轉(zhuǎn)移到「權(quán)重」。

      結(jié)果,它實現(xiàn)了首個在十億級模型上W8A8無損量化,無需重新訓(xùn)練,顯存更小、推理更快。

      針對超長序列的處理,作者在StreamingLLM中發(fā)現(xiàn)了「注意力匯點」(attention sink)現(xiàn)象——

      即使沒有任何語義,初始token會被后續(xù)token持續(xù)關(guān)注。這些token的作用不是「理解」,而是數(shù)值穩(wěn)定。

      結(jié)果,實現(xiàn)了常數(shù)內(nèi)存的流式推理,模型上下文長度從數(shù)千token擴展到百萬級

      更進一步,他們又把這一思想推廣到多模態(tài),StreamingVLM可以在保持時間一致性的同時處理長達數(shù)小時的視頻內(nèi)容。

      對于超長上下文場景,團隊又提出一個互補方案,分別針對不同的性能瓶頸。

      • KVCache太大,采用DuoAttention

      注意力頭本身就有分工:少數(shù)負責(zé)「全局檢索」,多數(shù)只看「最近上下文」。

      DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

      • 預(yù)填充(Prefill)太慢,采用XAttention

      利用反對角線評分機制,僅識別、計算必要的注意力塊,從而實現(xiàn)顯著的加速效果。

      論文的最后,并沒有止步于「優(yōu)化現(xiàn)有模型」,通過對MoBA(塊混合注意力) 的信噪比分析,作者證明了:

      理論上,block越小越好。

      但現(xiàn)實是,GPU不答應(yīng),于是有了FlashMoBA,一種定制化的CUDA內(nèi)核,使小塊架構(gòu)在實踐中可行,并實現(xiàn)了最高可達9倍的速度提升。

      這篇論文的價值在于,構(gòu)建了一整套高效大模型的完整框架,既回應(yīng)了當(dāng)下的現(xiàn)實挑戰(zhàn),也為下一代計算高效、普惠可及的AGI奠定了基礎(chǔ)。

      平均350萬年薪,碾壓OpenAI

      最后來到一個大家比較感興趣的話題——薪資。

      去年,硅谷人才爭奪戰(zhàn)激烈,BI一篇獨家挖到了Thinking Machines(TML)給員工們開出的薪資——

      基礎(chǔ)年薪高達50萬美元(約350萬元)。


      據(jù)BI獲取的招聘數(shù)據(jù),TML向兩名技術(shù)員工支付了45萬美元的基礎(chǔ)年薪,另一名員工的年薪則高達50萬美元。

      第四名員工被列為「聯(lián)合創(chuàng)始人/機器學(xué)習(xí)專家」,其年薪同樣為45萬美元。

      這些薪酬數(shù)據(jù),來自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

      總體來看,TML為這四名技術(shù)員工提供的平均年薪達到462,500美元。

      相較之下,TML明顯高于業(yè)內(nèi)更為成熟LLM公司——

      OpenAI在相關(guān)申報文件中列出的29名技術(shù)員工,平均年薪為292,115美元。

      其中最高薪資為53萬美元,最低為20萬美元。

      Anthropic向14名技術(shù)員工支付的平均年薪為387,500美元,薪資區(qū)間在30萬至69萬美元之間。

      雖然比起Meta瘋狂的超1億美元薪酬還差得遠,但這一水平也在硅谷數(shù)一數(shù)二。

      果然,21世紀(jì)最貴的還是人才。

      來源:新智元 編輯:桃子

      參考資料:

      https://x.com/Guangxuan_Xiao/status/2008779396497502337

      https://guangxuanx.com/

      https://scholar.google.com/citations?user=sRGO-EcAAAAJ

      https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

      https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

      數(shù)學(xué)好物

      最后再來關(guān)注一下

      超模君精心研發(fā)的數(shù)學(xué)文化T恤!

      原創(chuàng)版權(quán)設(shè)計

      穿在身上的

      不僅僅是信仰!


      原價 269 元

      超模君特惠價 139元!

      加5元換購限量版公式之美鑰匙扣

      大家好,這是【超模君】項目的主理人中大數(shù)學(xué)博士【大Lee】的個人Vlog視頻號,歡迎大家關(guān)注我的視頻號。

      喜歡《數(shù)學(xué)有什么用系列》記得關(guān)注超模君Vlog,點贊和點小愛心哦,

      一路堅持,靠的是大家!

      在這里我會爭取日更(大家可以監(jiān)督),一天一個主題。

      在視頻號,分享知識,見解,生活碎片,以及家庭生活的日常花絮。

      最近在做【優(yōu)質(zhì)國貨賦能】【安全產(chǎn)品溯源】。也歡迎大家一起做云股東和云監(jiān)工。

      也希望大家可以一起留言互相討論分享進步。

      點擊長按關(guān)注

      簡介:超模君,數(shù)學(xué)與交叉科學(xué)教育自媒體博主,中大數(shù)學(xué)博士,有倆崽崽和一潔癖的太太。愛分享有用的數(shù)學(xué)建模知識,愛深挖有趣的交叉科學(xué)人物故事,愛為靠譜的現(xiàn)代教育、提升幸福感的產(chǎn)品打call。著有 《芥子須彌·大科學(xué)家的小故事》、《數(shù)學(xué)之旅:閃耀人類的54個數(shù)學(xué)家》、《漫畫數(shù)學(xué):閃耀人類的54個數(shù)學(xué)家》、《一份鐘數(shù)學(xué)》 (已售罄)、《薛定諤的貓:漫畫大科學(xué)家的小萌寵》(已售罄)、超模君幽靈魔方、超模君丙烯馬克筆等廣受大人與孩子們喜愛的作品。

      在這里,超模君不定期會有腦洞大開,和你分享一些新研發(fā)出來的,小而美的,有故事的,有知識的理工創(chuàng)意產(chǎn)品,期待與您分享。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      張柏芝全家總動員飛澳洲 送大兒子上大學(xué)這份愛謝霆鋒永遠比不過

      張柏芝全家總動員飛澳洲 送大兒子上大學(xué)這份愛謝霆鋒永遠比不過

      阿雹娛樂
      2026-01-24 16:37:17
      陳孝良蔣林伶官宣結(jié)婚,兩人參與戀愛綜藝相識并牽手

      陳孝良蔣林伶官宣結(jié)婚,兩人參與戀愛綜藝相識并牽手

      韓小娛
      2026-01-24 10:22:40
      2026,沉默,沉默,沉默

      2026,沉默,沉默,沉默

      洞讀君
      2026-01-21 16:07:26
      莫迪下令拒收俄羅斯石油,中國伸出的援手,讓普京明白了一個道理

      莫迪下令拒收俄羅斯石油,中國伸出的援手,讓普京明白了一個道理

      素年文史
      2026-01-24 09:06:42
      蕭美娘乳白寫真合集(2)

      蕭美娘乳白寫真合集(2)

      情感大頭說說
      2026-01-24 15:26:40
      36萬億美債壓頂,中國拒不接盤!特朗普決定“弄死”大債主!

      36萬億美債壓頂,中國拒不接盤!特朗普決定“弄死”大債主!

      毒sir財經(jīng)
      2025-10-12 20:07:17
      1億美元珠寶被搶!嫌犯卻被遣返送回國?FBI傻了:我追了三年,你放了?!

      1億美元珠寶被搶!嫌犯卻被遣返送回國?FBI傻了:我追了三年,你放了?!

      英國那些事兒
      2026-01-23 22:17:47
      葉劍英詢問許世友:南京軍區(qū)還聽你調(diào)遣嗎?許世友直言:軍區(qū)司令就是我的貼身保鏢

      葉劍英詢問許世友:南京軍區(qū)還聽你調(diào)遣嗎?許世友直言:軍區(qū)司令就是我的貼身保鏢

      清風(fēng)鑒史
      2025-12-24 15:02:13
      心酸!女子跟丈夫吵架被趕出門,在門外坐了5小時,前一晚被趕過

      心酸!女子跟丈夫吵架被趕出門,在門外坐了5小時,前一晚被趕過

      夜深愛雜談
      2026-01-23 20:22:53
      拿下女人最快的方法:不是頻繁聯(lián)系,而是這一招

      拿下女人最快的方法:不是頻繁聯(lián)系,而是這一招

      青蘋果sht
      2026-01-04 05:23:15
      太突然!北京知名大駕校人去樓空!

      太突然!北京知名大駕校人去樓空!

      美麗大北京
      2026-01-22 20:55:22
      幾乎全是假貨!利潤高達2400%,咋消費者還前赴后繼爭相購買?

      幾乎全是假貨!利潤高達2400%,咋消費者還前赴后繼爭相購買?

      夢史
      2026-01-07 10:08:05
      西方領(lǐng)導(dǎo)人排隊訪華,歐洲議會發(fā)布涉華法案

      西方領(lǐng)導(dǎo)人排隊訪華,歐洲議會發(fā)布涉華法案

      戎評
      2026-01-24 17:03:21
      貝克漢姆親家的繼承之戰(zhàn)!10個子女17億家產(chǎn),妮可拉分不到多少錢

      貝克漢姆親家的繼承之戰(zhàn)!10個子女17億家產(chǎn),妮可拉分不到多少錢

      有范又有料
      2026-01-21 17:53:26
      于文文這身材太絕了!露背吊帶裙殺瘋了,飽滿曲線誰頂?shù)米。?>
    </a>
        <h3>
      <a href=娛樂領(lǐng)航家
      2026-01-11 00:00:03
      1997年回歸前夜,香港十幾萬黑幫連夜“大逃亡”,他們最后都去哪了?

      1997年回歸前夜,香港十幾萬黑幫連夜“大逃亡”,他們最后都去哪了?

      老杉說歷史
      2026-01-13 19:14:13
      王美人會斗諾娃郭涵煜殺進16強,辛納熱暈了?凱斯會師佩古拉

      王美人會斗諾娃郭涵煜殺進16強,辛納熱暈了?凱斯會師佩古拉

      網(wǎng)球之家
      2026-01-24 13:04:58
      格陵蘭島危機加劇之際,數(shù)千美軍將赴挪威參加北約軍演

      格陵蘭島危機加劇之際,數(shù)千美軍將赴挪威參加北約軍演

      參考消息
      2026-01-23 16:11:05
      貝克漢姆長子撕父母后首現(xiàn)身,摟住31歲妻子很依賴,“只剩她了”

      貝克漢姆長子撕父母后首現(xiàn)身,摟住31歲妻子很依賴,“只剩她了”

      譯言
      2026-01-23 06:38:54
      蘋果官宣新款 iPhone 降價 2500 元,太瘋狂了!

      蘋果官宣新款 iPhone 降價 2500 元,太瘋狂了!

      花果科技
      2026-01-24 10:40:32
      2026-01-24 17:52:49
      超級數(shù)學(xué)建模
      超級數(shù)學(xué)建模
      專業(yè)數(shù)學(xué)建模、數(shù)據(jù)挖掘自媒體
      7585文章數(shù) 99416關(guān)注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      男子就醫(yī)從尿道取出圓筒狀、筆芯狀異物 存留長達20年

      頭條要聞

      男子就醫(yī)從尿道取出圓筒狀、筆芯狀異物 存留長達20年

      體育要聞

      當(dāng)家球星打替補,他們在故意擺爛?

      娛樂要聞

      李微漪更新:狼王格林去世,3字淚目

      財經(jīng)要聞

      “百年老字號”張小泉遭60億債務(wù)壓頂

      汽車要聞

      有增程和純電版可選 日產(chǎn)NX8或于3-4月間上市

      態(tài)度原創(chuàng)

      時尚
      藝術(shù)
      親子
      公開課
      軍事航空

      不一定能掀桌男主,但一定是個好演員!

      藝術(shù)要聞

      色彩之巔!法國蓬皮杜中心館藏藝術(shù)大師特展”在北京民生現(xiàn)代美術(shù)館開幕

      親子要聞

      爺爺過生日,3歲女兒給爺爺買的蛋糕,可把60多歲爺爺高興壞了

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄美烏首次三方會談在阿聯(lián)酋舉行

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 最新国产精品好看的精品| 日本熟妇hdsex视频| 亚洲综合无码明星蕉在线视频| 让少妇高潮无乱码高清在线观看| 一区二区三区av天堂| 亚洲精品一区国产精品| 亚洲最大成人| 91肉丝酒店高跟91肉丝酒店高跟| 若羌县| 熟女在线视频一区二区三区| 97人人超碰国产精品最新| 强开少妇嫩苞又嫩又紧九色| 四虎无码高清视频:| 上司人妻互换中文字幕| 92国产精品午夜福利免费| 亚洲AV中文无码乱人伦在线视色| 自拍视频在线观看成人| 欲色欲色天天天www| 天天做天天爱天天爽综合网| 自拍亚洲一区欧美另类| 色噜噜av亚洲色一区二区| 亚洲乱码中文字幕小综合 | 熟女视频一区二区在线观看| 国产激情久久久久久熟女老人av| 午夜一区欧美二区高清三区| 国产精品成| 第一福利在线导航| 爆乳熟妇一区二区三区| 亚洲精品国产精品乱码不卞2021 | 亚洲中文字幕A| 国产成人精品av| 国产偷国产偷亚洲高清app| 日本高清视频网站www| 色综合久| 亚洲AV永久无码精品牛牛影视 | 亚洲va精品va国产va| 中文无码第一页| 成人性能视频在线| 91视频入口| 国产乱子伦真实精品| 亚洲无码一区二区三区蜜桃|