<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      厲害!天才博士剛畢業,就被前OpenAI CTO搶走!年薪或300萬起步

      0
      分享至

      MIT天才博士一畢業,火速加盟OpenAI前CTO初創!

      最近,肖光烜(Guangxuan Xiao)在社交媒體官宣,剛剛完成了MIT博士學位。

      下一步,他將加入Thinking Machines,專注于大模型預訓練的工作。


      評論區下方,英偉達科學家、xAI研究員、UCSD等一眾大佬,為他本人送上了祝賀。



      清華雙學位學霸,MIT博士開掛人生

      打開他的個人主頁,多元而充實的經歷便映入眼簾。

      肖光烜本科畢業于清華大學,拿到了雙學位,主修的是計算機科學,金融學是第二學位。


      在此期間,他獲得了清華大學綜合優秀獎學金(2019)、全國大學生數學建模競賽(CUMCM)一等獎(2020)、國家獎學金(2020)、清華大學「未來學者」獎學金(2021)等多項獎項。

      他曾于2020–2021年作為訪問生(Visiting Student),前往斯坦福大學計算機系開展科研工作。

      2022年,肖光烜加入MIT攻讀博士學位,導師為韓松(Song Han)教授。

      個人研究方向聚焦于:深度學習的高效算法與系統,尤其是大規模基礎模型(Foundation Model)。


      他于2022年9月至2026年1月,在MIT EECS擔任全職研究助理(Research Assistant)。

      讀博期間,肖光烜曾多次進入全球頂級科技大廠從事前沿研究實習,具備了豐富的一線工業研發的經驗。


      論文地址:https://arxiv.org/pdf/2309.17453

      2024年2-5月期間,他作為英偉達實習生,研究方向是為長上下文大語言模型推理加速。

      他和團隊提出了DuoAttention,結合檢索與流式注意力頭,實現高效推理。


      論文地址:https://research.nvidia.com/labs/eai/publication/duoattention/

      隨后,他又參與了多項核心研究項目,其中包括:

      • XAttention:基于反對角評分的塊稀疏注意力機制

      • StreamingVLM:面向無限視頻流的實時理解模型

      • FlashMoBA:混合塊注意力(Mixture of Block Attention)的高效優化

      值得一提的是,肖光烜在研究之外,還有豐富的興趣愛好,比如足球、乒乓球、圍棋、鋼琴。

      他曾擔任所在院系足球隊的隊長兼先鋒,貝多芬的作品是個人最愛。


      一篇博士論文,破解LLM三大難題

      比起耀眼的履歷,肖光烜的博士論文本身更值得深入研析與拆解。


      不得不承認,如今大模型已經無所不能,但它們依然太貴了。

      顯存爆炸、推理太慢、長上下文直接OOM(內存溢出),這是幾乎所有LLM工程團隊每天都在面對的現實。

      Efficient Algorithms and Systems for Large Language Models這篇論文,給出了一個罕見的、從工程到理論、從算法到架構的完整答案。

      論文中, 他們提出了SmoothQuant,解決了一個長期困擾工業界的問題——激活值異常(activation outliers)。

      SmoothQuant通過一個巧妙的數學等價變換,把量化難點從「激活」轉移到「權重」。

      結果,它實現了首個在十億級模型上W8A8無損量化,無需重新訓練,顯存更小、推理更快。

      針對超長序列的處理,作者在StreamingLLM中發現了「注意力匯點」(attention sink)現象——

      即使沒有任何語義,初始token會被后續token持續關注。這些token的作用不是「理解」,而是數值穩定。

      結果,實現了常數內存的流式推理,模型上下文長度從數千token擴展到百萬級

      更進一步,他們又把這一思想推廣到多模態,StreamingVLM可以在保持時間一致性的同時處理長達數小時的視頻內容。

      對于超長上下文場景,團隊又提出一個互補方案,分別針對不同的性能瓶頸。

      • KVCache太大,采用DuoAttention

      注意力頭本身就有分工:少數負責「全局檢索」,多數只看「最近上下文」。

      DuoAttention用混合策略,大幅降低顯存,卻幾乎不掉性能。

      • 預填充(Prefill)太慢,采用XAttention

      利用反對角線評分機制,僅識別、計算必要的注意力塊,從而實現顯著的加速效果。

      論文的最后,并沒有止步于「優化現有模型」,通過對MoBA(塊混合注意力) 的信噪比分析,作者證明了:

      理論上,block越小越好。

      但現實是,GPU不答應,于是有了FlashMoBA,一種定制化的CUDA內核,使小塊架構在實踐中可行,并實現了最高可達9倍的速度提升。

      這篇論文的價值在于,構建了一整套高效大模型的完整框架,既回應了當下的現實挑戰,也為下一代計算高效、普惠可及的AGI奠定了基礎。

      平均350萬年薪,碾壓OpenAI

      最后來到一個大家比較感興趣的話題——薪資。

      去年,硅谷人才爭奪戰激烈,BI一篇獨家挖到了Thinking Machines(TML)給員工們開出的薪資——

      基礎年薪高達50萬美元(約350萬元)。


      據BI獲取的招聘數據,TML向兩名技術員工支付了45萬美元的基礎年薪,另一名員工的年薪則高達50萬美元。

      第四名員工被列為「聯合創始人/機器學習專家」,其年薪同樣為45萬美元。這些薪酬數據,來自2025年第一季度,早于Murati以100億美元的估值,成功完成20億美元的種子輪融資。

      總體來看,TML為這四名技術員工提供的平均年薪達到462,500美元。

      相較之下,TML明顯高于業內更為成熟LLM公司——

      OpenAI在相關申報文件中列出的29名技術員工,平均年薪為292,115美元。

      其中最高薪資為53萬美元,最低為20萬美元。

      Anthropic向14名技術員工支付的平均年薪為387,500美元,薪資區間在30萬至69萬美元之間。

      雖然比起Meta瘋狂的超1億美元薪酬還差得遠,但這一水平也在硅谷數一數二。

      果然,21世紀最貴的還是人才。

      參考資料:

      https://x.com/Guangxuan_Xiao/status/2008779396497502337

      https://guangxuanx.com/

      https://scholar.google.com/citations?user=sRGO-EcAAAAJ

      https://www.eecs.mit.edu/eecs-events/doctoral-thesis-efficient-algorithms-and-systems-for-large-language-models/

      https://www.businessinsider.com/muratis-new-ai-startup-salary-technical-talent-2025-6

      (來源:新智元版權屬原作者 謹致謝意)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      重慶一老火鍋收取晚餐辛苦費,大人20元小孩老人10元;店家回應:辛苦費是人工工資等,明碼標價

      重慶一老火鍋收取晚餐辛苦費,大人20元小孩老人10元;店家回應:辛苦費是人工工資等,明碼標價

      大風新聞
      2026-01-28 15:12:02
      中超地震!9隊被罰+無降級重罰 申花津門虎新賽季被扣10分罰100萬

      中超地震!9隊被罰+無降級重罰 申花津門虎新賽季被扣10分罰100萬

      我愛英超
      2026-01-29 10:58:06
      出賣信任的刀,最終刺向了誰?匯豐銀行為孟晚舟事件付出驚人代價

      出賣信任的刀,最終刺向了誰?匯豐銀行為孟晚舟事件付出驚人代價

      顧史
      2026-01-28 20:39:56
      中方發布的這個數字,讓美國媒體驚呼!

      中方發布的這個數字,讓美國媒體驚呼!

      環球時報國際
      2026-01-29 00:15:23
      歐冠奇跡!63歲穆帥神作:最后1秒指示門將壓上 暴擊皇馬

      歐冠奇跡!63歲穆帥神作:最后1秒指示門將壓上 暴擊皇馬

      葉青足球世界
      2026-01-29 10:54:40
      還沒撐過80天,高市早苗痛哭流涕,中俄防長聯手釋放重磅信號

      還沒撐過80天,高市早苗痛哭流涕,中俄防長聯手釋放重磅信號

      梁訊
      2026-01-28 19:30:22
      紫牛頭條|英國小伙騎行12000公里到中國:學會用不同的眼光看待世界

      紫牛頭條|英國小伙騎行12000公里到中國:學會用不同的眼光看待世界

      揚子晚報
      2026-01-28 23:06:59
      2026年反腐力度加大,退休多年照樣被查,官至副國級也難逃法網

      2026年反腐力度加大,退休多年照樣被查,官至副國級也難逃法網

      李昕言溫度空間
      2026-01-28 23:18:11
      火箭軍查采購舊賬,九年問題集中爆雷,到底誰在裝備鏈上動手腳?

      火箭軍查采購舊賬,九年問題集中爆雷,到底誰在裝備鏈上動手腳?

      青煙小先生
      2026-01-28 22:22:57
      起風了!加拿大對華改口,禁止與中國簽協定,65萬噸蕓苔子白買?

      起風了!加拿大對華改口,禁止與中國簽協定,65萬噸蕓苔子白買?

      影孖看世界
      2026-01-28 20:30:45
      中到大雪、局地暴雪!影響江蘇!

      中到大雪、局地暴雪!影響江蘇!

      最江陰
      2026-01-29 10:33:59
      東風風行品牌正式登陸埃及市場 構建北非汽車產業新格局

      東風風行品牌正式登陸埃及市場 構建北非汽車產業新格局

      商業分析
      2026-01-26 21:09:26
      重掌生活品質主權!小熊小食光電蒸鍋破解效率時代的營養悖論

      重掌生活品質主權!小熊小食光電蒸鍋破解效率時代的營養悖論

      中國家電網
      2026-01-28 17:38:49
      中超9隊被罰分!海港國安遭扣5分,泰山河南罰6分,蓉城等7隊幸免

      中超9隊被罰分!海港國安遭扣5分,泰山河南罰6分,蓉城等7隊幸免

      我愛英超
      2026-01-29 11:29:47
      五胡亂華時期,是誰救了即將滅族的漢民族?請記住我們的英雄!

      五胡亂華時期,是誰救了即將滅族的漢民族?請記住我們的英雄!

      小豫講故事
      2026-01-29 06:00:08
      劉強東派無人車給老家送年貨,喊話鄉親:大家把家里收拾收拾,騰出地方來,備好人手,三輪車、小推車,能用的都用上!

      劉強東派無人車給老家送年貨,喊話鄉親:大家把家里收拾收拾,騰出地方來,備好人手,三輪車、小推車,能用的都用上!

      每日經濟新聞
      2026-01-27 23:51:07
      斯塔默剛到北京 就召集“豪華商界天團”開會

      斯塔默剛到北京 就召集“豪華商界天團”開會

      看看新聞Knews
      2026-01-29 00:37:06
      神奇歐冠夜:本菲卡4-2皇馬壓哨晉級 利物浦6-0 曼城2-0壓線直通

      神奇歐冠夜:本菲卡4-2皇馬壓哨晉級 利物浦6-0 曼城2-0壓線直通

      狍子歪解體壇
      2026-01-29 06:25:24
      歐冠有趣局勢:勝者晉級16強 結果1-1無緣直通 曼城撿便宜

      歐冠有趣局勢:勝者晉級16強 結果1-1無緣直通 曼城撿便宜

      葉青足球世界
      2026-01-29 09:09:31
      原來李莉就是“春晚釘子戶”孫濤的老婆,難怪孫濤每年都能上春晚

      原來李莉就是“春晚釘子戶”孫濤的老婆,難怪孫濤每年都能上春晚

      李健政觀察
      2026-01-29 09:23:45
      2026-01-29 12:16:49
      化學人生 incentive-icons
      化學人生
      ~人生如化學 化學悟人生~
      6951文章數 20610關注度
      往期回顧 全部

      科技要聞

      周亞輝的AI新賭局:國內太卷 出海另起爐灶

      頭條要聞

      女子辭了北京房地產工作 去2800公里外浙江無人島上班

      頭條要聞

      女子辭了北京房地產工作 去2800公里外浙江無人島上班

      體育要聞

      詹姆斯哭了!騎士視頻致敬41歲超巨

      娛樂要聞

      張譯不再隱瞞!公開回應退圈息影真相

      財經要聞

      黃金價格太高了嗎

      汽車要聞

      車長超5米還帶后輪轉向 比亞迪海豹08/海獅08將亮相

      態度原創

      房產
      教育
      手機
      數碼
      公開課

      房產要聞

      50米一線海景,實景示范區火熱開放!三亞TOP級旅居王牌來了

      教育要聞

      學生間總是打鬧,該怎么辦?

      手機要聞

      REDMI Turbo 5系列今晚發布即開售!支持國補

      數碼要聞

      Osmo 360單品獨占53.6%份額,大疆2026筑牢運動影像全球領軍優勢

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版