<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek悄悄更新:Mega MoE、FP4 Indexer來了

      0
      分享至



      機器之心編輯部

      昨天下午,沉寂許久的 DeepSeek 又有新動作了!

      不過正如 DeepSeek 自己在 PR 中強調的,和模型沒關系,更新了一下 DeepGEMM 代碼庫。



      不過,此次更新,我們看到了一個新東西:Mega MoE



      鏈接:https://github.com/deepseek-ai/DeepGEMM/pull/304

      Mega MoE 項目貢獻者來自 DeepSeek 基礎設施團隊的 Chenggang Zhao 等人。

      Mega MoE 是什么?

      如何理解 Mega MoE?先來看看 X 網友思維怪怪的解讀:



      來源:https://x.com/0xLogicrw/status/2044720884066451645

      簡單來說,Mega MoE 干的事情是把原本支離破碎的一整套 MoE 計算流程,揉成了一坨,一次性在 GPU 上跑完

      過去的 MoE,有點像一個被拆成很多工位的流水線。token 先被分發(dispatch)到不同專家,然后做一層線性變換,再過激活函數(SwiGLU),再來一層線性,最后再把結果拼回去。聽起來沒問題,但現實是,每一步都要單獨起一個 kernel,中間還夾雜著 GPU 之間的數據通信。

      于是你會看到一種很典型的低效:算一會兒,等一會兒;傳一會兒,再算一會兒。

      Mega MoE 想做的是把這條流水線直接焊死:它把 dispatch、兩層線性、SwiGLU、combine 這些步驟全部 fuse 到一個 mega-kernel 里。更關鍵的是,它不只是「合并步驟」,還在做一件更狠的事情:讓數據通信和計算同時發生

      也就是說,一邊在 Tensor Core 上算,一邊在 NVLink 上傳,不再是你等我、我等你。



      此做法的影響很直接:GPU 不再頻繁停頓,利用率更高,尤其是在多卡、大規模 MoE 場景下,這種優化能被直接感受到。有點像把原來一群人在接力搬磚,變成了一臺連續運轉的傳送帶。

      當然,DeepSeek 這次也沒打算只做一個「更快的 kernel」。你能明顯感覺到,他們是在往一個方向死磕:把 MoE 的效率壓到極限

      比如他們開始嘗試 FP8 × FP4 這樣的組合精度,還搞了一個 FP4 的 indexer,用在 MQA logits 上。這種操作基本是在逼近「還能不能再省一點算力」的邊界。再加上一些 GEMM 的重構、JIT 編譯加速,似乎是想要把 DeepSeek 的 AI 打磨得更加強勁。

      還有一個細節挺有意思:他們明確說,Mega MoE 還在開發中,性能數據「之后再說」。看起來,這種級別的優化,往往不是一版代碼就能定型的,而是要在不同規模、不同拓撲、不同 workload 下反復調。現在放出來,更像是在給社區一個信號:方向已經定了,我們開始往這條路狂奔了。

      在此基礎上,DeepSeek 也對 DeepGEMM 的描述進行了一些調整:

      DeepGEMM 是一個統一的高性能 Tensor Core 內核庫,將現代大語言模型的關鍵計算原語整合在一起,包括 GEMM(FP8、FP4、BF16)、具備通信重疊的融合 MoE(Mega MoE)、用于 lightning indexer 的 MQA 打分、HyperConnection(HC)等,全部匯聚到一個統一且一致的 CUDA 代碼庫中。所有內核通過一個輕量級的即時編譯(JIT)模塊在運行時編譯,安裝過程中無需進行 CUDA 編譯。



      所以如果一定要給這次更新一個定位,大概可以這么說:這是一次基礎設施層的重構嘗試。DeepSeek 正在把 MoE 從一種「理論上很美好,但工程上很折騰」的架構,往「可以被大規模、高效率跑起來」的方向推進。

      而 Mega MoE,很可能只是第一塊拼圖;就是不知道這塊拼圖是不是 DeepSeek-V4 的一部分?

      根據 X 網友 St4r 的解讀,這也可能暗示了 DeepSeek 所使用的訓練卡還是包含了英偉達 AI 加速卡,還是最新、最頂級的 B 系列(而非幾個月以來一直傳言的,使用國產 AI 訓練卡)。



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      把瑜伽褲穿成日常的松弛感美女

      把瑜伽褲穿成日常的松弛感美女

      只要高興就好
      2026-04-13 14:30:30
      燃氣公司上門安檢,根本不是查漏氣!真正目的其實是這3個

      燃氣公司上門安檢,根本不是查漏氣!真正目的其實是這3個

      李博世財經
      2026-04-16 14:04:21
      日本家庭主婦:古瀨玲安!韻味十足,盡顯成熟之美

      日本家庭主婦:古瀨玲安!韻味十足,盡顯成熟之美

      只要高興就好
      2026-04-16 14:22:51
      對傳播效果不滿!魏建軍在發布會現場怒批魏牌高管

      對傳播效果不滿!魏建軍在發布會現場怒批魏牌高管

      新浪財經
      2026-04-19 02:07:52
      男演員千萬別整容!鐘漢良新劇里的男四號,臉頰歪的真讓人出戲

      男演員千萬別整容!鐘漢良新劇里的男四號,臉頰歪的真讓人出戲

      往史過眼云煙
      2026-04-16 14:43:01
      蘇超一家獨大,多少地方文旅成了陪跑?

      蘇超一家獨大,多少地方文旅成了陪跑?

      環球旅訊
      2026-04-17 08:08:52
      7308人!26屆南方電網錄用情況匯總!

      7308人!26屆南方電網錄用情況匯總!

      新浪財經
      2026-04-18 21:14:07
      俄外長到訪不到12小時,特朗普就急了:他怕中俄聯手掀翻棋盤

      俄外長到訪不到12小時,特朗普就急了:他怕中俄聯手掀翻棋盤

      通文知史
      2026-04-18 08:15:03
      未公開的1972年尼克松訪華全套高清照

      未公開的1972年尼克松訪華全套高清照

      深度知局
      2026-04-15 00:16:09
      越南一家企業遭全廠斷電,生產線停擺!只因供電方換了個名,“卡殼”被迫啟動發電機,開啟最低生存模式

      越南一家企業遭全廠斷電,生產線停擺!只因供電方換了個名,“卡殼”被迫啟動發電機,開啟最低生存模式

      越南語學習平臺
      2026-04-18 09:31:13
      中超第6輪觀眾人數:梭魚灣最高;場均超3萬人

      中超第6輪觀眾人數:梭魚灣最高;場均超3萬人

      懂球帝
      2026-04-18 23:07:58
      光通信下一個龍頭,已經浮出水面

      光通信下一個龍頭,已經浮出水面

      普陀動物世界
      2026-04-19 02:34:25
      朱芳雨:很遺憾沒能用勝利答謝球迷,希望季后賽能得到大家支持

      朱芳雨:很遺憾沒能用勝利答謝球迷,希望季后賽能得到大家支持

      懂球帝
      2026-04-18 23:29:08
      麥當娜:睡過100+猛男,2段婚姻全敗,如今又戀上兒子29歲教練

      麥當娜:睡過100+猛男,2段婚姻全敗,如今又戀上兒子29歲教練

      七阿姨愛八卦
      2026-04-15 17:12:30
      果不其然,馬英九受訪細節披露,廖繼斌直指蕭旭岑原因曝光

      果不其然,馬英九受訪細節披露,廖繼斌直指蕭旭岑原因曝光

      呼呼歷史論
      2026-04-18 20:36:14
      好意思拿600萬?7中2僅5分+正負值最低,球迷:趕緊退役去拍VLOG

      好意思拿600萬?7中2僅5分+正負值最低,球迷:趕緊退役去拍VLOG

      弄月公子
      2026-04-18 10:46:15
      同樣衣服為什這位阿姨穿起來,就這么有女人味,有高級感

      同樣衣服為什這位阿姨穿起來,就這么有女人味,有高級感

      牛彈琴123456
      2026-04-17 08:51:44
      專家呼吁:馬上停用5種調味醬,它是腸癌催化劑!再下飯也別沾

      專家呼吁:馬上停用5種調味醬,它是腸癌催化劑!再下飯也別沾

      路醫生健康科普
      2026-04-18 16:18:55
      西班牙學者:中國已從“世界工廠”變為“全球競爭者”

      西班牙學者:中國已從“世界工廠”變為“全球競爭者”

      參考消息
      2026-04-18 18:20:05
      網飛重拍查理和巧克力工廠,為什么非要選"最保險"的畫風?

      網飛重拍查理和巧克力工廠,為什么非要選"最保險"的畫風?

      追星雷達站
      2026-04-17 08:16:46
      2026-04-19 08:56:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12792文章數 142632關注度
      往期回顧 全部

      科技要聞

      傳Meta下月擬裁8000 大舉清退人力為AI騰位

      頭條要聞

      女子與情人在車上發生關系后被殺 還被灌農藥偽造殉情

      頭條要聞

      女子與情人在車上發生關系后被殺 還被灌農藥偽造殉情

      體育要聞

      時隔25年重返英超!沒有人再嘲笑他了

      娛樂要聞

      劉德華回應潘宏彬去世,拒談喪禮細節

      財經要聞

      華誼兄弟,8年虧光85億

      汽車要聞

      奇瑞威麟R08 PRO正式上市 售價14.48萬元起

      態度原創

      時尚
      藝術
      健康
      家居
      軍事航空

      選對發型,真的能少走很多變美彎路

      藝術要聞

      鄭麗文大陸之行引發熱議,孫中山贈對聯成焦點!

      干細胞抗衰4大誤區,90%的人都中招

      家居要聞

      法式線條 時光靜淌

      軍事要聞

      解放軍護衛艦與外艦纏斗20小時 細節披露

      無障礙瀏覽 進入關懷版