<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek的深度推理創新,用DualPath為智能體壓榨帶寬 | 筆記

      0
      分享至

      在智能體拼多輪交互、推理速度和極長上下文的時代,受限于芯片的DeepSeek,轉向從架構層面對推理系統進行深度創新。

      DeepSeek的最新論文,又為智能體添了一把火。它聯合北大、清華,提出了一個名為“DualPath”的推理系統。

      這引發了AI與半導體行業專業人士的關注。因為它嘗試解決行業如今普遍面臨的痛點:在Agentic AI場景下,系統瓶頸撞上了另一堵內存帶寬墻,GPU大部分時間并不是在算,而是在等。


      不同的推理場景,對應不同的工作負載,也對應不同的軟硬件協同需求。隨著智能體進入多輪交互范式,上下文長度隨著輪次迅速膨脹,但新增需要計算的token卻極少。論文給出的真實世界智能體交互軌跡數據顯示,KV Cache(鍵值緩存,一種存儲歷史注意力機制計算結果的技術)命中率通常超過95%。換句話說,每一輪推理,模型幾乎都在重復加載已經計算過的上下文。

      據DeepSeek給出的基于真實的編程任務的智能體交互軌跡,它單次任務平均交互157輪,平均上下文長度約為32.7k tokens,其中,平均追加長度(Append length)僅429tokens。即,KV Cache命中率=1-(429/32700)=98.7%。

      這意味著,在目前主流的預填充與解碼相互解耦(PD-disaggregated)的架構中,負責預填充(Prefill,傳統上的計算密集)的GPU,雖然增量token計算不高,但仍需重建完整注意力輸入狀態,忙著從外部存儲反復加載海量KV Cache,存儲NIC帶寬被長期擠爆;而負責解碼的(Decode,傳統上的內存密集)那一側,資源尚未被榨干。

      而且,當下算力增長速度快于網絡與存儲帶寬的不對稱演進,使得這種負載失衡被進一步放大;類似的不匹配,曾在標準自注意力的二階復雜度下放大了單卡的內存墻。


      為了刻畫Agentic AI的這一負載特性,DeepSeek還提出了緩存計算比(Cache-Compute Ratio)的指標。這個比值越高,系統越偏向帶寬受限而非算力受限。

      其中,對于DeepSeek-V3.2這樣的模型,在這個真實世界任務場景下,緩存算力比約為22GB/PFLOP。即,每進行1 PFLOP 的計算,需要搬運22GB的KV Cache數據。事實上,論文對比的其他大模型中,OpenAI旗下開源模型GPT-OSS-120B的“帶寬不足”壓力更大,這一指標在47-95左右。

      DualPath的核心思路,是把原本集中在單點的存儲讀取壓力,變成整個集群可調度的資源。DualPath允許KV Cache既可以直接讀入Prefill引擎,也可以先加載到Decode引擎,再通過高帶寬RDMA計算網絡轉發至Prefill引擎;Prefill 引擎拿到完整的KV Cache后,立刻開始計算。

      但是,重塑數據移動,又會帶來新的工程問題。包括細粒度數據傳輸,以與計算無縫重疊,最大程度提升吞吐量;額外的KV-Cache流與集合通信流的隔離,以減少相互影響;以及自適應的動態負載均衡,以迅速決定使用哪條路徑。為此,DeepSeek通過推理引擎 (Inference Engines)、流量管理器 (Traffic Manager)、請求調度器 (Request Scheduler)三大組件,共同配合完成DualPath推理系統的“減負”任務。

      這不是一次實驗,而是生產驗證,技術可以很快復制到其他模型或版本上。論文介紹,DualPath基于DeepSeek內部推理框架構建,底層CUDA技術棧與主流開源體系對齊,核心改動約5000行代碼,沒有新增任何新的硬件。而且,論文也嘗試驗證了這一推理系統可以線性擴展。DeepSeek并沒有公開這些代碼。

      DeepSeek在一個InfiniBand互連的Hopper架構GPU集群上驗證。最終,DualPath將離線推理的端到端吞吐量,最高提升1.87倍,并于在線服務場景中,實現平均1.96倍的吞吐提升。這顯示DualPath對帶寬瓶頸的緩解,在延遲敏感場景下尤為顯著。

      大模型的智能體時代,當模型規模(上下文長度)的增長速度超過了硬件(顯存容量、網絡帶寬)的進化速度,單純堆砌算力已不再高效。系統的性能瓶頸正從計算轉向數據(I/O)。

      未來的競爭核心,在于如何設計更聰明的系統架構——像Engram那樣優化內存使用,像DualPath那樣重塑數據流動路徑——來巧妙地繞開硬件限制,榨干現有資源的每一分潛力。這標志著LLM的發展重點,正從追求單一的模型規模,轉向對推理系統整體架構的深度創新。

      DeepSeek開始針對Agentic AI優化基礎設施了,DeepSeek-V4還會遠嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      全球迄今規模最大鈉電池訂單!寧德時代與海博思創達成3年60GWh合作

      全球迄今規模最大鈉電池訂單!寧德時代與海博思創達成3年60GWh合作

      澎湃新聞
      2026-04-27 20:14:05
      震驚!洛陽某職業學院高調官宣10名畢業生入職肯德基,引發爭議

      震驚!洛陽某職業學院高調官宣10名畢業生入職肯德基,引發爭議

      火山詩話
      2026-04-24 16:29:11
      突傳噩耗,這位影響中美的大佬逝世,川普派人來華,中方送上大禮

      突傳噩耗,這位影響中美的大佬逝世,川普派人來華,中方送上大禮

      帶你領略快樂真諦
      2026-04-27 21:55:30
      郵報記者:B費讓我觀賽體驗最佳,所以把年度最佳的票投給他

      郵報記者:B費讓我觀賽體驗最佳,所以把年度最佳的票投給他

      懂球帝
      2026-04-27 23:04:16
      小王夫人崔根娣去世了

      小王夫人崔根娣去世了

      紅色少女主播
      2026-04-27 23:38:39
      美軍工心臟——洛克希德馬丁生產的頂尖裝備,超乎你的想象

      美軍工心臟——洛克希德馬丁生產的頂尖裝備,超乎你的想象

      混沌錄
      2026-04-23 21:14:12
      浩浩媽新作官方邀請"刷好評"!先到必得大雷角色親簽

      浩浩媽新作官方邀請"刷好評"!先到必得大雷角色親簽

      游民星空
      2026-04-27 18:05:31
      A股:收盤后,傳來一個信息,明天,周二或要這樣走了!

      A股:收盤后,傳來一個信息,明天,周二或要這樣走了!

      明心
      2026-04-27 16:34:59
      追覓CEO俞浩連發三條微博炮轟小紅書:價值觀和盈利模式“都有毒”

      追覓CEO俞浩連發三條微博炮轟小紅書:價值觀和盈利模式“都有毒”

      紅星資本局
      2026-04-27 18:01:05
      5月1日全面嚴查落地!兩類人群抓緊自查整改,拖著不做后果很麻煩

      5月1日全面嚴查落地!兩類人群抓緊自查整改,拖著不做后果很麻煩

      復轉這些年
      2026-04-26 18:31:40
      拒絕與以色列直接談判 黎真主黨領導人提出五點要求

      拒絕與以色列直接談判 黎真主黨領導人提出五點要求

      大風新聞
      2026-04-27 17:44:25
      1991年中央派人請張學良回大陸,張:回大陸可以,但我有三個要求

      1991年中央派人請張學良回大陸,張:回大陸可以,但我有三個要求

      史之銘
      2026-04-14 18:16:07
      這一天,中國外貿人等來的不是訂單,而是全面反擊歐洲的信號

      這一天,中國外貿人等來的不是訂單,而是全面反擊歐洲的信號

      世界觀察局
      2026-04-27 22:43:22
      ESPN:巴薩詢問馬競關于出售小蜘蛛的態度,拉波爾塔親自推進

      ESPN:巴薩詢問馬競關于出售小蜘蛛的態度,拉波爾塔親自推進

      懂球帝
      2026-04-27 21:29:05
      斬首成功!烏克蘭 FP-2無人機出手,12 名俄高官命當場身亡!

      斬首成功!烏克蘭 FP-2無人機出手,12 名俄高官命當場身亡!

      小嵩
      2026-04-25 02:12:28
      172平方米違建拆了,居民直呼“終于能敞亮出門了”

      172平方米違建拆了,居民直呼“終于能敞亮出門了”

      北青網-北京青年報
      2026-04-27 14:14:04
      謝逸楓:顫抖吧!一季度賣地收入大跌,不足6000億元

      謝逸楓:顫抖吧!一季度賣地收入大跌,不足6000億元

      謝逸楓看樓市
      2026-04-27 09:54:05
      又沒有進攻又沒有防守,騎士內線新星的表現太對不起他的工資了?

      又沒有進攻又沒有防守,騎士內線新星的表現太對不起他的工資了?

      稻谷與小麥
      2026-04-27 23:26:11
      難怪張柏芝準備壽衣遺照!謝霆鋒不再隱瞞,坦白不娶王菲另有其因

      難怪張柏芝準備壽衣遺照!謝霆鋒不再隱瞞,坦白不娶王菲另有其因

      秋姐居
      2026-04-13 09:58:48
      “有性生活”和“沒性生活”,有這4個不同之處,看完漲知識了

      “有性生活”和“沒性生活”,有這4個不同之處,看完漲知識了

      星星會墜落
      2026-04-25 07:36:57
      2026-04-28 00:11:00
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      365文章數 63關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實測出來了

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      體育要聞

      人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

      娛樂要聞

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

      財經要聞

      Meta 140億收購Manus遭中國發改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態度原創

      手機
      健康
      數碼
      家居
      教育

      手機要聞

      輕薄本迎來驍龍時刻!華碩推出三款萬元AI PC,太精準了

      干細胞如何讓燒燙傷皮膚"再生"?

      數碼要聞

      LABUBU冰箱還未正式發售就已溢價3000元

      家居要聞

      江景風格 流動的秩序

      教育要聞

      學生課堂偷吃、聽課“擺爛”……這位老師的應對方式絕了!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲综合区小说区激情区| 粗大的内捧猛烈进出视频 | 无吗人妻一区二区| 日韩精品无码人妻一区二区三区| 国产九九免费| 人人凹凸XX凹凸爽凹凸| 国产福利精品一区二区| 92久久精品一区二区| 国产精品乱码一区二区三区| 人人人澡人人肉久久精品| 夜夜夜夜撸| 18禁美女裸身无遮挡免费网站| 国产成人无码a区在线视频无码dvd| 亚洲自偷精品视频自拍| 免费人成年激情视频在线观看| 精品人妻无码一区二区三区四川人| 97激情| 清远市| 在线观看人成视频免费| 亚洲国产专区| 国产欧美在线观看不卡| 國產尤物AV尤物在線觀看| 新91视频在线观看www| 大陆一级毛片免费播放| 131美女爱做视频| 色色99| 日本成人有码在线视频| 六十路老熟妇乱子伦视频| 国产精品亚洲精品日韩已方| 拍摄av现场失控高潮数次| 国产精品美女一区二区视频| jiZZjiZZ欧美69| 新宾| 国产人成在线成免费视频| 亚洲综合电影| 九九九九精品视频在线观看| 无码内射中文字幕岛国片| 熟妇自搞| 国产精品久久久久久久影视一免费| 免费无码一区无码东京热| 92久久精品一区二区|