<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      騰訊AngelSlim升級,LLM、VLM及語音多模態一體投機采樣訓練框架

      0
      分享至



      隨著大模型步入規模化應用深水區,日益高昂的推理成本與延遲已成為掣肘產業落地的核心瓶頸。在 “降本增效” 的行業共識下,從量化、剪枝到模型蒸餾,各類壓縮技術競相涌現,但往往難以兼顧性能損耗與通用性。

      在此背景下,投機采樣作為一種 “另辟蹊徑” 的推理加速范式,正憑借其近乎無損的加速效果成為業界新寵。騰訊混元近日升級的AngelSlim 訓練框架,首次將這一技術的潛力拓展至 LLM、VLM 及語音的全模態場景,實現了從 “可加速” 到 “善加速” 的關鍵躍遷。其核心在于獨創的Eagle3 訓練架構,通過讓小模型學會 “前瞻性” 地為大模型起草多步候選 token,再由大模型并行驗證,一舉將大模型解碼階段的算力冗余轉化為提速動能,實測最高可帶來1.9 倍的推理速度飆升。這不僅是一次技術升級,更是對下一代高效推理基礎設施的重要定義,為多模態 AI 應用的實時化、普惠化鋪平了道路。

      一、AngelSlim + 投機采樣

      投機采樣是一種通過小模型多步預測 + 大模型一步驗證的推理加速技術,其核心思想是:使用一個輕量級的草稿模型生成多個候選 token,由目標模型對候選結果進行并行驗證是否接受,以此來并行解碼加速,在有效利用大模型解碼階段的算力冗余,提升推理吞吐并降低單請求延遲。

      AngelSlim 是一款集成了包括量化、投機采樣等壓縮算法,面向全模態的大模型壓縮算法工具包。此次對投機采樣訓練進行了重磅升級,支持了大語言、多模態理解、語音等不同模態大模型投機采樣草稿模型訓練能力。

      AngelSlim 以 “Eagle3 訓練即部署” 為設計核心,提供從數據處理、模型封裝到投機采樣算法訓練的完整鏈路,幫助開發在不侵入現有模型結構的前提下,顯著降低推理時延與計算成本,各模態、各類大模型加速可達 1.4-1.9 倍。



      Github 開源地址:https://github.com/Tencent/AngelSlim

      二、核心亮點

      1. 覆蓋從文生文、多模態理解到語音的全模態投機采樣訓練

      AngelSlim 是一個從設計之初就支持全模態的投機采樣訓練框架,通過統一的訓練接口,不同模態之間共享核心算法與工程能力,避免重復造輪子。

      2. 面向部署

      AngelSlim 并不止步于 “能訓”,而是強調訓出來就能用。AngelSlim 訓練產出的模型可以無縫用于 vLLM/Sglang 等框架進行部署。

      三、核心訓練組件解析



      1. 數據處理模塊



      數據處理模塊為投機采樣訓練多個模態提供穩定、可復用的數據基礎,主要包括:

      a. 數據重采樣:針對分布外數據集重新采樣,生成分布內數據集用以訓練。

      b. 數據預處理:

      i. 統一不同模態的數據格式,將文本、圖像、音頻等輸入標準化處理成 token ids 和 loss mask。

      ii. 草稿模型裁剪詞表的映射。

      c. 隱藏特征提取:根據處理好的 token ids 獲取對應的隱藏特征。



      2. 模型模塊

      模型模塊是 AngelSlim 實現高度擴展性的關鍵。

      a. 統一的 TargetModel 接口

      i.AngelSlim 提供統一的 TargetModel 接口,包括模型加載與權重管理、前向計算、中間層 / 隱狀態特征提取等抽象方法;

      b. 低成本擴展新的模型后端

      ii. 對于新的模型架構或后端,用戶只需實現 TargetModel 中定義的抽象方法即可完成模型注冊并接入訓練流程,無需修改訓練器或核心算法代碼。這一設計極大降低了對新模型、新模態的適配成本。



      3. 訓練器模塊

      a. 訓練器針對 Eagle3 算法特點設計了兩種訓練模式:在線訓練和離線訓練。在線與離線訓練的區別在于是否預先生成并存好全量數據的 hidden states。在線訓練適合小尺寸模型或顯存足夠的場景,離線訓練適合大尺寸模型、低顯存高磁盤空間機器。

      b. 訓練器實現封裝了 Eagle3 等投機采樣算法訓練的關鍵邏輯:

      i. 訓練時測試(training-time-test):訓練時模擬 Eagle3 模型多步生成過程,讓 Eagle3 模型看到并學習使用自己的預測。

      c. 訓練器原生支持斷點續訓能力,完整保存并恢復:

      i. 草稿模型參數

      ii.Optimizer/ LR Scheduler 狀態以及訓練進度

      四、實踐與部署

      1. 快速開始

      當安裝好 AngelSlim 后,進入 AngelSlim 根目錄按照如下命令可以快速開始 Eagle3 的訓練:

      # 啟動vLLM 服務

      bash scripts/speculative/run_vllm_server.sh

      # 生成訓練數據

      bash scripts/speculative/generate_data_for_target_model.sh

      # 開始在線訓練

      bash scripts/speculative/train_eagle3_online.sh

      其中前兩條命令是準備數據,對訓練數據進行重采樣,生成目標模型分布內的數據。這一步是可選項,如果訓練數據已經是來自目標模型的 SFT 數據或自身生成的數據,這一步可跳過。對 Eagle3 模型進行訓練直接執行最后一條命令即可,更多進階的使用指南可以參見我們的文檔。

      我們提供了全面的多模態模型 Eagle3 訓練與部署指南,支持 LLM / VLM / Audio (ASR & TTS) 模型。

      詳見:https://angelslim.readthedocs.io/zh-cn/latest/features/speculative_decoding/eagle/eagle.html

      2.AngelSlim 訓練模型的加速表現

      我們使用 vLLM 在代碼、數學、指令跟隨、文本生成、多模態理解等任務上評測了 AngelSlim 所訓練的 Eagle3 模型,設置 num_speculative_tokens=2 or 4 下我們所訓的模型接收長度可達 1.8-3.5,最高加速可達 1.4-1.9 倍。



      3. 代碼和模型鏈接

      • AngelSlim 代碼 Github 開源倉庫:https://github.com/Tencent/AngelSlim
      • Hugging-Face Eagle3 模型與權重:https://huggingface.co/collections/AngelSlim/eagle3

      五、未來計劃

      在未來規劃中,我們將從工具與算法兩個層面持續推進投機采樣能力演進:工具方面,計劃支持基于 vLLM 的離線 hidden states 生成,以進一步降低數據構建與訓練成本,并通過系統性的訓練加速優化提升整體訓練效率;算法創新方面,將探索多模態理解與語音輸入信息在 Eagle3 模型中的深度融合,統一建模文本、視覺與語音特征,拓展投機采樣在全模態場景下的適用性與加速潛力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      少林高僧和前夫被查,繼閆學晶后,李湘也被多平臺禁止關注了

      少林高僧和前夫被查,繼閆學晶后,李湘也被多平臺禁止關注了

      電影票房預告片
      2026-01-16 15:25:08
      聶衛平生前收入不菲,收入主要來源4部分,恐給子女留豐厚遺產!

      聶衛平生前收入不菲,收入主要來源4部分,恐給子女留豐厚遺產!

      古希臘掌管松餅的神
      2026-01-16 17:04:41
      國家出手,李湘全網賬號被封!知情人曝原因,比閆學晶風波還惡劣

      國家出手,李湘全網賬號被封!知情人曝原因,比閆學晶風波還惡劣

      阿纂看事
      2026-01-16 14:58:49
      中國被公認為世界上最安全的大國

      中國被公認為世界上最安全的大國

      中國日報網
      2026-01-16 17:53:07
      獨家對話賈國龍:我們不想被冤死

      獨家對話賈國龍:我們不想被冤死

      中國新聞周刊
      2026-01-16 19:33:24
      他們的救命藥,退出了中國市場

      他們的救命藥,退出了中國市場

      經濟觀察報
      2026-01-15 11:36:29
      暴雪調強:今冬最強寒潮下雪形勢確定,近十省大雪河南等暴雪中心

      暴雪調強:今冬最強寒潮下雪形勢確定,近十省大雪河南等暴雪中心

      中國氣象愛好者
      2026-01-17 00:14:51
      “沒一個會算微積分的”,女孩慶祝水碩畢業,評論區一片冷嘲熱諷

      “沒一個會算微積分的”,女孩慶祝水碩畢業,評論區一片冷嘲熱諷

      妍妍教育日記
      2026-01-16 15:42:27
      王毅掛斷電話,伊朗援兵終于趕到,特朗普最后一刻喊停,不打了?

      王毅掛斷電話,伊朗援兵終于趕到,特朗普最后一刻喊停,不打了?

      知鑒明史
      2026-01-16 15:56:06
      賀嬌龍鮮為人知的往事:委培中專、服務員、被動走上網紅之路…

      賀嬌龍鮮為人知的往事:委培中專、服務員、被動走上網紅之路…

      仕道
      2026-01-16 09:49:59
      清空的作品與破碎的公信力:軍事專家李莉預測失靈背后的認知迷思

      清空的作品與破碎的公信力:軍事專家李莉預測失靈背后的認知迷思

      老馬拉車莫少裝
      2026-01-16 18:48:04
      賈國龍、羅永浩均被禁言,微博CEO回應!賈國龍換號發聲:風波期間全國西貝門店服務員被罵被打被逼下跪數十次!羅永浩發朋友圈回應

      賈國龍、羅永浩均被禁言,微博CEO回應!賈國龍換號發聲:風波期間全國西貝門店服務員被罵被打被逼下跪數十次!羅永浩發朋友圈回應

      每日經濟新聞
      2026-01-17 00:53:09
      破罐子破摔的賈國龍補刀華杉,羅永浩互聯網上首次認錯西貝!

      破罐子破摔的賈國龍補刀華杉,羅永浩互聯網上首次認錯西貝!

      不與世俗同
      2026-01-16 20:07:43
      刺激!西貝賈國龍正式向羅永浩宣戰肉搏!大量爆料涉及其妻、打罵、下跪…令人咋舌!

      刺激!西貝賈國龍正式向羅永浩宣戰肉搏!大量爆料涉及其妻、打罵、下跪…令人咋舌!

      魔都囡
      2026-01-17 03:06:21
      震驚!為聲援李亞鵬,一漂亮女孩坦然展示自己唇腭裂手術前后照片

      震驚!為聲援李亞鵬,一漂亮女孩坦然展示自己唇腭裂手術前后照片

      火山詩話
      2026-01-17 06:08:07
      楊蘭蘭案又爆大料!被澳媒拍到派“替身”去警局報到

      楊蘭蘭案又爆大料!被澳媒拍到派“替身”去警局報到

      霹靂炮
      2026-01-16 21:22:36
      羅永浩公關:有大V一個月前出謀劃策,現在賈國龍目標就是“干老羅”

      羅永浩公關:有大V一個月前出謀劃策,現在賈國龍目標就是“干老羅”

      鳳凰網財經
      2026-01-16 22:14:22
      網傳華為終端BG董事長余承東工作群怒批鴻蒙座艙:各種智能提醒都不具備,不該提醒的瞎提醒!非常非常愚蠢

      網傳華為終端BG董事長余承東工作群怒批鴻蒙座艙:各種智能提醒都不具備,不該提醒的瞎提醒!非常非常愚蠢

      和訊網
      2026-01-16 15:50:10
      羅永浩朋友圈最新發聲:好吧,他贏了

      羅永浩朋友圈最新發聲:好吧,他贏了

      揚子晚報
      2026-01-16 23:25:32
      賭王陪嫁14億,下嫁東北小伙的何超盈,再也藏不住早就變了的面相

      賭王陪嫁14億,下嫁東北小伙的何超盈,再也藏不住早就變了的面相

      有范又有料
      2026-01-04 16:54:11
      2026-01-17 10:28:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12133文章數 142542關注度
      往期回顧 全部

      科技要聞

      8億周活扛不住燒錢 ChatGPT終向廣告"低頭"

      頭條要聞

      最后一刻緊急叫停打伊朗 特朗普:已收到伊朗保證

      頭條要聞

      最后一刻緊急叫停打伊朗 特朗普:已收到伊朗保證

      體育要聞

      全隊身價=登貝萊,他們憑什么領跑法甲?

      娛樂要聞

      李湘翻車,早就有跡可循!

      財經要聞

      賈國龍、羅永浩均被禁言,微博CEO回應

      汽車要聞

      方程豹品牌銷量突破30萬輛 2026年還將推出轎跑系列

      態度原創

      時尚
      本地
      親子
      游戲
      軍事航空

      今年冬天最時髦保暖的4組搭配,照著穿美出新高度!

      本地新聞

      云游內蒙|黃沙與碧波撞色,烏海天生會“混搭”

      親子要聞

      “為你好”對孩子有何影響?專家:感知不到“好”還造成壓力

      為什么CF迷失邊城沒人玩了?熱度連新寂靜村一半都不如

      軍事要聞

      歐洲多國向格陵蘭島派遣軍事人員 白宮回應

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 乐平市| 97人妻精品一区二区三区视频蜜桃0.0.0.| www.91自拍| 两根大肉大捧一进一出好爽视频| 伊人色色网| 日韩av高清在线观看| 青久草视频| 富平县| 乡宁县| jk白丝喷浆| 临清市| 久久久2019精品视频中文字幕| 亚洲v天堂| 99热这里有精品| 国产96在线 | 亚洲| 九九精品视频免费观看| 99久久久国产精品免费蜜臀| 免费ā片在线观看| 日本丰满老妇bbb| 精品国产人妻一区二区三区| 国产精品久久精品国产| 久章草在线精品视频免费观看| 久久99国内精品自在现线| 欧美噜噜久久久xxx| 蜜臀久久精精品久久久久久噜噜| 久久久久厕拍| 国产乡下妇女做爰视频| 国产性猛交XXXX免费看| 中文无码第一页| 欧美性猛交xxxx黑人猛交| 国产二区三区不卡免费| jizz国产精品| 万年县| 亚洲精品色欲| 欧美牲交a欧美牲交aⅴ图片| 狠狠色狠狠色综合日日不卡| 97福利| 青草伊人网| 男人一边吃奶一边做爰免费视频| 97av在线| 9丨精品国产高清自在线看|