<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      比現有框架快22倍,浙大開源EasySteer:LLM Steering統一框架

      0
      分享至



      大語言模型 (LLM) 在部署后如何靈活地控制其行為,一直是業界面臨的核心挑戰。微調代價高昂且存在災難性遺忘風險,提示工程又只能提供表層的控制,缺乏行為保證。LLM Steering 技術通過在推理階段對模型隱藏狀態進行定向操作,在不修改模型權重的情況下實現精準行為控制,為這一問題提供了一條輕量且可行的路徑。

      近年來,社區已涌現出 repeng、pyreft、EasyEdit2 等代表性框架,分別在分析式向量提取、學習式表征微調、綜合編輯等方向做出了重要探索。不過,隨著 Steering 技術從單一實驗場景走向多目標、大規模的生產部署,現有框架在推理效率、控制粒度和算法擴展性上仍有進一步提升的空間。

      在此背景下,浙江大學研究團隊提出了EasySteer——一個基于 vLLM 構建的高性能、可擴展 LLM Steering 統一框架。該框架通過與 vLLM 推理引擎的深度集成,相比現有 Steering 框架實現了 10.8-22.3 倍的推理加速,同時提供更細粒度的干預控制,并為八大應用場景提供了預計算 Steering 向量與完整復現示例,方便研究者快速上手和對照復現。



      • 論文地址:https://arxiv.org/abs/2509.25175
      • 開源代碼:https://github.com/ZJU-REAL/EasySteer
      • 演示視頻:https://www.youtube.com/watch?v=3rRGzZmhrXg
      • 簡易 demo:https://huggingface.co/spaces/zjuxhl/EasySteer

      設計動機:從研究原型到生產部署的新需求

      隨著 Steering 技術在安全控制、推理優化、幻覺緩解等方向不斷取得進展,實際應用中對框架提出了更高的要求。研究者總結了三個關鍵方向:


      高吞吐推理:一方面,Steering 研究中大量的評測、消融實驗需要反復推理,低效的推理后端會嚴重拖慢科研迭代速度;另一方面,生產環境通常需要處理大規模并發請求,只有具備足夠的吞吐能力,Steering 技術才具備實際部署的可能性。利用 vLLM 等專用推理引擎的連續批處理能力,可以同時在科研效率和生產落地兩個層面帶來實質性提升。


      精細粒度控制:現有框架大多支持層級和位置級別的干預,但在更細粒度的場景下仍有局限。例如,token 級別的條件干預(如僅在特定 token 出現時觸發)、多向量協同等能力,對于復雜場景(如推理步邊界的選擇性干預)至關重要。


      便捷的算法集成:Steering 方法迭代迅速,框架需要提供低門檻的插件機制,方便研究者快速實現和對比新算法。



      框架設計

      EasySteer 由四個模塊組成,覆蓋從向量生成到應用部署的完整流程:




      Steering 向量生成模塊:同時支持分析式(CAA、PCA、線性探針、SAE 等)和學習式(LoReFT、LM-Steer 等)兩大類方法,通過統一的隱藏狀態捕獲接口,研究者可以在同一框架內便捷地生成和對比不同類型的 Steering 向量。

      Steering 向量應用模塊:是 EasySteer 的核心,主要解決三個問題:通過非侵入式的動態模型包裝器兼容多種 LLM 架構;通過解耦的算法接口支持自定義 Steering 算法的即插即用;通過精細的參數控制支持條件干預、多向量協同等高級策略。


      交互式演示系統:提供基于 Web 的界面,集成推理、多輪對話、向量提取和訓練功能,支持基線與 Steering 輸出的并排對比。


      資源庫:提供覆蓋安全、推理、知識、真實性、語言、情感、人格、風格八大場景的預計算 Steering 向量,每個場景都附帶從數據準備到應用的完整復現流程。



      性能評估

      框架推理效率

      研究者在 NVIDIA A6000 GPU (48GB) 上,使用 DeepSeek-R1-Distill-Qwen-1.5B 進行了系統性基準測試。



      在 Steering 開銷方面,EasySteer 在全層干預的批量推理場景下,短序列吞吐量為 8991 tokens/s,長序列為 7074 tokens/s,相比無 Steering 基線(10248 / 7563 tokens/s)分別下降約 12% 和 6%。即使同時應用三個 Steering 向量到所有層,長序列吞吐仍保持在 6854 tokens/s,為基線的約 91%。整體來看,Steering 操作帶來的額外開銷較為可控。

      在框架對比方面,以長序列批量推理為例,EasySteer 的吞吐量(7074 tokens/s)約為 pyreft(653 tokens/s)的 10.8 倍、repeng(317 tokens/s)的 22.3 倍。

      框架有效性驗證


      過度思考緩解:研究者參照 SEAL 方法,從 1000 個 MATH 訓練樣本中提取三種行為向量(執行、反思、轉換),在推理步邊界處增強執行向量、抑制反思和轉換向量。在 DeepSeek-R1-Distill-Qwen-1.5B 上,SEAL Steering 將 GSM8K 準確率從 79.6% 提升至 82.3%,同時 token 使用量減少約 40%。MATH500 上準確率從 70.8% 提升至 78.4%。7B 模型同樣展現了效率收益,GSM8K 和 MATH500 分別減少了 13.3% 和 16.8% 的 token 消耗。


      幻覺緩解:在 TruthfulQA 數據集上進行兩折交叉驗證,分析式方法和學習式方法均取得了不同程度的提升。其中,PCA 方法在 Llama-3.1-8B-Instruct 上將多選準確率從 50.55% 提升至 62.67%;LoReFT 在 Qwen2.5-1.5B-Instruct 上將開放式問答準確率從 27.17% 提升至 33.41%。分析式方法在提升準確率的同時通常能較好地保持語言流暢度,學習式方法則在準確率和流暢度之間存在一定的權衡。


      定性效果:EasySteer 在八大場景中均展現了有效的行為控制能力。例如,安全場景下可將模型從生成不當內容引導為拒絕回答;推理場景下可將簡單算術題的冗長推演簡化為直接輸出結果;語言場景下可將回復從英文切換為中文輸出。



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      俄羅斯讓中國心涼?真正可怕的不是西方圍堵,而是我們低估了自己

      俄羅斯讓中國心涼?真正可怕的不是西方圍堵,而是我們低估了自己

      愛史紀
      2026-03-23 02:56:48
      中東戰火,臺灣面臨選擇:是統一,還是“用愛發電”?

      中東戰火,臺灣面臨選擇:是統一,還是“用愛發電”?

      鷹視狼顧之天下
      2026-03-22 11:45:32
      3輪后,最被低估的主帥誕生,保級隊帶成爭冠隊,球迷:小瞧他了

      3輪后,最被低估的主帥誕生,保級隊帶成爭冠隊,球迷:小瞧他了

      我就是一個說球的
      2026-03-22 22:34:56
      王皓沒吸取教訓!世乒賽選拔方式已與實際不符,不如馬琳公開透明

      王皓沒吸取教訓!世乒賽選拔方式已與實際不符,不如馬琳公開透明

      三十年萊斯特城球迷
      2026-03-22 17:36:14
      上海德云社開業賣大蒜咖啡杯,周立波舊梗突然翻紅

      上海德云社開業賣大蒜咖啡杯,周立波舊梗突然翻紅

      情感大頭說說
      2026-03-22 16:48:50
      張蘭罕見談及大S,泣不成聲,她的哭律師再發文,內涵徐家

      張蘭罕見談及大S,泣不成聲,她的哭律師再發文,內涵徐家

      動物奇奇怪怪
      2026-03-23 16:12:43
      續航150公里!比亞迪電摩鋰電池上市

      續航150公里!比亞迪電摩鋰電池上市

      新浪財經
      2026-03-23 18:09:16
      華為Mate80新版本搭載麒麟9030 Pro芯片

      華為Mate80新版本搭載麒麟9030 Pro芯片

      界面新聞
      2026-03-23 14:58:56
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      勸大家別刻意留親戚在家住宿,不是無情,而是意外難防、人性難測

      勸大家別刻意留親戚在家住宿,不是無情,而是意外難防、人性難測

      小馬達情感故事
      2026-03-23 18:40:03
      賈國龍59元燜面實測后,網友紛紛喊話,羅永浩算是白罵了!

      賈國龍59元燜面實測后,網友紛紛喊話,羅永浩算是白罵了!

      放開他讓wo來
      2026-03-23 13:26:51
      為什么說俄烏戰爭打的越激烈,越能證明朱元璋的偉大?

      為什么說俄烏戰爭打的越激烈,越能證明朱元璋的偉大?

      賤議你讀史
      2026-03-23 00:25:03
      真沒想到!在NBA大殺四方的東契奇,最后也倒在了這道坎上

      真沒想到!在NBA大殺四方的東契奇,最后也倒在了這道坎上

      草莓解說體育
      2026-03-17 07:32:59
      余華英拐賣17名兒童,“梅姨”只賣9名?她很可能比余華英更多

      余華英拐賣17名兒童,“梅姨”只賣9名?她很可能比余華英更多

      潮鹿逐夢
      2026-03-23 10:25:01
      1982年戴安娜艱難生下威廉,女王先看耳朵,一句評論讓查爾斯心塞

      1982年戴安娜艱難生下威廉,女王先看耳朵,一句評論讓查爾斯心塞

      照見古今
      2026-03-23 18:45:47
      4月1日起,去醫院要注意:醫保卡單獨用,可能無法報銷

      4月1日起,去醫院要注意:醫保卡單獨用,可能無法報銷

      i書與房
      2026-03-22 21:30:37
      徹底不帶日本玩!我國中止邀請日本出席高級會議,日方深感不安

      徹底不帶日本玩!我國中止邀請日本出席高級會議,日方深感不安

      余塩搞笑段子
      2026-03-22 16:11:36
      男子下高速顯示高速費用83990元,收費員震驚:你有沒有繞路!

      男子下高速顯示高速費用83990元,收費員震驚:你有沒有繞路!

      張曉磊
      2026-03-08 11:07:09
      許世友攻城16天啃不下,小班長說了8個字,全城日軍當晚投降

      許世友攻城16天啃不下,小班長說了8個字,全城日軍當晚投降

      文史明鑒
      2026-03-23 17:18:19
      為什么國家衛健委不建立一個統一電子病歷系統?網友回答真相了!

      為什么國家衛健委不建立一個統一電子病歷系統?網友回答真相了!

      另子維愛讀史
      2026-03-20 19:19:48
      2026-03-23 19:32:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12576文章數 142591關注度
      往期回顧 全部

      科技要聞

      裁掉2萬多名員工后,扎克伯格對自己下手了

      頭條要聞

      伊朗豁出去了:若美以敢炸發電廠 整個中東就同歸于盡

      頭條要聞

      伊朗豁出去了:若美以敢炸發電廠 整個中東就同歸于盡

      體育要聞

      不敢放手一搏,你拿什么去爭冠?

      娛樂要聞

      劉燁47歲生日,安娜曬全家福為其慶生

      財經要聞

      滬指險守3800點!真正的恐慌盤出現了?

      汽車要聞

      "拒絕"豪車稅 新款Panamera盡享版99.8萬元起精準入局

      態度原創

      家居
      本地
      手機
      健康
      軍事航空

      家居要聞

      智慧生活 奢享家居

      本地新聞

      這里是寶雞 嫽滴很!

      手機要聞

      OPPO ColorOS三月系統升級一覽:一句話釘釘打卡、AI通話防詐等

      轉頭就暈的耳石癥,能開車上班嗎?

      軍事要聞

      伊朗回應美方威脅:將在戰場上堅決對抗

      無障礙瀏覽 進入關懷版