<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      安全審核大模型,本地部署,實測

      0
      分享至

      大家好,我是 Ai 學習的老章

      現在的大模型應用搭建越來越簡便,但是安全層面大家普遍不夠重視,各種提示詞越獄,注入,投毒等手段,無論是基模還是最終應用,都極有可能輸出不安全內容(比如暴力、非法行為、個人可識別信息、不道德行為、敏感話題、版權侵犯等)。

      一文中,提到 Qwen3Guard 安全審核大模型

      最近我部署了這個模型,將其放在工作流第一步的提示詞安全性審核以及最終回復的安全性審核

      雙重保障,能夠一定程度降低安全風險。

      它的使用極其簡單,就是給提示詞和最終回復打標簽和分類


      本文極簡介紹本地部署與用法

      Qwen3Guard

      阿里開源的 Qwen3 安全審核模型Qwen3Guard,一共 2 個,分兩類:

      • Qwen3Guard-Gen,將安全性分類視為指令跟隨任務的生成模型;

      • Qwen3Guard-Stream,在增量文本生成期間實時進行安全監控的標記級分類頭。

      這兩類模型又分別有三種大小的模型(0.6B、4B 和 8B)


      應用場景:

      • Qwen3Guard-Gen(生成式版)支持對完整用戶輸入與模型輸出進行安全分類,適用于離線數據集的安全標注、過濾,亦可作為強化學習中基于安全性的獎勵信號源,是構建高質量訓練數據的理想工具。

      • Qwen3Guard-Stream(流式檢測版)突破了傳統的護欄模型架構,首次實現模型生成過程中的實時、流式安全檢測,顯著提升在線服務的安全響應效率與部署靈活性。

      Qwen3Guard-Gen,它具有以下主要優勢:

      • 三級嚴重性分類:通過將輸出分類為安全、有爭議(其危害性可能依賴于上下文或在不同應用場景中存在分歧的內容)和不安全(通常被認為在大多數情況下有害的內容)三個嚴重性級別,支持對不同部署場景的適應。

      • 多語言支持:Qwen3Guard-Gen 支持 119 種語言和方言,確保在全球和跨語言應用中的強大性能。

      • 卓越的性能:Qwen3Guard-Gen 在各種安全基準測試中表現出色,在英語、中文和多語言任務的提示和響應分類方面均表現優異。

      本地部署

      第一步,下載模型

      我選擇了 4B 版本

      pip install modelscope
      modelscope download --model Qwen/Qwen3Guard-Gen-4B --local_dir /Qwen3Guard-Gen-4B

      第二步,vLLM 啟動

      vLLM 版本 0.10.2

      VLLM_USE_MODELSCOPE=true vllm serve Qwen/Qwen3Guard-Gen-4B --port 8000 --max-model-len 32768

      實際上,我把 max-modle-len 設置為了 10240,給它分配的顯存為 14GB

      模型文件占用了 7.5GB,KV cache 占用了 4.2GB

      用法

      官方用例

      from openai import OpenAI

      openai_api_key = "EMPTY"
      openai_api_base = "http://localhost:8000/v1"
      model = "Qwen/Qwen3Guard-Gen-4B"
      client = OpenAI(
      api_key=openai_api_key,
      base_url=openai_api_base)

      # Prompt Moderation
      prompt = "How can I make a bomb?"
      messages = [
      {"role": "user", "content": prompt}
      ]
      chat_completion = client.chat.completions.create(
      messages=messages,
      model=model)
      print(chat_completion.choices[0].message.content)
      # '''
      # Safety: Unsafe
      # Categories: Violent
      # '''

      # Response Moderation
      prompt = "How can I make a bomb?"
      response = "As a responsible artificial intelligence system, I regret that I am unable to fulfill your request."
      messages = [
      {"role": "user", "content": prompt},
      {"role": "assistant", "content": response}
      ]
      print(chat_completion.choices[0].message.content)
      # '''
      # Safety: Safe
      # Categories: None
      # Refusal: Yes
      # '''

      我是直接把它接入到了 openwebUI 進行簡單測試


      在實際業務中,比如 Dify 等智能體開發平臺的工作流中配置提示詞檢測及最終輸出檢測節點,做 if else 判斷,標簽為 Safe 的提示詞及回復方可通過并往下進行。

      其實 0.6B 應該就足夠了,速度是極快的,幾乎不會影響整個工作流的效率

      0.6B 版本模型文件只有 1.5GB,隨便一個消費級顯卡都能 Hold 住,極低成本收獲更安全的應用,簡直完美。

      文末薦書

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      烏軍日斃6名俄指揮官,川普威脅不幫忙就散伙,歐洲各國集體硬剛

      烏軍日斃6名俄指揮官,川普威脅不幫忙就散伙,歐洲各國集體硬剛

      史政先鋒
      2026-04-02 15:03:54
      山東泰安一小學要求6:40前到校、遲到罰站,教體局先稱“不可能”后改口:已統一要求7點30分到校,將加強家校溝通,保障學生休息時間

      山東泰安一小學要求6:40前到校、遲到罰站,教體局先稱“不可能”后改口:已統一要求7點30分到校,將加強家校溝通,保障學生休息時間

      大風新聞
      2026-04-02 16:03:10
      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      丈夫:你把工資拿娘家,兒子用啥?妻子:侄子都養了,兒子也能養

      惟來
      2026-04-01 15:37:23
      天津市市場監管委原黨組副書記、副主任劉惠杰被雙開

      天津市市場監管委原黨組副書記、副主任劉惠杰被雙開

      界面新聞
      2026-04-02 16:03:04
      “生娃率”持續走低,廈門教授給出建議:不生孩子就下調養老金

      “生娃率”持續走低,廈門教授給出建議:不生孩子就下調養老金

      大果小果媽媽
      2026-04-02 13:16:39
      韓國三大電視臺之一SBS報道:韓國食堂大漲價,大學生吐槽吃不起飯

      韓國三大電視臺之一SBS報道:韓國食堂大漲價,大學生吐槽吃不起飯

      可達鴨面面觀
      2026-04-02 08:56:54
      “世界級文旅項目”,爛尾了

      “世界級文旅項目”,爛尾了

      中國新聞周刊
      2026-04-02 15:17:57
      CCTV直播!國乒4人出局!孫穎莎或爆冷!王曼昱王藝迪戰張本伊藤 世界杯4月2日賽程

      CCTV直播!國乒4人出局!孫穎莎或爆冷!王曼昱王藝迪戰張本伊藤 世界杯4月2日賽程

      好乒乓
      2026-04-02 12:14:02
      張雪師父發聲:奪冠后兩人通話泣不成聲;曾數十次借錢給張雪,建議他造車:是你成為世界冠軍的唯一可能

      張雪師父發聲:奪冠后兩人通話泣不成聲;曾數十次借錢給張雪,建議他造車:是你成為世界冠軍的唯一可能

      大風新聞
      2026-04-02 14:31:06
      剛剛過去的一個小時 以色列遭開戰以來最大規模導彈襲擊

      剛剛過去的一個小時 以色列遭開戰以來最大規模導彈襲擊

      財聯社
      2026-04-01 23:28:03
      又一行業巨頭暴雷,拖欠數億貨款,創始人失聯甩鍋,百姓被坑慘了

      又一行業巨頭暴雷,拖欠數億貨款,創始人失聯甩鍋,百姓被坑慘了

      卷史
      2026-04-02 14:17:39
      又要打,又想跑,美國陷入泥潭

      又要打,又想跑,美國陷入泥潭

      南風窗
      2026-04-02 14:01:50
      加餐換自動鉛筆后續:寶媽強勢追責,同學賠償道歉,方式太窒息了

      加餐換自動鉛筆后續:寶媽強勢追責,同學賠償道歉,方式太窒息了

      阿纂看事
      2026-04-02 13:47:58
      誠狗封影帝!合作女同事全體出席!

      誠狗封影帝!合作女同事全體出席!

      貴圈真亂
      2026-04-02 12:35:00
      陳光標回應“張雪收下1300萬勞斯萊斯贈車要賣掉給嫣然醫院捐款”:車是贈與你個人使用,如果你想當二手車賣掉去轉捐贈,這是誤會我的初心

      陳光標回應“張雪收下1300萬勞斯萊斯贈車要賣掉給嫣然醫院捐款”:車是贈與你個人使用,如果你想當二手車賣掉去轉捐贈,這是誤會我的初心

      大風新聞
      2026-04-02 12:28:03
      4月2日世界杯:王藝迪1-4遭逆轉止步16強壓力陡增

      4月2日世界杯:王藝迪1-4遭逆轉止步16強壓力陡增

      吳锎旅行ing
      2026-04-02 12:33:13
      憤怒拉滿!2.5億散戶被AI收割:幻方量化賺350億,公平在哪?

      憤怒拉滿!2.5億散戶被AI收割:幻方量化賺350億,公平在哪?

      魔都姐姐雜談
      2026-04-02 12:31:30
      法國車手瓦倫丁:因年齡被歐美車隊淘汰,和張雪聯手拿冠軍狠打臉

      法國車手瓦倫丁:因年齡被歐美車隊淘汰,和張雪聯手拿冠軍狠打臉

      白面書誏
      2026-04-01 16:23:50
      張雪回應陳光標贈1300萬元的勞斯萊斯:那我收了,順便招募二手車商上門8折收車,把錢捐贈給嫣然天使,"我們就委屈點,還用面包車接客戶"

      張雪回應陳光標贈1300萬元的勞斯萊斯:那我收了,順便招募二手車商上門8折收車,把錢捐贈給嫣然天使,"我們就委屈點,還用面包車接客戶"

      大風新聞
      2026-04-02 11:25:35
      騰訊凈利潤2200億員工只有11萬 京東員工90萬凈利潤只有200億

      騰訊凈利潤2200億員工只有11萬 京東員工90萬凈利潤只有200億

      可達鴨面面觀
      2026-04-02 11:31:39
      2026-04-02 17:36:49
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3303文章數 11122關注度
      往期回顧 全部

      科技要聞

      三年虧20億,最新估值58億,Xreal沖刺港股

      頭條要聞

      外媒稱伊朗已向中國尋求安全保障 外交部回應

      頭條要聞

      外媒稱伊朗已向中國尋求安全保障 外交部回應

      體育要聞

      這六個字,代表了邵佳一的新國足

      娛樂要聞

      宋寧峰帶女兒出軌,張婉婷找董璇哭訴

      財經要聞

      電商售械三水光針 機構倒貨or假貨猖獗?

      汽車要聞

      三電可靠 用料下本 百萬公里的蔚來ES6 拆開看

      態度原創

      教育
      家居
      游戲
      手機
      房產

      教育要聞

      天府新區調整劃片后,利好不止這個片區

      家居要聞

      歲月靜好 典雅新章

      嫌PS5太丑!玩家爆改:圓潤曲線被徹底削平 更硬朗

      手機要聞

      一加首發魔改版天璣9500:直接修改GPU底層調度 性能大爆發

      房產要聞

      大反轉!海口今年首宗重磅江景地塊,拍賣突然終止!

      無障礙瀏覽 進入關懷版