<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      安全審核大模型,本地部署,實測

      0
      分享至

      大家好,我是 Ai 學習的老章

      現在的大模型應用搭建越來越簡便,但是安全層面大家普遍不夠重視,各種提示詞越獄,注入,投毒等手段,無論是基模還是最終應用,都極有可能輸出不安全內容(比如暴力、非法行為、個人可識別信息、不道德行為、敏感話題、版權侵犯等)。

      一文中,提到 Qwen3Guard 安全審核大模型

      最近我部署了這個模型,將其放在工作流第一步的提示詞安全性審核以及最終回復的安全性審核

      雙重保障,能夠一定程度降低安全風險。

      它的使用極其簡單,就是給提示詞和最終回復打標簽和分類


      本文極簡介紹本地部署與用法

      Qwen3Guard

      阿里開源的 Qwen3 安全審核模型Qwen3Guard,一共 2 個,分兩類:

      • Qwen3Guard-Gen,將安全性分類視為指令跟隨任務的生成模型;

      • Qwen3Guard-Stream,在增量文本生成期間實時進行安全監控的標記級分類頭。

      這兩類模型又分別有三種大小的模型(0.6B、4B 和 8B)


      應用場景:

      • Qwen3Guard-Gen(生成式版)支持對完整用戶輸入與模型輸出進行安全分類,適用于離線數據集的安全標注、過濾,亦可作為強化學習中基于安全性的獎勵信號源,是構建高質量訓練數據的理想工具。

      • Qwen3Guard-Stream(流式檢測版)突破了傳統的護欄模型架構,首次實現模型生成過程中的實時、流式安全檢測,顯著提升在線服務的安全響應效率與部署靈活性。

      Qwen3Guard-Gen,它具有以下主要優勢:

      • 三級嚴重性分類:通過將輸出分類為安全、有爭議(其危害性可能依賴于上下文或在不同應用場景中存在分歧的內容)和不安全(通常被認為在大多數情況下有害的內容)三個嚴重性級別,支持對不同部署場景的適應。

      • 多語言支持:Qwen3Guard-Gen 支持 119 種語言和方言,確保在全球和跨語言應用中的強大性能。

      • 卓越的性能:Qwen3Guard-Gen 在各種安全基準測試中表現出色,在英語、中文和多語言任務的提示和響應分類方面均表現優異。

      本地部署

      第一步,下載模型

      我選擇了 4B 版本

      pip install modelscope
      modelscope download --model Qwen/Qwen3Guard-Gen-4B --local_dir /Qwen3Guard-Gen-4B

      第二步,vLLM 啟動

      vLLM 版本 0.10.2

      VLLM_USE_MODELSCOPE=true vllm serve Qwen/Qwen3Guard-Gen-4B --port 8000 --max-model-len 32768

      實際上,我把 max-modle-len 設置為了 10240,給它分配的顯存為 14GB

      模型文件占用了 7.5GB,KV cache 占用了 4.2GB

      用法

      官方用例

      from openai import OpenAI

      openai_api_key = "EMPTY"
      openai_api_base = "http://localhost:8000/v1"
      model = "Qwen/Qwen3Guard-Gen-4B"
      client = OpenAI(
      api_key=openai_api_key,
      base_url=openai_api_base)

      # Prompt Moderation
      prompt = "How can I make a bomb?"
      messages = [
      {"role": "user", "content": prompt}
      ]
      chat_completion = client.chat.completions.create(
      messages=messages,
      model=model)
      print(chat_completion.choices[0].message.content)
      # '''
      # Safety: Unsafe
      # Categories: Violent
      # '''

      # Response Moderation
      prompt = "How can I make a bomb?"
      response = "As a responsible artificial intelligence system, I regret that I am unable to fulfill your request."
      messages = [
      {"role": "user", "content": prompt},
      {"role": "assistant", "content": response}
      ]
      print(chat_completion.choices[0].message.content)
      # '''
      # Safety: Safe
      # Categories: None
      # Refusal: Yes
      # '''

      我是直接把它接入到了 openwebUI 進行簡單測試


      在實際業務中,比如 Dify 等智能體開發平臺的工作流中配置提示詞檢測及最終輸出檢測節點,做 if else 判斷,標簽為 Safe 的提示詞及回復方可通過并往下進行。

      其實 0.6B 應該就足夠了,速度是極快的,幾乎不會影響整個工作流的效率

      0.6B 版本模型文件只有 1.5GB,隨便一個消費級顯卡都能 Hold 住,極低成本收獲更安全的應用,簡直完美。

      文末薦書

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      就讓高市如愿,中方要上大菜!

      就讓高市如愿,中方要上大菜!

      楊風
      2026-02-10 22:12:20
      農村到底蕭條到了啥程度?我在村里住了三個月,說幾句刺耳的話

      農村到底蕭條到了啥程度?我在村里住了三個月,說幾句刺耳的話

      復轉這些年
      2026-02-11 23:59:46
      知恥后勇,中國短道速滑隊捷報頻傳,范可新落淚,林孝俊被犯規

      知恥后勇,中國短道速滑隊捷報頻傳,范可新落淚,林孝俊被犯規

      林子說事
      2026-02-11 11:34:44
      CBA官方罰單:趙睿嚴重不當評論停賽3場罰款5萬 首鋼罰5萬

      CBA官方罰單:趙睿嚴重不當評論停賽3場罰款5萬 首鋼罰5萬

      醉臥浮生
      2026-02-11 20:42:55
      律師:中國最高法院推翻加拿大涉毒男子死刑判決

      律師:中國最高法院推翻加拿大涉毒男子死刑判決

      俄羅斯衛星通訊社
      2026-02-11 19:37:23
      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      王晶談萬梓良晚年凄涼!稱其不懂江湖規矩,演戲夸張對手很難接

      小徐講八卦
      2026-02-11 11:40:12
      力壓范戴克,維爾茨當選與桑德蘭一役利物浦隊內最佳球員

      力壓范戴克,維爾茨當選與桑德蘭一役利物浦隊內最佳球員

      懂球帝
      2026-02-12 07:56:08
      Seedance2.0刷爆全網!知名財作家:女主播找工作時間不會很多了

      Seedance2.0刷爆全網!知名財作家:女主播找工作時間不會很多了

      火山詩話
      2026-02-11 06:17:37
      大爆冷!倒數第1擒東部第二送哈登神助攻 布倫森轟40+5+8成背景板

      大爆冷!倒數第1擒東部第二送哈登神助攻 布倫森轟40+5+8成背景板

      鍋子籃球
      2026-02-11 12:29:36
      網友吐槽:“吃相難看!漲價離譜!”

      網友吐槽:“吃相難看!漲價離譜!”

      王二哥老搞笑
      2026-02-12 00:52:08
      湖北女子吃飯閑聊,被母親指責啃老:最錯的事就是生你,網友炸鍋

      湖北女子吃飯閑聊,被母親指責啃老:最錯的事就是生你,網友炸鍋

      離離言幾許
      2026-02-11 22:39:53
      麻六記年會破防!小菲首度狂夸張蘭,三孫將至喜上加喜!

      麻六記年會破防!小菲首度狂夸張蘭,三孫將至喜上加喜!

      鄉野小珥
      2026-02-12 00:36:46
      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      千秋文化
      2026-02-10 20:55:47
      2012年希拉里助手曝出驚天猛料:為報復克林頓出軌,她的私生活竟也亂成一鍋粥,這哪是原諒,分明是頂級復仇

      2012年希拉里助手曝出驚天猛料:為報復克林頓出軌,她的私生活竟也亂成一鍋粥,這哪是原諒,分明是頂級復仇

      歷史回憶室
      2026-01-13 22:46:09
      廣東一高端酒樓,突然宣布結業!早前還在宣傳年夜飯

      廣東一高端酒樓,突然宣布結業!早前還在宣傳年夜飯

      今日搞笑分享
      2026-02-12 00:17:12
      斯瓦泰克披露堅持送蛋不讓球原因,誰是1000賽史上送蛋女王

      斯瓦泰克披露堅持送蛋不讓球原因,誰是1000賽史上送蛋女王

      網球之家
      2026-02-11 22:49:53
      內存現泡沫信號!DDR4價格閃崩近20%已走到盡頭

      內存現泡沫信號!DDR4價格閃崩近20%已走到盡頭

      3DM游戲
      2026-02-11 17:41:04
      夸美國空氣香甜的楊舒平,已被美驅逐出境,如今回國下場怎么樣了

      夸美國空氣香甜的楊舒平,已被美驅逐出境,如今回國下場怎么樣了

      談史論天地
      2026-02-07 13:20:03
      我去!塔圖姆被下放了?。?>
    </a>
        <h3>
      <a href=我去!塔圖姆被下放了??! 柚子說球
      2026-02-11 17:20:08
      大風新聞調查:在小紅書注冊未成年人賬號,被推送擦邊內容,改年齡就能打賞直播間

      大風新聞調查:在小紅書注冊未成年人賬號,被推送擦邊內容,改年齡就能打賞直播間

      大風新聞
      2026-02-11 18:53:18
      2026-02-12 08:32:49
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      Meta將斥資超100億美元建設數據中心

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      廣州前首富被判無期 200億集資窟窿何償

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      房產
      教育
      親子
      公開課
      軍事航空

      房產要聞

      999元開線上免稅店?海南爆出免稅大騙局,多人已被抓!

      教育要聞

      高考地理中的木本植物擴張

      親子要聞

      寒假在家卷運動,手眼協調練一練

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:若美伊談判失敗 或再派一支航母打擊群

      無障礙瀏覽 進入關懷版