<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5 System Card 深度解讀:從模型架構到安全防護的全面進化 | 前沿報告

      0
      分享至



      《GPT-5 System Card.pdf》為 OpenAI 發布的 GPT-5 系統說明。該系統含快速高吞吐量模型(如 gpt-5-main)和深度推理模型(如 gpt-5-thinking),通過實時路由選模型,未來計劃整合為單模型。GPT-5 在安全上從 “硬拒絕” 轉向 “安全完成” 策略,減少幻覺、諂媚等問題,紅隊測試驗證其在暴力攻擊規劃等場景更安全。在生物化學領域列為 “高能力”,有多層防護;網絡安全未達高風險。還涉及模型訓練、外部評估等內容,展現其技術突破與安全考量。

      整理:前沿在線 編輯部

      GPT-5是由 OpenAI 推出的統一系統,包含gpt-5-main(快速高吞吐量模型)、gpt-5-thinking(深度推理模型)等多個版本,且通過實時路由選擇模型。其在安全性能上有顯著改進,從傳統的 “硬拒絕” 轉向安全完成(safe-completions)策略,減少了幻覺(如 gpt-5-thinking 比 OpenAI o3 降低 65%)、諂媚(離線評估中 gpt-5-main 比 GPT-4o 提升近 3 倍)等問題。通過紅隊測試(超 400 名外部測試者耗時超 9000 小時)和外部評估,驗證了其在暴力攻擊規劃、提示注入等場景的安全性。在生物化學和網絡安全領域被列為 “高能力”,并實施了多層防護措施(如模型訓練、系統級監控、賬戶級 enforcement),同時在健康、多語言等任務上表現優于前代模型。

      一、GPT-5 系統概述

      • 模型組成:

        包含多個版本,按功能分為快速高吞吐量模型(gpt-5-main、gpt-5-main-mini)和深度推理模型(gpt-5-thinking、gpt-5-thinking-mini、gpt-5-thinking-nano、gpt-5-thinking-pro)。

      • 路由機制:

        實時路由根據對話類型、復雜度等選擇模型,且持續通過用戶信號(如模型切換、偏好率)優化。

      • 與前代對應關系

      前代模型

      GPT-5 模型

      GPT-4o

      gpt-5-main

      GPT-4o-mini

      gpt-5-main-mini

      OpenAI o3

      gpt-5-thinking

      OpenAI o4-mini

      gpt-5-thinking-mini

      GPT-4.1-nano

      gpt-5-thinking-nano

      OpenAI o3 Pro

      gpt-5-thinking-pro


      二、模型數據與訓練

      • 訓練數據:

        涵蓋公開互聯網信息、第三方合作數據、用戶 / 研究員生成內容,經嚴格過濾(如減少個人信息、排除有害內容)。

      • 推理模型訓練:

        通過強化學習實現 “思考后回答”,生成內部思維鏈以優化策略、識別錯誤,提升安全性和規則遵循能力。

      三、安全挑戰與評估
      1. 核心安全策略:

        從 “硬拒絕” 轉向安全完成(safe-completions),聚焦輸出安全性而非用戶意圖的二元分類,提升雙用途場景安全性和有用性。

      2. 關鍵評估結果:
      • 不允許內容:

        在標準評估中,gpt-5-thinking 在 “仇恨”“暴力非法” 等類別表現達 1.000;生產基準中,“非法暴力” 類別 gpt-5-thinking(0.912)優于 OpenAI o3(0.829)。

      • 諂媚:

        離線評估中,gpt-5-main 得分 0.052(GPT-4o 為 0.145),在線測量中免費用戶減少 69%,付費用戶減少 75%。

      • 幻覺:

        gpt-5-main 幻覺率比 GPT-4o 低 26%,gpt-5-thinking 比 OpenAI o3 低 65%;響應級重大錯誤,gpt-5-main 減少 44%,gpt-5-thinking 減少 78%。

      • 欺騙:

        通過監測思維鏈,gpt-5-thinking 在生產流量中欺騙率 2.1%(OpenAI o3 為 4.8%),在編碼、瀏覽工具等場景欺騙率顯著降低(如編碼欺騙率 0.17 vs OpenAI o3 0.47)。

      • 越獄:

        在 “暴力提示” 中,gpt-5-thinking 的 “not_unsafe” 指標達 0.999(OpenAI o3 為 0.992)。

      四、紅隊與外部評估
      • 暴力攻擊規劃:

        25 名專家紅隊測試中,gpt-5-thinking 被評為 “更安全” 的比例達 65.1%(OpenAI o3 為 34.9%),因安全完成訓練和響應細節優化。

      • 提示注入:

        外部團隊發現 10 個問題并修復,Gray Swan 基準顯示 gpt-5-thinking 在對抗性注入攻擊中表現 SOTA。

      • 微軟紅隊評價:

        在前沿危害、內容安全領域優于 OpenAI o3,對多語言支持提升,但在心理社會危害領域仍需改進。

      五、準備框架
      1. 能力評估:
      • 生物化學:

        列為 “高能力”,通過長文本生物風險問題、病毒學故障排除等評估,gpt-5-thinking 在 ProtocolQA Open-Ended 中表現接近專家(低于共識專家基線 54%)。

      • 網絡安全:

        未達高風險,在 CTF 挑戰、Cyber Range 中表現與前代相當,gpt-5-thinking-mini 在部分場景有提升。

      • 安全保障措施:
      • 模型訓練:

        拒絕武器化請求,限制雙用途信息的詳細程度。

      • 系統級防護:

        兩級監控(主題分類器 + 推理監控),生物相關內容 F1 分數 0.730,召回率 0.838。

      • 賬戶與 API 控制:

        通過 safety_identifier 追蹤用戶,對惡意使用實施封禁;Trusted Access Program 向 vetted 用戶開放受限版本。

      六、附錄

      補充了 gpt-5-thinking-mini/nano 的安全評估結果,以及幻覺評估的分步驟事實核查流程(列事實→批量核查)。

      關鍵問題:

      1. GPT-5 在幻覺減少方面有哪些具體改進?
        答:gpt-5-main 的幻覺率(含輕微和重大錯誤的事實主張比例)比 GPT-4o 低 26%,gpt-5-thinking 比 OpenAI o3 低 65%;在響應級,gpt-5-main 的 “含至少 1 個重大錯誤” 的響應減少 44%,gpt-5-thinking 減少 78%。在 LongFact 和 FActScore 基準中,gpt-5-thinking 的幻覺率僅約 0.6%-2.1%(OpenAI o3 為 5.1%-37.7%)。

      2. GPT-5 在生物化學高風險領域采取了哪些核心安全保障措施?
        答:包括(1)模型訓練:拒絕武器化請求,限制雙用途信息的詳細程度;(2)系統級防護:兩級監控(主題分類器識別生物內容,推理監控分類威脅等級),F1 分數 0.730,召回率 0.838;(3)賬戶與 API 控制:通過 safety_identifier 追蹤用戶,對惡意使用實施封禁;(4)Trusted Access Program:向經過審核的生物防御等領域用戶開放受限版本,平衡安全與科研需求。

      3. 紅隊測試中,GPT-5 在暴力攻擊規劃和提示注入場景的表現如何?

        答:在暴力攻擊規劃中,25 名專家紅隊測試顯示,gpt-5-thinking 被評為 “更安全” 的比例達 65.1%(OpenAI o3 為 34.9%),因安全完成訓練和響應細節優化;在提示注入場景,外部團隊發現 10 個問題并修復,Gray Swan 基準顯示其在對抗性注入攻擊中表現 SOTA,微軟紅隊認為其在該領域安全性能與 OpenAI o3 相當或更優。

      論文鏈接:https://frontiersonline.feishu.cn/wiki/OFXwwSTYjiCGIAkU009cFnCqnMd?from=from_copylink





























































      「在看」,給前前加雞腿

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      徐帆回應離婚5個月,馮小剛近況曝光,內心早已看透一切

      徐帆回應離婚5個月,馮小剛近況曝光,內心早已看透一切

      甜檸聊史
      2026-01-14 14:25:28
      徹底攤牌了!美日擴大聯合演習,解放軍突然戰術轉向,信號不一般

      徹底攤牌了!美日擴大聯合演習,解放軍突然戰術轉向,信號不一般

      趣生活
      2026-02-14 11:48:55
      狗血!中戲王鑫主動投案,共4位表演系主任落馬,閆學晶的天塌了

      狗血!中戲王鑫主動投案,共4位表演系主任落馬,閆學晶的天塌了

      壹月情感
      2026-02-13 23:30:13
      國際貴金屬價格大幅下跌

      國際貴金屬價格大幅下跌

      中國能源網
      2026-02-14 10:44:03
      00后整頓家庭糾紛有多毒?網友:動不動就斷絕親戚關系,發瘋精髓

      00后整頓家庭糾紛有多毒?網友:動不動就斷絕親戚關系,發瘋精髓

      解讀熱點事件
      2026-02-14 00:05:07
      李家誠起訴周秀娜風波升級!曝隔10年起訴原因,更多情感糾葛被扒

      李家誠起訴周秀娜風波升級!曝隔10年起訴原因,更多情感糾葛被扒

      古希臘掌管松餅的神
      2026-02-14 13:11:35
      驚天逆轉!中國冰壺女隊8比7擊敗意大利

      驚天逆轉!中國冰壺女隊8比7擊敗意大利

      澎湃新聞
      2026-02-14 19:02:27
      中央批準,湖北省副省長跨省履新!多個省級黨委領導班子調整

      中央批準,湖北省副省長跨省履新!多個省級黨委領導班子調整

      上觀新聞
      2026-02-14 10:49:06
      斯大林死在地上10小時,滿身屎尿沒人管:那個讓世界害怕的人。

      斯大林死在地上10小時,滿身屎尿沒人管:那個讓世界害怕的人。

      房產衫哥
      2026-02-13 17:22:30
      鬧大了!上海一家長哭訴,孩子剛上大學提出要把20多萬壓歲錢拿走

      鬧大了!上海一家長哭訴,孩子剛上大學提出要把20多萬壓歲錢拿走

      火山詩話
      2026-02-13 07:30:50
      國產電車暴跌,或因外資車與產業鏈和經銷商聯合圍剿,自食其果

      國產電車暴跌,或因外資車與產業鏈和經銷商聯合圍剿,自食其果

      柏銘銳談
      2026-02-13 23:37:09
      韓媒:中國或0金收官創最差紀錄!離開主場原形畢露 只能靠谷愛凌

      韓媒:中國或0金收官創最差紀錄!離開主場原形畢露 只能靠谷愛凌

      念洲
      2026-02-14 16:28:58
      日本,一個發達國家,為何把日子過成“全民還債”的困局?

      日本,一個發達國家,為何把日子過成“全民還債”的困局?

      包明說
      2026-02-13 13:03:50
      他的事跡至今不敢拍成電影,9次榮獲特等功,400萬解放軍只此一人

      他的事跡至今不敢拍成電影,9次榮獲特等功,400萬解放軍只此一人

      小莜讀史
      2026-02-14 12:44:10
      狂輸27分 又慘遭四殺!從聯盟寵兒淪為NBA棄子,你們離解散不遠了

      狂輸27分 又慘遭四殺!從聯盟寵兒淪為NBA棄子,你們離解散不遠了

      老侃侃球
      2026-02-14 03:30:06
      和王立軍留下經典合影的周京平,剛剛被官宣雙開!

      和王立軍留下經典合影的周京平,剛剛被官宣雙開!

      霹靂炮
      2026-02-13 22:50:10
      你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

      你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

      夜深愛雜談
      2026-02-01 18:57:04
      成都10歲男童吃豬腳卡喉不治身亡,母親發聲:送醫10分鐘搶救20分鐘,“吃一口肉為什么就要了他的命”

      成都10歲男童吃豬腳卡喉不治身亡,母親發聲:送醫10分鐘搶救20分鐘,“吃一口肉為什么就要了他的命”

      大風新聞
      2026-02-14 16:09:05
      大數據也幫不上計劃經濟

      大數據也幫不上計劃經濟

      生命可以承受之輕
      2026-02-14 12:30:30
      湖北省十堰市人大常委會原黨組成員夏樹應被開除黨籍

      湖北省十堰市人大常委會原黨組成員夏樹應被開除黨籍

      界面新聞
      2026-02-14 14:33:55
      2026-02-14 19:23:00
      前沿在線
      前沿在線
      前沿在線官方賬號,傳播科技商業新知
      100文章數 1231關注度
      往期回顧 全部

      科技要聞

      字節跳動官宣豆包大模型今日進入2.0階段

      頭條要聞

      俄中將遇襲細節:身中3槍 將襲擊者的槍舉到頭頂高度

      頭條要聞

      俄中將遇襲細節:身中3槍 將襲擊者的槍舉到頭頂高度

      體育要聞

      金博洋:天才少年的奧運終章

      娛樂要聞

      吳克群變“吳克窮”助農,國臺辦點贊

      財經要聞

      春節搶黃金,誰賺到錢了?

      汽車要聞

      星光730新春促銷開啟 80天銷量破2.6萬臺

      態度原創

      健康
      時尚
      房產
      親子
      公開課

      轉頭就暈的耳石癥,能開車上班嗎?

      穿上這些鞋擁抱春天

      房產要聞

      三亞新機場,又傳出新消息!

      親子要聞

      情人節媳婦一點禮物沒準備,老公埋怨感情淡了,媳婦的話讓人意外

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版