<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenAI 開源模型被 Meta 研究員“逆改”!只動0.3%參數,gpt-oss-20B 解鎖無約束基座

      0
      分享至


      大數據文摘出品
      OpenAI在8月初發布了開放權重模型家族gpt-oss,這是公司自2019年GPT-2以來首次真正意義上的開源動作。

      僅僅兩周后,一位研究者就將這一模型“拆解重組”,推出了與官方版本迥異的變體。

      康奈爾大學博士生、前Google Brain成員、現任Meta研究員的Jack Morris,公開了名為gpt-oss-20b-base的新版本。


      他并沒有讓模型變得更聰明,而是剝離了OpenAI在訓練中添加的推理與對齊能力。

      結果是,一個更快、更自由、更無約束的“原始基座模型”重新出現。

      一、從“推理模型”到“基座模型”的逆轉


      地址:http://huggingface.co/jxm/gpt-oss-20b-base

      要理解這一變化,必須先區分“推理優化模型”和“基座模型”。

      OpenAI發布的gpt-oss屬于前者,它經過額外的指令微調和對齊,使得模型在回答問題時更安全、更符合預期。

      這種做法源自2024年推出的o1模型,強調鏈式思維,讓AI在生成答案前進行多步推理與自我檢查。它們在編程、數學和解釋類任務上表現優異,但往往會規避敏感話題。

      相比之下,基座模型是未經對齊的原始形態,它只負責預測下一個詞,不具備禮貌、拒絕或安全過濾的機制。


      Jack Morris的目標就是把gpt-oss-20B“逆轉”回這種原始形態。

      他在X平臺寫道:“我們基本上逆轉了LLM訓練中的對齊部分,現在它重新生成自然文本,不再進行鏈式推理,只是像最初一樣預測下一個token。”

      這種方式讓模型重新具備更廣闊的表達自由,但同時也帶來更大的安全風險。

      二、技術路徑:60M參數的微小調整

      Morris并沒有采用常見的“越獄提示詞”,而是直接從模型結構入手。

      在與OpenAI前聯合創始人、現任Thinking Machines首席科學家John Schulman交流后,他確定了一個關鍵點:

      如果大部分預訓練知識仍然存在,那么只需要一個低秩的小優化,就能讓模型回到基座分布。


      他采用了LoRA(低秩適配器)技術,只在第7、15和23層的MLP模塊做了改動,秩設為16。

      這一調整涉及大約6000萬參數,只占模型總量的0.3%。訓練數據來自FineWeb數據集的2萬篇文檔,訓練時盡量保持接近原始預訓練格式。

      訓練過程耗時四天,硬件配置為8張NVIDIA H200 GPU,學習率2e-6,批大小16,最大序列長度8192。

      完成后,他將LoRA權重合并回模型,形成一個可以獨立運行的成品。Morris強調,他并沒有恢復原始的權重參數,而是恢復了輸出分布

      換言之,他讓模型的輸出概率模式更接近基座形態,即使內部的權重并不完全相同。


      三、自由與風險:研究者的兩難選擇

      新模型gpt-oss-20b-base的行為與官方版本截然不同。它不再自動進行推理步驟,而是直接生成更自由的文本。

      這意味著,它會輸出OpenAI原版模型拒絕生成的指令,例如涉及武器制作、非法行為或粗口內容。

      在測試中,它甚至能夠逐字復現部分書籍片段,顯示出記憶性內容依然可被觸發。

      不過,痕跡依然存在。如果在提示中使用“Human: … Assistant: …”的對話模板,它有時仍會表現出禮貌的助手風格。

      為了獲得最“原始”的輸出,Morris建議使用模型的特殊起始符號<|startoftext|>,并避免任何聊天模板。

      這也讓研究界看到另一面:開放權重不僅能被復用,還能被快速改造

      更值得注意的是,Morris還計劃將類似的逆轉方法應用到Qwen等其他開源指令模型上。

      這意味著,“去對齊化”的趨勢可能繼續擴散,成為研究者和開發者探索的又一條分支道路。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      伊朗國防部隊: 進入全面備戰狀態

      伊朗國防部隊: 進入全面備戰狀態

      每日經濟新聞
      2026-02-19 16:07:49
      意大利知名地標“愛情拱門”突然崩塌,永久消失,當地市長:曾有成千上萬的情侶來打卡,旅游業遭“毀滅性打擊”

      意大利知名地標“愛情拱門”突然崩塌,永久消失,當地市長:曾有成千上萬的情侶來打卡,旅游業遭“毀滅性打擊”

      大風新聞
      2026-02-17 19:26:03
      南京一商場晚上突發火災,看電影的觀眾緊急逃生,應急部門:火已撲滅,無人傷亡

      南京一商場晚上突發火災,看電影的觀眾緊急逃生,應急部門:火已撲滅,無人傷亡

      極目新聞
      2026-02-19 12:49:48
      浙江一地通知:即日起全域禁止銷售

      浙江一地通知:即日起全域禁止銷售

      都市快報橙柿互動
      2026-02-19 17:58:37
      后續,江蘇一家人吃飯父親酒后掀桌,兒子透露更多,以后不回家了

      后續,江蘇一家人吃飯父親酒后掀桌,兒子透露更多,以后不回家了

      離離言幾許
      2026-02-18 23:24:35
      第3金還要耐心等待!天公不作美,中國隊冬奧熱門沖金項再次延期

      第3金還要耐心等待!天公不作美,中國隊冬奧熱門沖金項再次延期

      全景體育V
      2026-02-19 10:10:31
      南方大米產量第一,為啥超市里大部分還是東北米?南方米去哪了?

      南方大米產量第一,為啥超市里大部分還是東北米?南方米去哪了?

      天下十三洲獵奇
      2026-02-18 23:53:55
      突發!美國出手封殺多家中國機構

      突發!美國出手封殺多家中國機構

      芯火相承
      2026-02-19 10:02:18
      42歲王濛再破天花板!退役12年,再次讓李琰和整個冰壇“沉默”了

      42歲王濛再破天花板!退役12年,再次讓李琰和整個冰壇“沉默”了

      翰飛觀事
      2026-02-16 11:29:39
      林丹在西班牙過年,別墅內景曝光,全家人與朋友除夕吃海鮮大餐

      林丹在西班牙過年,別墅內景曝光,全家人與朋友除夕吃海鮮大餐

      手工制作阿殲
      2026-02-19 11:58:33
      再立新功!俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

      再立新功!俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

      軍迷戰情室
      2026-02-18 23:58:09
      2018年,張扣扣向王家復仇,唯獨不殺王自新妻子:她有不死的理由

      2018年,張扣扣向王家復仇,唯獨不殺王自新妻子:她有不死的理由

      米果說識
      2026-02-19 09:32:34
      凌晨發送恐嚇信息?桔子酒店涉事門店:已報警,非員工發送

      凌晨發送恐嚇信息?桔子酒店涉事門店:已報警,非員工發送

      大風新聞
      2026-02-19 09:46:23
      12死!湖北煙花店爆炸:店主身份被扒,大量內幕披露,知情者發聲

      12死!湖北煙花店爆炸:店主身份被扒,大量內幕披露,知情者發聲

      博士觀察
      2026-02-19 00:06:41
      2月17日俄烏最新: 2.5 年來的最大戰果

      2月17日俄烏最新: 2.5 年來的最大戰果

      西樓飲月
      2026-02-17 20:49:47
      湖北12死煙花爆燃:死者身份公布,大量內部照流出,責任人被控制

      湖北12死煙花爆燃:死者身份公布,大量內部照流出,責任人被控制

      博士觀察
      2026-02-19 11:41:09
      尹錫悅庭審細節曝光:被判無期只瞥了一眼法官,離庭時與律師相視一笑!法官闡述為何不判死刑

      尹錫悅庭審細節曝光:被判無期只瞥了一眼法官,離庭時與律師相視一笑!法官闡述為何不判死刑

      紅星新聞
      2026-02-19 17:28:30
      太尷尬了!大年初一,上海網友哭訴稱大門被鄰居貼兩張“大字報”

      太尷尬了!大年初一,上海網友哭訴稱大門被鄰居貼兩張“大字報”

      火山詩話
      2026-02-19 15:05:12
      襄陽宜城煙花店才50多平米,要了12條人命!最害人的,或是防盜網

      襄陽宜城煙花店才50多平米,要了12條人命!最害人的,或是防盜網

      火山詩話
      2026-02-19 13:50:13
      坐3.6億飛機,戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      坐3.6億飛機,戴1000萬名表,拿5000萬炒股的秦奮究竟什么背景

      涵豆說娛
      2026-01-19 17:21:55
      2026-02-19 18:43:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6825文章數 94529關注度
      往期回顧 全部

      科技要聞

      怒燒45億,騰訊字節阿里決戰春節

      頭條要聞

      媒體:高市2.0 日本政局發生了意料之中的變動

      頭條要聞

      媒體:高市2.0 日本政局發生了意料之中的變動

      體育要聞

      中國隊第二金!徐夢桃贏女子空中技巧兩連冠 邵琪銅牌

      娛樂要聞

      明星過年百態!黃曉明等現身三亞

      財經要聞

      面條火腿香菇醬!上市公司這些年請你吃

      汽車要聞

      量產甲醇插混 吉利銀河星耀6甲醇插混版申報圖

      態度原創

      藝術
      本地
      數碼
      公開課
      軍事航空

      藝術要聞

      震驚!安徒生竟是畫家,他的田園生活太美了!

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      數碼要聞

      內存價格崩了 國內最高降價20%:去華強北市場揭秘實情!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      金正恩出席火箭炮贈送儀式 強調確保朝鮮安全環境

      無障礙瀏覽 進入關懷版