<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<noscript id="x5gjc"></noscript>

<sub id="x5gjc"></sub>

<cite id="x5gjc"></cite>

<legend id="x5gjc"><track id="x5gjc"></track></legend>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

OpenAI 開源模型被 Meta 研究員“逆改”！只動0.3%參數，gpt-oss-20B 解鎖無約束基座

2025-08-18 18:57:00　來源: 大數據文摘

北京舉報

0

分享至

大數據文摘出品
OpenAI在8月初發布了開放權重模型家族gpt-oss，這是公司自2019年GPT-2以來首次真正意義上的開源動作。

僅僅兩周后，一位研究者就將這一模型“拆解重組”，推出了與官方版本迥異的變體。

康奈爾大學博士生、前Google Brain成員、現任Meta研究員的Jack Morris，公開了名為gpt-oss-20b-base的新版本。

他并沒有讓模型變得更聰明，而是剝離了OpenAI在訓練中添加的推理與對齊能力。

結果是，一個更快、更自由、更無約束的“原始基座模型”重新出現。

一、從“推理模型”到“基座模型”的逆轉

地址：http://huggingface.co/jxm/gpt-oss-20b-base

要理解這一變化，必須先區分“推理優化模型”和“基座模型”。

OpenAI發布的gpt-oss屬于前者，它經過額外的指令微調和對齊，使得模型在回答問題時更安全、更符合預期。

這種做法源自2024年推出的o1模型，強調鏈式思維，讓AI在生成答案前進行多步推理與自我檢查。它們在編程、數學和解釋類任務上表現優異，但往往會規避敏感話題。

相比之下，基座模型是未經對齊的原始形態，它只負責預測下一個詞，不具備禮貌、拒絕或安全過濾的機制。

Jack Morris的目標就是把gpt-oss-20B“逆轉”回這種原始形態。

他在X平臺寫道：“我們基本上逆轉了LLM訓練中的對齊部分，現在它重新生成自然文本，不再進行鏈式推理，只是像最初一樣預測下一個token。”

這種方式讓模型重新具備更廣闊的表達自由，但同時也帶來更大的安全風險。

二、技術路徑：60M參數的微小調整

Morris并沒有采用常見的“越獄提示詞”，而是直接從模型結構入手。

在與OpenAI前聯合創始人、現任Thinking Machines首席科學家John Schulman交流后，他確定了一個關鍵點：

如果大部分預訓練知識仍然存在，那么只需要一個低秩的小優化，就能讓模型回到基座分布。

他采用了LoRA（低秩適配器）技術，只在第7、15和23層的MLP模塊做了改動，秩設為16。

這一調整涉及大約6000萬參數，只占模型總量的0.3%。訓練數據來自FineWeb數據集的2萬篇文檔，訓練時盡量保持接近原始預訓練格式。

訓練過程耗時四天，硬件配置為8張NVIDIA H200 GPU，學習率2e-6，批大小16，最大序列長度8192。

完成后，他將LoRA權重合并回模型，形成一個可以獨立運行的成品。Morris強調，他并沒有恢復原始的權重參數，而是恢復了輸出分布。

換言之，他讓模型的輸出概率模式更接近基座形態，即使內部的權重并不完全相同。

三、自由與風險：研究者的兩難選擇

新模型gpt-oss-20b-base的行為與官方版本截然不同。它不再自動進行推理步驟，而是直接生成更自由的文本。

這意味著，它會輸出OpenAI原版模型拒絕生成的指令，例如涉及武器制作、非法行為或粗口內容。

在測試中，它甚至能夠逐字復現部分書籍片段，顯示出記憶性內容依然可被觸發。

不過，痕跡依然存在。如果在提示中使用“Human: … Assistant: …”的對話模板，它有時仍會表現出禮貌的助手風格。

為了獲得最“原始”的輸出，Morris建議使用模型的特殊起始符號<|startoftext|>，并避免任何聊天模板。

這也讓研究界看到另一面：開放權重不僅能被復用，還能被快速改造。

更值得注意的是，Morris還計劃將類似的逆轉方法應用到Qwen等其他開源指令模型上。

這意味著，“去對齊化”的趨勢可能繼續擴散，成為研究者和開發者探索的又一條分支道路。

注：頭圖AI生成

作者長期關注 AI 產業與學術，歡迎對這些方向感興趣的朋友添加微信Q1yezi，共同交流行業動態與技術趨勢！

GPU 訓練特惠！

H100/H200 GPU算力按秒計費，平均節省開支30%以上！

掃碼了解詳情?

點「贊」的人都變好看了哦！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
21 跟貼 21
讓LLM不再話癆，快手HiPO框架來了

機器之心Pro 2025-11-03 15:10:48
0 跟貼 0

Claude最新Sonnet：Opus級智能，性價比王炸，OpenClaw天選API

量子位 2026-02-18 16:13:32
5 跟貼 5

OpenAI下架4o真是為了給自己和富豪們續命嗎？

DeepTech深科技 2026-02-17 14:15:19
1 跟貼 1
懂人性更懂執行，螞蟻這個萬億開源模型把情商和戰斗力都給拉滿了

量子位 2026-02-19 12:45:37
2 跟貼 2

PixelRefer ：讓AI從“看大圖”走向“看懂每個對象”

機器之心Pro 2025-11-11 12:49:23
0 跟貼 0

你刷到的視頻是真的么？用物理規律拆穿Sora謊言

機器之心Pro 2025-11-05 16:27:02
0 跟貼 0
Meta 內部研究揭示：家長監督對防止青少年沉迷社交媒體幾乎無效

中國能源網 2026-02-18 12:38:05
1 跟貼 1

OpenAI正敲定1000億美元巨額融資輪的首批投資承諾

財聯社 2026-02-19 10:30:07
1 跟貼 1
Meta擴大與英偉達合作，行業競爭態勢加劇

經濟觀察報 2026-02-19 13:18:05
2 跟貼 2
美媒：Meta因社媒“危害兒童心理健康”被起訴，扎克伯格首次出庭，作證超5小時

環球網資訊 2026-02-19 12:53:04
1 跟貼 1
西班牙政府調查X、Meta、TikTok，AI涉兒童性虐待材料

IT之家 2026-02-18 12:33:36
2 跟貼 2
【美股盤前】黃仁勛：為GTC 2026準備了多款前所未見的新芯片；英偉達清倉Arm全部股份；Meta重啟智能手表計劃，計劃2026年推出；OpenAI最

每日經濟新聞 2026-02-19 17:52:31
0 跟貼 0
中國春晚機器人表演火到國外了，外媒：用機器人執行復雜戰斗序列

車馬點兵V 2026-02-17 17:23:16
40 跟貼 40
近日，青海。車主自駕青海遇男子招手搭車，男子去快遞站給孩子們取過冬物資，車主好心送男子去學校，車主：

中安在線 2026-02-18 22:00:26
122 跟貼 122
Jeff Dean萬字訪談：我們正在殺死割裂AI應用，2026是大一統元年

DeepTech深科技 2026-02-18 20:02:25
4 跟貼 4
媒體：馬克龍真魔怔了在印度還暗戳戳提中國

澎湃新聞 2026-02-18 22:58:24
1737 跟貼 1737
內蒙古草原名場面！狼偷不著羊，就跟藏獒貼貼，網友：前狼假寐，蓋以誘敵

BRTV新聞 2026-02-19 07:15:56
148 跟貼 148
印度一大學拿中國機器狗冒充自研

環球時報 2026-02-18 16:09:05
2162 跟貼 2162
人類幼崽好像聽懂媽媽指令，就要奶奶抱抱，最后的小眼神太可愛了

植平影像 2026-02-18 06:00:00
0 跟貼 0
六年級數學求面積，等高模型

天天數理學習分享 2026-02-15 17:19:33
3 跟貼 3
匈牙利、斯洛伐克宣布暫停向烏克蘭出口柴油

財聯社 2026-02-18 23:58:05
2280 跟貼 2280
反向過年新潮流：老外扎堆來中國，單日飛三亞外國游客大增3倍

每日經濟新聞 2026-02-15 11:30:33
2647 跟貼 2647
國服關羽蘇打鋒發現關羽馬年皮膚隱藏機制，局內血條隱藏術

挽風游戲解說 2026-02-18 18:52:10
5 跟貼 5
小伙徒手搓出一輛考斯特汽車模型，真的是太牛了

宸宸愛發明V 2026-02-15 13:44:08
4 跟貼 4
谷歌Gemini上線AI音樂創作，一夜革了Suno的命！

新智元 2026-02-19 12:39:23
2 跟貼 2
廣場舞伴日常相處，美女發出指令讓大爺心急，欲擒故縱拿捏住！

婷婷搞笑社 2026-02-18 06:36:00
0 跟貼 0
“爸媽來后冰箱都變老了！”網友：原來全國都這樣

都市快報橙柿互動 2026-02-18 00:22:49
1032 跟貼 1032
神秘金字塔基座

奇奇趣世界 2026-02-18 10:49:40
1 跟貼 1
撿回的小狗順順能聽懂吃奶指令，卻不讓抱！

新劇梟雄 2026-02-17 18:55:23
0 跟貼 0
利用模型制作水泥柱子！

焦點視訊 2026-02-15 12:05:20
0 跟貼 0
初中數學水桶模型求面積

天天數理學習分享 2026-02-16 10:16:41
4 跟貼 4
美軍開打前夕，俄交武器中方出手，殲20模型抵伊朗

戰武科普 2026-02-19 11:39:39
0 跟貼 0
法國1萬人村莊連續10年自費過春節

極目新聞 2026-02-19 11:18:51
635 跟貼 635
特斯拉車友會，一個指令控制所有車，這一幕細思極恐！

旅行小友俠 2026-02-19 00:06:00
0 跟貼 0
春晚之后，AI和機器人為啥都去了一個地方？

量子位 2026-02-19 12:40:49
5 跟貼 5
爸爸對雙胞胎下指令，寶寶反應整齊劃一，為了口吃的太配合！

瘋狂幽默俱樂部 2026-02-16 14:49:00
0 跟貼 0
領班給后廚下達指令，一個說沒錯，一個氣到崩潰！

365天周游世界旅游 2026-02-19 08:23:00
0 跟貼 0
全球第一高樓的迪拜哈利法塔，如何建造在沙漠上？為何要全天通電

米師傅安裝 2026-02-19 17:05:23
0 跟貼 0
PS5到PS6的躍升比PS4到PS5還大！升級幅度引熱議

游民星空 2026-02-19 17:06:22
0 跟貼 0

伊朗國防部隊：進入全面備戰狀態

伊朗國防部隊：進入全面備戰狀態

每日經濟新聞

2026-02-19 16:07:49

意大利知名地標“愛情拱門”突然崩塌，永久消失，當地市長：曾有成千上萬的情侶來打卡，旅游業遭“毀滅性打擊”

意大利知名地標“愛情拱門”突然崩塌，永久消失，當地市長：曾有成千上萬的情侶來打卡，旅游業遭“毀滅性打擊”

大風新聞

2026-02-17 19:26:03

南京一商場晚上突發火災，看電影的觀眾緊急逃生，應急部門：火已撲滅，無人傷亡

南京一商場晚上突發火災，看電影的觀眾緊急逃生，應急部門：火已撲滅，無人傷亡

極目新聞

2026-02-19 12:49:48

浙江一地通知：即日起全域禁止銷售

浙江一地通知：即日起全域禁止銷售

都市快報橙柿互動

2026-02-19 17:58:37

后續，江蘇一家人吃飯父親酒后掀桌，兒子透露更多，以后不回家了

后續，江蘇一家人吃飯父親酒后掀桌，兒子透露更多，以后不回家了

離離言幾許

2026-02-18 23:24:35

第3金還要耐心等待！天公不作美，中國隊冬奧熱門沖金項再次延期

第3金還要耐心等待！天公不作美，中國隊冬奧熱門沖金項再次延期

全景體育V

2026-02-19 10:10:31

南方大米產量第一，為啥超市里大部分還是東北米？南方米去哪了？

南方大米產量第一，為啥超市里大部分還是東北米？南方米去哪了？

天下十三洲獵奇

2026-02-18 23:53:55

突發！美國出手封殺多家中國機構

突發！美國出手封殺多家中國機構

芯火相承

2026-02-19 10:02:18

42歲王濛再破天花板！退役12年，再次讓李琰和整個冰壇“沉默”了

42歲王濛再破天花板！退役12年，再次讓李琰和整個冰壇“沉默”了

翰飛觀事

2026-02-16 11:29:39

林丹在西班牙過年，別墅內景曝光，全家人與朋友除夕吃海鮮大餐

林丹在西班牙過年，別墅內景曝光，全家人與朋友除夕吃海鮮大餐

手工制作阿殲

2026-02-19 11:58:33

再立新功！俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

再立新功！俄價值超1.2億美元的S-300VM與道爾防空系統遭摧毀

軍迷戰情室

2026-02-18 23:58:09

2018年，張扣扣向王家復仇，唯獨不殺王自新妻子：她有不死的理由

2018年，張扣扣向王家復仇，唯獨不殺王自新妻子：她有不死的理由

米果說識

2026-02-19 09:32:34

凌晨發送恐嚇信息？桔子酒店涉事門店：已報警，非員工發送

凌晨發送恐嚇信息？桔子酒店涉事門店：已報警，非員工發送

大風新聞

2026-02-19 09:46:23

12死！湖北煙花店爆炸：店主身份被扒，大量內幕披露，知情者發聲

12死！湖北煙花店爆炸：店主身份被扒，大量內幕披露，知情者發聲

博士觀察

2026-02-19 00:06:41

2月17日俄烏最新： 2.5 年來的最大戰果

2月17日俄烏最新： 2.5 年來的最大戰果

西樓飲月

2026-02-17 20:49:47

湖北12死煙花爆燃：死者身份公布，大量內部照流出，責任人被控制

湖北12死煙花爆燃：死者身份公布，大量內部照流出，責任人被控制

博士觀察

2026-02-19 11:41:09

尹錫悅庭審細節曝光：被判無期只瞥了一眼法官，離庭時與律師相視一笑！法官闡述為何不判死刑

尹錫悅庭審細節曝光：被判無期只瞥了一眼法官，離庭時與律師相視一笑！法官闡述為何不判死刑

紅星新聞

2026-02-19 17:28:30

太尷尬了！大年初一，上海網友哭訴稱大門被鄰居貼兩張“大字報”

太尷尬了！大年初一，上海網友哭訴稱大門被鄰居貼兩張“大字報”

火山詩話

2026-02-19 15:05:12

襄陽宜城煙花店才50多平米，要了12條人命！最害人的，或是防盜網

襄陽宜城煙花店才50多平米，要了12條人命！最害人的，或是防盜網

火山詩話

2026-02-19 13:50:13

坐3.6億飛機，戴1000萬名表，拿5000萬炒股的秦奮究竟什么背景

坐3.6億飛機，戴1000萬名表，拿5000萬炒股的秦奮究竟什么背景

涵豆說娛

2026-01-19 17:21:55

大數據文摘

專注大數據，每日有分享！

6825文章數 94529關注度

往期回顧全部

科技要聞

怒燒45億，騰訊字節阿里決戰春節

頭條要聞

媒體：高市2.0 日本政局發生了意料之中的變動

頭條要聞

媒體：高市2.0 日本政局發生了意料之中的變動

體育要聞

中國隊第二金！徐夢桃贏女子空中技巧兩連冠邵琪銅牌

娛樂要聞

明星過年百態！黃曉明等現身三亞

財經要聞

面條火腿香菇醬！上市公司這些年請你吃

汽車要聞

量產甲醇插混吉利銀河星耀6甲醇插混版申報圖

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

本地

數碼

公開課

軍事航空

藝術要聞

震驚！安徒生竟是畫家，他的田園生活太美了！

本地新聞

春花齊放2026：《駿馬奔騰迎新歲》

數碼要聞

內存價格崩了國內最高降價20%：去華強北市場揭秘實情！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

軍事要聞

金正恩出席火箭炮贈送儀式強調確保朝鮮安全環境

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

^{<blockquote id="m61ak"></blockquote>}