<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      OpenAI 開源模型被 Meta 研究員“逆改”!只動(dòng)0.3%參數(shù),gpt-oss-20B 解鎖無約束基座

      0
      分享至


      大數(shù)據(jù)文摘出品
      OpenAI在8月初發(fā)布了開放權(quán)重模型家族gpt-oss,這是公司自2019年GPT-2以來首次真正意義上的開源動(dòng)作。

      僅僅兩周后,一位研究者就將這一模型“拆解重組”,推出了與官方版本迥異的變體。

      康奈爾大學(xué)博士生、前Google Brain成員、現(xiàn)任Meta研究員的Jack Morris,公開了名為gpt-oss-20b-base的新版本。


      他并沒有讓模型變得更聰明,而是剝離了OpenAI在訓(xùn)練中添加的推理與對(duì)齊能力。

      結(jié)果是,一個(gè)更快、更自由、更無約束的“原始基座模型”重新出現(xiàn)。

      一、從“推理模型”到“基座模型”的逆轉(zhuǎn)


      地址:http://huggingface.co/jxm/gpt-oss-20b-base

      要理解這一變化,必須先區(qū)分“推理優(yōu)化模型”和“基座模型”。

      OpenAI發(fā)布的gpt-oss屬于前者,它經(jīng)過額外的指令微調(diào)和對(duì)齊,使得模型在回答問題時(shí)更安全、更符合預(yù)期。

      這種做法源自2024年推出的o1模型,強(qiáng)調(diào)鏈?zhǔn)剿季S,讓AI在生成答案前進(jìn)行多步推理與自我檢查。它們?cè)诰幊獭?shù)學(xué)和解釋類任務(wù)上表現(xiàn)優(yōu)異,但往往會(huì)規(guī)避敏感話題。

      相比之下,基座模型是未經(jīng)對(duì)齊的原始形態(tài),它只負(fù)責(zé)預(yù)測(cè)下一個(gè)詞,不具備禮貌、拒絕或安全過濾的機(jī)制。


      Jack Morris的目標(biāo)就是把gpt-oss-20B“逆轉(zhuǎn)”回這種原始形態(tài)。

      他在X平臺(tái)寫道:“我們基本上逆轉(zhuǎn)了LLM訓(xùn)練中的對(duì)齊部分,現(xiàn)在它重新生成自然文本,不再進(jìn)行鏈?zhǔn)酵评恚皇窍褡畛跻粯宇A(yù)測(cè)下一個(gè)token。”

      這種方式讓模型重新具備更廣闊的表達(dá)自由,但同時(shí)也帶來更大的安全風(fēng)險(xiǎn)。

      二、技術(shù)路徑:60M參數(shù)的微小調(diào)整

      Morris并沒有采用常見的“越獄提示詞”,而是直接從模型結(jié)構(gòu)入手。

      在與OpenAI前聯(lián)合創(chuàng)始人、現(xiàn)任Thinking Machines首席科學(xué)家John Schulman交流后,他確定了一個(gè)關(guān)鍵點(diǎn):

      如果大部分預(yù)訓(xùn)練知識(shí)仍然存在,那么只需要一個(gè)低秩的小優(yōu)化,就能讓模型回到基座分布。


      他采用了LoRA(低秩適配器)技術(shù),只在第7、15和23層的MLP模塊做了改動(dòng),秩設(shè)為16。

      這一調(diào)整涉及大約6000萬參數(shù),只占模型總量的0.3%。訓(xùn)練數(shù)據(jù)來自FineWeb數(shù)據(jù)集的2萬篇文檔,訓(xùn)練時(shí)盡量保持接近原始預(yù)訓(xùn)練格式。

      訓(xùn)練過程耗時(shí)四天,硬件配置為8張NVIDIA H200 GPU,學(xué)習(xí)率2e-6,批大小16,最大序列長(zhǎng)度8192。

      完成后,他將LoRA權(quán)重合并回模型,形成一個(gè)可以獨(dú)立運(yùn)行的成品。Morris強(qiáng)調(diào),他并沒有恢復(fù)原始的權(quán)重參數(shù),而是恢復(fù)了輸出分布

      換言之,他讓模型的輸出概率模式更接近基座形態(tài),即使內(nèi)部的權(quán)重并不完全相同。


      三、自由與風(fēng)險(xiǎn):研究者的兩難選擇

      新模型gpt-oss-20b-base的行為與官方版本截然不同。它不再自動(dòng)進(jìn)行推理步驟,而是直接生成更自由的文本。

      這意味著,它會(huì)輸出OpenAI原版模型拒絕生成的指令,例如涉及武器制作、非法行為或粗口內(nèi)容。

      在測(cè)試中,它甚至能夠逐字復(fù)現(xiàn)部分書籍片段,顯示出記憶性內(nèi)容依然可被觸發(fā)。

      不過,痕跡依然存在。如果在提示中使用“Human: … Assistant: …”的對(duì)話模板,它有時(shí)仍會(huì)表現(xiàn)出禮貌的助手風(fēng)格。

      為了獲得最“原始”的輸出,Morris建議使用模型的特殊起始符號(hào)<|startoftext|>,并避免任何聊天模板。

      這也讓研究界看到另一面:開放權(quán)重不僅能被復(fù)用,還能被快速改造

      更值得注意的是,Morris還計(jì)劃將類似的逆轉(zhuǎn)方法應(yīng)用到Qwen等其他開源指令模型上。

      這意味著,“去對(duì)齊化”的趨勢(shì)可能繼續(xù)擴(kuò)散,成為研究者和開發(fā)者探索的又一條分支道路。

      注:頭圖AI生成

      作者長(zhǎng)期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對(duì)這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢(shì)!

      GPU 訓(xùn)練特惠!

      H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開支30%以上!

      掃碼了解詳情?

      點(diǎn)「贊」的人都變好看了哦!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      難以置信!徐萌嫁給87歲的范曾還是“黃花閨女”,妥妥的頭婚…

      難以置信!徐萌嫁給87歲的范曾還是“黃花閨女”,妥妥的頭婚…

      火山詩話
      2025-12-12 07:31:45
      煙臺(tái)劉女士事件升級(jí)!又一商家發(fā)聲,涉案金額已超10萬,攤大事了

      煙臺(tái)劉女士事件升級(jí)!又一商家發(fā)聲,涉案金額已超10萬,攤大事了

      鋭娛之樂
      2025-12-13 08:56:27
      看明白了,2026年春節(jié)要“涼涼”?不是沒錢,而是累得不想再折騰

      看明白了,2026年春節(jié)要“涼涼”?不是沒錢,而是累得不想再折騰

      冷紫葉
      2025-12-13 15:01:11
      4斤黃金鳳冠被毀!千萬粉絲博主稱是“丈夫親手設(shè)計(jì)打造”!網(wǎng)友:那個(gè)小孩碰了不止一下

      4斤黃金鳳冠被毀!千萬粉絲博主稱是“丈夫親手設(shè)計(jì)打造”!網(wǎng)友:那個(gè)小孩碰了不止一下

      極目新聞
      2025-12-13 20:41:48
      被曝出軌,保劍鋒工作室回應(yīng)

      被曝出軌,保劍鋒工作室回應(yīng)

      觀察者網(wǎng)
      2025-12-13 09:59:40
      魔法打敗魔法!銀行辦業(yè)務(wù)被“刁難”,男子報(bào)警要求反查職員身份

      魔法打敗魔法!銀行辦業(yè)務(wù)被“刁難”,男子報(bào)警要求反查職員身份

      火山詩話
      2025-12-14 06:33:29
      見證歷史,中國籃球出現(xiàn)最奇葩比賽,CBA徹底成了大笑話

      見證歷史,中國籃球出現(xiàn)最奇葩比賽,CBA徹底成了大笑話

      宗介說體育
      2025-12-13 15:46:24
      官方:2026年,力爭(zhēng)全國基本實(shí)現(xiàn)生娃不花錢

      官方:2026年,力爭(zhēng)全國基本實(shí)現(xiàn)生娃不花錢

      南方都市報(bào)
      2025-12-13 17:54:15
      難以置信!10年無人發(fā)現(xiàn)993萬流失,政務(wù)大廳居然放置個(gè)人收款碼

      難以置信!10年無人發(fā)現(xiàn)993萬流失,政務(wù)大廳居然放置個(gè)人收款碼

      火山詩話
      2025-12-13 06:53:21
      泰國轟炸柬埔寨電詐園區(qū),效果比反詐軟件好多了

      泰國轟炸柬埔寨電詐園區(qū),效果比反詐軟件好多了

      歷史總在押韻
      2025-12-13 00:33:27
      佳能給員工發(fā)63萬,平臺(tái)刪視頻,誰在怕勞動(dòng)者體面?

      佳能給員工發(fā)63萬,平臺(tái)刪視頻,誰在怕勞動(dòng)者體面?

      網(wǎng)絡(luò)易不易
      2025-12-13 17:52:51
      內(nèi)江市人大常委會(huì)原一級(jí)巡視員陳偉全被查

      內(nèi)江市人大常委會(huì)原一級(jí)巡視員陳偉全被查

      愛看頭條
      2025-12-13 18:47:06
      常態(tài)化暴打日本!全球圍觀吃瓜!更狠的就要來了!

      常態(tài)化暴打日本!全球圍觀吃瓜!更狠的就要來了!

      一個(gè)壞土豆
      2025-12-12 19:49:47
      湖北十堰市委書記黃劍雄任宜昌市委書記

      湖北十堰市委書記黃劍雄任宜昌市委書記

      澎湃新聞
      2025-12-13 22:00:27
      3名美方人員遇襲死亡,特朗普誓言報(bào)復(fù)

      3名美方人員遇襲死亡,特朗普誓言報(bào)復(fù)

      新京報(bào)政事兒
      2025-12-14 07:22:53
      利物浦2-0布萊頓!4輪不敗暫升第6 新援閃擊+雙響 薩拉赫替補(bǔ)助攻

      利物浦2-0布萊頓!4輪不敗暫升第6 新援閃擊+雙響 薩拉赫替補(bǔ)助攻

      我愛英超
      2025-12-14 01:04:34
      66個(gè)寒冷預(yù)警,冷空氣已全面影響廣東!周日或下周一早晨,將出現(xiàn)最低溫

      66個(gè)寒冷預(yù)警,冷空氣已全面影響廣東!周日或下周一早晨,將出現(xiàn)最低溫

      南方都市報(bào)
      2025-12-13 22:40:44
      霸王餐女后續(xù):賬號(hào)被扒連夜清空作品,知情人曝更多,早有目的

      霸王餐女后續(xù):賬號(hào)被扒連夜清空作品,知情人曝更多,早有目的

      阿纂看事
      2025-12-13 09:24:46
      10人聚餐逃單后續(xù):組局人身份被扒,拒不付餐費(fèi),結(jié)局大快人心

      10人聚餐逃單后續(xù):組局人身份被扒,拒不付餐費(fèi),結(jié)局大快人心

      李健政觀察
      2025-12-13 16:15:45
      中山佳能都解散了!為啥還要這樣?安保、綠化、保潔舉動(dòng)讓人淚目

      中山佳能都解散了!為啥還要這樣?安保、綠化、保潔舉動(dòng)讓人淚目

      火山詩話
      2025-12-13 08:43:56
      2025-12-14 08:31:00
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專注大數(shù)據(jù),每日有分享!
      6806文章數(shù) 94518關(guān)注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態(tài)

      頭條要聞

      女子225個(gè)快遞"僅退款"被披露后又有商家發(fā)聲:也是她

      頭條要聞

      女子225個(gè)快遞"僅退款"被披露后又有商家發(fā)聲:也是她

      體育要聞

      有了風(fēng)騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      插刀門后,印小天一舉動(dòng)實(shí)現(xiàn)口碑逆轉(zhuǎn)

      財(cái)經(jīng)要聞

      鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

      汽車要聞

      表面風(fēng)平浪靜 內(nèi)里翻天覆地!試駕銀河星艦7 EM-i

      態(tài)度原創(chuàng)

      藝術(shù)
      親子
      數(shù)碼
      公開課
      軍事航空

      藝術(shù)要聞

      廣東最美景點(diǎn)超全整理,果斷收藏!!

      親子要聞

      七小七:用清潔配方重新定義兒童食品健康標(biāo)準(zhǔn),獲雙品類銷量第一

      數(shù)碼要聞

      1399元 鐵威馬發(fā)布M.2硬盤盒:支持雷電5 6GB文件1秒傳

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄烏“和平計(jì)劃”磋商頓巴斯成焦點(diǎn)

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 又粗又大中文字幕| 97精品官网国产户外| 九一九色国产| 一本一本久久aa综合精品| 亚洲欧洲AV| 人妻丰满熟妇av无码区| 国产香蕉AV| 亚洲综合国产色| 久久久久国产精品熟女影院| 伊人久在线观看视频| 亚洲最大三级网站| 灵璧县| 经典国产乱子伦精品视频| 国产天堂亚洲国产碰碰| 综合欧美视频一区二区三区| 日本中文字幕色| 亚洲色欲久久久综合网东京热| 久久久无码精品午夜| 潮喷失禁大喷水aⅴ无码| 国产成人av免费观看| 亚洲成人电影院| 久久精品女人天堂av| 精精国产xxxx视频在线播放| 亚洲综合色婷婷中文字幕| 亚洲日韩AV无码专区影院| 人妻中文字幕精品| 特黄特色的大片观看免费视频| 亚洲国产初高中生女av| jizz日本版| 欧美精品一卡| 欧美成人aaa片一区国产精品| 国产午夜福利精品久久不卡| 日韩色导航| 色欲天天色| 成人做爰69片免费看网站野花| 久久国产精99精产国高潮| 国产丝袜AV| 色欲AV涩爱AV蜜芽AV三区| 最新国产精品亚洲| 国产喷水1区2区3区咪咪爱AV| 中文日韩欧美|