作者|畢樂天
來源|AI先鋒官
如果你沒有時間看,沒關系,我制作了播客,在聽的過程你可以忙些自己的事情
你最近肯定被GPT-5的消息刷屏了吧?
各種泄露、各種爆料。
OpenAI的CEO山姆·奧特曼(Sam Altman)更是親自下場,把氣氛烘托到了極致。
![]()
最近的一個播客節目中,奧特曼說,測試GPT-5的時候,自己被“嚇到了”。
甚至,這讓他想起了“曼哈頓計劃”。
他喃喃自語:“我們都干了些什么?”
他還說,感覺現在就像“屋里沒有一個大人”,技術發展快到要失控了。
有一次,一個他自己都搞不懂的難題,GPT-5“唰”一下就解決了,讓他感覺自己“毫無用處”。
聽起來,這哪是發布新產品,簡直是要放出什么嚇人的怪物。
![]()
但一份來自外媒《The Information》的深度爆料,又給GPT-5潑來一盆冷水。
報道說,GPT-5會有實質性進步,但絕不是從GPT-3到GPT-4那種“量子飛躍”。
據兩位參與開發的內部人士透露,當 OpenAI 的研究人員將這款新 AI 轉化為一個名為 o3 的聊天版本,以便響應 ChatGPT 用戶的指令時,公司此前公布的性能增益基本上煙消云散了。
這一事件恰恰是 OpenAI 今年以來所面臨技術挑戰的一個縮影,這些挑戰不僅威脅著其 AI 技術的進步速度,甚至可能影響其轟動一時的 ChatGPT 業務。
不過,其研究人員已經找到了通過在全行業興起的技術來保持 AI 進步的方法。
據使用過或熟悉該公司內部評估的人士透露,OpenAI 目前即將發布其下一代旗艦 AI 模型 GPT-5。該模型在完成實用的計算機編程和數學任務等方面,相較于現有模型有了顯著提升。
例如,其中一位知情人士表示,當新模型編寫應用程序代碼時,它能更好地添加功能,使應用更易于使用、界面也更美觀。
這位人士還說,GPT-5 在驅動 AI 智能體(AI agent)方面也比其前輩更勝一籌,這些 AI 智能體能在極少的人工監督下處理復雜任務。例如,它能遵循復雜的指令,比如根據一系列規則來判斷自動化客服 AI 智能體何時應該批準退款。
這位人士補充道,以前的模型需要通過學習多個棘手的客戶案例(即所謂的“邊緣案例”)才能處理這類退款請求。
其中一位知情人士表示,**這次的改進將無法與早期 GPT 系列模型之間的性能飛躍相提并論,比如 2020 年的 GPT-3 到 2023 年的 GPT-4 之間的巨大提升。**OpenAI 在過去 12 個月里經歷的性能增益放緩表明,至少在 AI 能力方面,該公司可能難以大幅領先其最大的競爭對手。
然而,OpenAI 當前的模型通過驅動聊天機器人和其他應用程序已經創造了巨大的商業價值,因此任何改進,哪怕是漸進式的,都將增加客戶需求。這些改進也可能給新投資者帶來信心,支持該公司在未來三年半內燒掉 450 億美元的計劃,用于租賃昂貴的服務器來開發和運行其產品。
這真是個有趣的現象
為什么奧特曼覺得內部模型強到“嚇人”,而我們平時用的ChatGPT卻感覺時好時壞,甚至有點“人工智障”?
因為OpenAI內部的那個超級模型,我們可以稱之為 “教師模型”。它是個不折不扣的天才,用自己獨特的、非人類的方式思考,極其強大。
例如,o3的“教師模型”被投入了更多的英偉達芯片,并被賦予了上網查資料、翻代碼庫的能力,使其在理解科學等領域取得了非凡進步。
但當這個“教師模型”要變成我們能用的ChatGPT時,它就必須被“降維”改造成 “學生模型”。
這個過程,就像你讓一個諾貝爾物理學獎得主(教師),用30秒的短視頻(學生),給小學生解釋什么是量子力學。
他能解釋,但那些深邃的思想、復雜的邏輯,全都在這個過程中被壓縮、被簡化,甚至被扭曲了。
爆料指出,當研究人員將強大的o3教師模型轉化為聊天版本時,其性能增益顯著下降,表現并不比前代o1好多少。
原因就是模型獨特的思考方式,很難用人類語言完美轉述,而且OpenAI也沒有足夠重視訓練它如何與人類順暢溝通。
說了這么多問題,難道GPT-5就沒啥盼頭了?當然不是。正是因為遇到了瓶頸,才逼出了真正的創新。
它的進步,體現在從“更大”到“更巧”。
1. 更聰明的“管家”GPT-5學會了智能分配“腦力”。
2. 它能判斷任務的復雜程度,簡單問題快速回答,節省算力;復雜問題則投入更多資源深度思考。在不大幅增加計算消耗的情況下,輸出更高質量的答案。
3. 程序員的超級外掛GPT-5把寶押在了自動化編程上。
4. 無論是主模型還是迷你版,代碼能力都有巨大提升。它能生成更清晰、功能更豐富的代碼,處理各種棘手的邊緣案例,甚至讓生成的應用界面更美觀易用。這不僅對企業客戶是剛需,還能解放OpenAI自己的研究員,讓他們用AI來開發AI,形成加速循環。
5. 秘密武器:“通用驗證器”。
6. 這可能是OpenAI真正的王牌。他們內部搞了一個叫 “通用驗證器”(universal verifier) 的東西。
簡單說,就是讓一個AI去檢查和批改另一個AI的作業。 比如,一個AI生成了答案,另一個AI就去網上查資料、翻代碼庫,驗證這個答案對不對,然后打分。高質量的答案會被留下來,作為新的“合成數據”或“教材”,再去訓練模型。 這就厲害了。這意味著OpenAI建起了一座 無限生成高質量數據的工廠,從根本上擺脫了對外部數據的依賴。更關鍵的是,這種驗證不僅適用于編程、數學等有標準答案的領域,還能驗證創意寫作這類主觀內容的質量。
![]()
有必要回頭來看下 gpt-5的難產過程
去年下半年,OpenAI花了大半年時間,秘密研發一個代號為 “Orion”(獵戶座) 的模型,這本該是原定的GPT-5。結果呢?性能拉胯,遠沒達到預期。
失敗的核心原因很致命:高質量的訓練數據被“榨干”了。同時,研究人員發現,很多在小模型上有效的調整,一旦放大到Orion的規模就失效了。
最終,Orion項目只能被灰溜溜地降級成 GPT-4.5,悄悄上線,沒激起半點水花。
在Orion失敗后,OpenAI并未停滯。2023年末一項名為 Q* (Q-Star) 的技術突破曾一度讓內部研究員感到震驚,因為它能解決從未見過的數學問題。基于此,OpenAI開發了新的“推理模型”,即 o系列(o1, o3)。這些模型在投入更多算力思考時,表現會更出色。
瓜吃到這里,我們該怎么看?
* 放平心態,別被忽悠。AI圈的“潑冷水大王”加里·馬庫斯早就預言過:GPT-5依然會犯低級錯誤,依然會有“幻覺”問題,離真正的通用人工智能(AGI)還遠著呢。
* GPT-5到底是什么?它不是神,也不是通往AGI的終極鑰匙。它是一個在重重困難和內部混亂中誕生的、更成熟、更實用、更高效的工具。
它的誕生標志著AI發展的一個轉折點:靠堆數據、堆算力的“莽荒時代”可能要結束了。
一個更注重效率、更注重實用、更注重內部挖潛的 “精耕細作時代” 正在到來。
所以,對我們普通人來說,與其天天盼著“天網”降臨,不如關注一下,這個越來越聰明的工具,又能幫我們解決哪些實際問題了。
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.