![]()
文:王智遠 | ID:Z201440
昨晚到今天上午,我的消息像被按了“狂轟模式”。朋友圈、新聞推送、全在刷一個名字:GPT-5。
冷靜下來,我捋了捋,這次升級,重點就三個:
一,改了架構(gòu)。它不再是一個模型干到底,是能調(diào)度多個模型的“智能體生態(tài)”,會根據(jù)任務(wù)類型和復(fù)雜度,自動切換處理方式。
二,代碼生成能力明顯,很多人形容它是“vibe coding”,你只用自然語言描述需求,它就能吐出一個可運行的應(yīng)用。
三,工具調(diào)用與自主協(xié)作能力更強。它能拆解復(fù)雜任務(wù),甚至發(fā)現(xiàn)缺口時自己造工具去補齊。說實話,把光環(huán)拿掉、深度祛魅之后,就這三條。
1
但比起這些功能,我更想問一句:GPT-5到底是一次范式躍遷,還是一次精心設(shè)計的技術(shù)包裝。
先亮結(jié)論,智遠看來,它確實有技術(shù)升級,但“范式躍遷”這個詞,得慎用。因為范式躍進,除了性能提升,還意味著底層架構(gòu)徹底改變。
比如:從功能機到智能機,從馬車到汽車。
那這次它改了什么?架構(gòu)上,GPT-5 引入了一個叫動態(tài)路由器(Dynamic Router)的東西。
什么意思?過去是一個萬能模型干到底,現(xiàn)在它會先判斷問題的類型、復(fù)雜度和意圖,再分派給不同的專用模型去處理。
舉個例子:
你問它一個簡單問題(查個資料、翻譯一句話),它會調(diào)主模型 GPT-5,速度快;你給它一個復(fù)雜推理(科研計算、法律推演),它會調(diào) 深度思考模型 GPT-5-thinking,推理鏈更長、準(zhǔn)確率更高。
甚至如果你的額度用完了,它還會自動切到輕量版 GPT-5-mini,不中斷服務(wù)。
說白了,這就是一個輕量級的Agent 框架:你丟任務(wù)進去,它先分類,再分派,最后把結(jié)果統(tǒng)一交給你。
那這種多模型協(xié)同的本質(zhì)是什么?
表面上,它像一支“各司其職”的團隊,兼顧效率和精準(zhǔn)度;但從技術(shù)原點看,這種思路并不新鮮。
Anthropic 早就有類似的模型切換,用不同推理深度應(yīng)對不同任務(wù);谷歌 DeepMind 的一些研究里,也出現(xiàn)過根據(jù)任務(wù)復(fù)雜度動態(tài)調(diào)用不同專家模型(Mixture of Experts)的方案;
開源圈的 DeepSeek MoE 架構(gòu)也差不多,只是它把多模型協(xié)作藏在后臺,問題復(fù)雜就多調(diào)幾個專家,問題簡單就少調(diào)幾個,省資源。
GPT-5 巧妙的地方在于,它把這種協(xié)作做成了開箱即用的體驗,而且是無感切換。用戶不用再想“我該用哪個模型”,因為系統(tǒng)會替你選好。
這,才是 OpenAI 在商業(yè)化上的殺手锏,把原本只在研究人員、開發(fā)者手里的“多專家模式”,第一次變成了普通人也能直接用的功能。
所以我認為,技術(shù)上,它是一次架構(gòu)優(yōu)化+體驗升級,不是底層技術(shù)革命;商業(yè)上,它是一種聰明的產(chǎn)品化,把技術(shù)藏起來,讓協(xié)同成為默認生態(tài)。
2
整個發(fā)布會里,有一個最直觀、最容易被感知的能力:寫代碼。聽起來很炸,現(xiàn)場看起來也很熱鬧。那它到底是生產(chǎn)力革命,還是程序員的噩夢?
我更傾向于說,它是一場效率革命。
你只要用普通話、英語,甚至混合幾種語言,把功能描述清楚,它就能直接生成可運行的軟件。
比如說:
幫我做一個法語學(xué)習(xí)網(wǎng)站,要有單詞卡片、語音小游戲,還有貪吃蛇改版。三分鐘,它吐出 240 行代碼,UI 風(fēng)格都幫你配好了。
官方測試里,在 SWE-bench 這種代碼基準(zhǔn)測試中,GPT-5 的編碼準(zhǔn)確率 74.9%(GPT-4 只有 67.6%),通過率提升了 22%。
這不只是寫得對,而是寫得快,從按天計費,到按分鐘產(chǎn)出,就像把一個資深全棧工程師裝進了電腦里。
這樣的能力,會帶來三重沖擊:
對中小企業(yè)老板,是大福利。開發(fā)成本直線下降,原型周期從按周迭代變成分鐘級驗證,創(chuàng)業(yè)公司可以更快測試市場,減少失敗成本。
對程序員來說,初級開發(fā)崗直接面臨替代;中高階開發(fā)會轉(zhuǎn)向代碼審計、安全檢查、性能優(yōu)化,或者做「AI 協(xié)作管理」,而不是親自寫每一行代碼。
對低代碼平臺來說,可能是生死劫。
過去還得拖拽組件、配置表單,現(xiàn)在在一個聊天窗口里說幾句話就能搞定。「描述即應(yīng)用」比「拖拽拼裝」更直接、更快,這會壓縮低代碼平臺的生存空間。
當(dāng)然,這一切也不是沒有成本。
官方 GPT-5 API 價格是:主模型輸入每百萬 token 1.25 美元,輸出 10 美元;Mini 版本輸入 0.25 美元、輸出 2 美元;Nano 版本最便宜:輸入 0.05 美元、輸出 0.40 美元。
價格表看著簡單,但實際用起來沒那么直白。
Reasoning(推理)能力越強,模型在后臺「思考」消耗的隱形 token 就越多,你甚至看不到這些 token,賬單卻能蹭蹭往上漲。
而且,國內(nèi)早就有類似的「說話寫代碼」工具,也不差:
百度的「文心快碼(Baidu Comate)」、騰訊云 CloudBase 在 6 月發(fā)布的 AI Builder、字節(jié)的 TRAE……
區(qū)別只是,他們把寫代碼單獨做成一個產(chǎn)品,而 GPT-5 把這種能力直接塞進了 AI 「大腦」里,一個 Chat 窗口幾乎能包攬開發(fā)、接口、邏輯、UI,體驗還統(tǒng)一。
所以,有三個問題必須問:
一,API 價格雖清楚,但讓 AI 「仔細思考」的成本可能遠超預(yù)期,越用越上癮,會不會讓企業(yè)不斷加錢?
二,國內(nèi)這些工具未來會不會也學(xué) GPT-5,把所有能力打包成「什么都能做的一個 Agent」?三,代碼生成快,但真夠安全、可維護嗎?
畢竟真實業(yè)務(wù)場景里,誰也不可能天天在開發(fā)大型 App,大多數(shù)時候是臨時搓個統(tǒng)計表、搭個審批流,或者做個協(xié)同工具,這才是低代碼平臺的日常戰(zhàn)場。
3
寫代碼是冰山一角,如果把能力打包到一個智能體生態(tài)里,行業(yè)格局就不一樣了。
為什么?
因為在商業(yè)競爭里,單點能力只能解決局部問題;而平臺化能力,意味著你能在一個入口下,解決一整條業(yè)務(wù)鏈的問題。
舉個簡單的對比:
單點 AI 工具,就像你請了個外包寫手,用完就走;智能體生態(tài),更像你簽了一個全能秘書,能查資料、能寫、能排版,甚至能直接幫你發(fā)出去。
企業(yè)需求永遠是閉環(huán),誰能提供閉環(huán),誰就占據(jù)優(yōu)勢。
從數(shù)據(jù)角度出發(fā),公版 GPT-5 很強,但如果把企業(yè)自己的歷史業(yè)務(wù)數(shù)據(jù)、流程數(shù)據(jù)、客戶數(shù)據(jù)都喂給它,生成的智能體會立刻變成「懂行的內(nèi)行人」。
這種效果,中小企業(yè)在公版模型里幾乎復(fù)刻不了。
從算力壁壘上來說,多模型調(diào)度 + 長推理,對算力消耗很大。巨頭企業(yè)有能力自建機房、簽長期算力合約,這才是真正賺錢的地方。
從用戶觸點來看,有現(xiàn)成入口的公司,更容易把智能體生態(tài)捆綁到現(xiàn)有產(chǎn)品里。
比如:
微軟有 Office、Teams、Outlook,天然覆蓋全球數(shù)億知識工作者;谷歌有 Workspace、Gmail、Drive,可以在用戶的日常工作流中無縫嵌入 AI;Salesforce 有 CRM 和一整套企業(yè)應(yīng)用,可以直接讓智能體深入銷售、客服、運營環(huán)節(jié)。
這意味著,它可以直接在自己的應(yīng)用里嵌入 AI 平臺,形成天然分發(fā)渠道。
換句話說,如果你用一個集合多個模型的 Agent,把它放進業(yè)務(wù)系統(tǒng)里,它就成了一個「超級 Agent」。
這種趨勢下,低代碼平臺如果不做平臺化轉(zhuǎn)型,會被「描述即應(yīng)用」直接碾壓;傳統(tǒng) SaaS 只解決流程里的一個環(huán)節(jié),可能會被一整套智能體生態(tài)直接打包替代。
一些中小 AI 創(chuàng)業(yè)公司,如果核心價值只是「在 GPT 上做個小工具」,那很可能只是在幫巨頭做功能驗證。
在我看來,這才是 Sam Altman 的真正算盤。
因為企業(yè)要的不是“用 AI”,而是“用 AI 完成業(yè)務(wù)”。如果有一家公司能在一個入口、一套賬單、一個平臺里加一個AI搞定所有環(huán)節(jié),它不僅會搶走別人的功能,還會截留客戶關(guān)系和數(shù)據(jù)。
因此,我才說,真正的變化在水面之下,平臺化協(xié)同,有可能把 ToB 行業(yè)的格局重新洗一遍。
4
平臺化協(xié)同,聽起來是顛覆性機會,但要真落地,風(fēng)險也不小,尤其是 GPT-5 想做 To B(面向企業(yè)市場),它有三座大山要翻過去。
發(fā)布會上的案例,幾乎“滿分條件”,數(shù)據(jù)干凈且統(tǒng)一格式、流程設(shè)計清晰,沒有跨部門博弈、系統(tǒng)接口提前打通。
可真實的企業(yè)環(huán)境,完全不是這樣。
Salesforce 在推 Einstein AI 時,就公開提醒過:如果數(shù)據(jù)是臟的,再強的 AI 也會給出錯誤甚至誤導(dǎo)性的結(jié)果。
落到現(xiàn)實里,智能體協(xié)作要面對五花八門的 ERP 系統(tǒng)、年代久遠的數(shù)據(jù)庫、不標(biāo)準(zhǔn)的 API,甚至是人為設(shè)置的流程壁壘。
換句話說,智遠認為,GPT-5 在發(fā)布會上的“秒級響應(yīng)”,進了企業(yè),很可能變成十幾分鐘跑一遍,體驗差別不是一點點。
另外,智能體生態(tài)好處是閉環(huán),但壞處是閉環(huán)的脆弱性。
GPT-多模型調(diào)度、長推理鏈條意味著更多潛在的故障點,這些在工業(yè)生產(chǎn)、金融交易,醫(yī)療診斷場景中,一次錯誤,可能引發(fā)不少損失,而且你很可能第一時間都發(fā)現(xiàn)不了是 AI 搞的鬼。
有研究披露,2024 年,有研究披露,微軟在 Teams 與 Copilot 深度整合時,曾出現(xiàn)權(quán)限 Bug:一個部門的 AI 助手誤讀了另一個部門的敏感文件;還有 Recall 自動工具,被發(fā)現(xiàn)截圖時順帶捕捉了密碼、銀行卡等信息。
值得一提的是,要讓智能體真正幫企業(yè)跑業(yè)務(wù),就必然要跨系統(tǒng)、跨部門傳遞數(shù)據(jù)。
這里面有兩個棘手問題:
一,責(zé)任歸屬,如果 AI 給出了錯誤決策,導(dǎo)致財務(wù)損失或合規(guī)事故,責(zé)任是在 AI 提供商、企業(yè) IT 部門,還是模型本身?
二數(shù)據(jù)安全,不管是美國還是歐盟,對數(shù)據(jù)有嚴格限制,踩線就可能面臨巨額罰款。
那如果這三道坎都跨過去了,問題又來了:越來越多的智能體幫人做事,那人還能做什么?我認為人類至少還有三種能力,是現(xiàn)在越來越稀缺的:
一,提出戰(zhàn)略級問題的能力,戰(zhàn)略級問題是沒有標(biāo)準(zhǔn)答案,需要權(quán)衡取舍、看清大勢的問題。
比如:這個季度壓利潤換規(guī)模,還是保利潤犧牲增長?要不要為了搶先布局,冒一次政策風(fēng)險?這些問題不僅涉及數(shù)據(jù),還涉及價值觀、文化、甚至政治判斷。
AI 可以給你列出各種選項的利弊,但決定走哪條路,只能由人來拍板。
二,設(shè)計規(guī)則與價值交換的能力。在一個智能體生態(tài)里,不同系統(tǒng)、不同部門、甚至不同公司之間要不斷交換數(shù)據(jù)和成果。
那數(shù)據(jù)怎么流轉(zhuǎn)、誰能用、誰付費、誰分紅,就得有人先設(shè)計好規(guī)則;比如:制造智能體在不同供應(yīng)商之間調(diào)配產(chǎn)能,優(yōu)先級誰定?利益怎么平衡?
其三,就是反共識。
GPT-5 的知識,來自于既有信息和模式識別,它會綜合主流觀點,得出一個“平均最優(yōu)解”。可真正顛覆性的創(chuàng)新,往往不是平均值,是反常數(shù)。
iPhone 剛出來時,大多數(shù)人覺得全觸屏很荒唐,特斯拉剛造車時,整個汽車行業(yè)都不看好電動車;人類的創(chuàng)造力,往往來自跨界、偶然的火花,來自對主流邏輯的懷疑和推翻。
所以,在我看來,GPT-5 再強,也只把執(zhí)行力推到了一個新高度,人類的優(yōu)勢,正在從“會做事”轉(zhuǎn)向“會定事、會定規(guī)則、會逆流而行”。
不管怎么說,GPT-5的出現(xiàn),我沒覺得它強到碾壓一切,反而更像是在抄中國的作業(yè),尤其是 Agent 這一塊。
Sam Altman,真是太會「拿來主義」了。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.