網易首頁 > 網易號 > 正文申請入駐

GPT-5.4養龍蝦太貴？OpenAI自己出手砍到了一折

2026-03-19 17:34:54　來源: 字母榜

北京舉報

分享至

最近OpenClaw可以說是火遍了大江南北。各大廠商都說自己的模型如何支持小龍蝦，唯獨沒人推薦ChatGPT。

事實上OpenAI才收購了OpenClaw。

原因就一個“貴”。

讓AI幫你完成一個稍微復雜的任務，比如自動化處理一批客戶郵件，背后可能要調用模型幾十上百次：理解意圖、檢索信息、生成草稿、校對潤色、逐封發送……如果每一步都調用滿血版GPT-5.4，一輪操作下來，飼料費（token）比蝦本身還貴。

特別是隨著OpenClaw這類agent框架的爆發，AI的工作模式已經發生了根本性轉變：從前我們向AI提問，它盯著問題想很久，然后吐出一長串文字；現在AI面對一個復雜任務，要將其拆解成微小步驟分步推進。每一步都調用旗艦大模型，不僅延遲讓人崩潰，成本也會高到離譜。

在這種背景下，OpenAI正式發布GPT-5.4 mini與nano兩款小型模型，并宣稱其為公司“迄今最強大的小型模型”。

麻雀雖小五臟俱全，不要小瞧這兩個小玩意，不僅GPT-5.4核心的優勢和能力它們繼承了下來，同時還更快、更省資源，并且適合于大批量、高頻率的AI任務調用。

OpenAI貌似是覺得mini還不夠小，所以做出了更輕量的nano。

nano是GPT-5.4最輕量、最快速的版本，專為對速度和成本要求極高的任務而設計。

事實就是，用單一模型處理所有事務性價比太低，經常陷入高射炮打蚊子的境況，不如調整成大模型決定任務方向，小模型進行大規模快速執行的方案。

OpenAI自家的Codex就是這么干的。

一個主模型負責理解任務意圖、拆解步驟，然后調度mini/nano級別的子agent去執行具體的代碼修改、測試運行、結果校驗，每個子任務只消耗極低的成本。

大模型就像坐鎮中軍、運籌帷幄的主帥，只抓頂層戰略、調度全局資源。小模型則是無數支精銳輕騎，身形輕便、行動迅捷、批量奔赴前線，專一完成細分任務。

OpenAI為什么這么做

mini和nano在價格上確實“mini”以及“nano”。要理解OpenAI為什么押注輕量化，先看看這兩款模型到底便宜到什么程度。

mini和nano均支持 400k tokens 的上下文窗口。在輸入價格上，GPT-5.4旗艦版是2.5 美元/百萬token，mini版是0.75美元/百萬 token，nano版更是夸張，僅0.2美元/百萬token，輸入成本僅為旗艦模型GPT-5.4的8%。

而輸出價格上，GPT-5.4是15美元/百萬 token，mini版約為它的1/3（4.5 美元），nano版約為它的1/12（1.25 美元）。

換句話說，OpenAI用戶們的賬單直接砍到了零頭。

價格只是表象，真正驅動OpenAI做這件事的，是整個行業的使用趨勢已經發生了根本性轉向。

輕量化小模型主要有調用成本低、響應快這兩大特征，不少證據表明小模型已經成為當前AI落地最具性價比、最具增長潛力的選擇。

在OpenRouter本月度最受歡迎LLM排行榜前十中，輕量化模型占到了6個席位，它們參數量普遍集中在數十億至數百億級別，和Claude Opus這類動輒數千億甚至萬億參數的通用旗艦大模型形成鮮明的差異。

榜單Top 2席位被輕量化小模型包攬，第1名MiniMax M2.5以8.29T tokens的調用量斷層領跑全榜，月度漲幅高達 476%；第2名Google Gemini 3 Flash Preview，調用量也達到4.24T tokens，遠超多數通用旗艦大模型。

Hugging Face Hub的模型下載量統計同樣印證了這一趨勢：92.48%的下載量來自少于10億參數的模型，86.33% 為5億以下，69.83% 為2億以下。

大模型也進入了薄利多銷的時代。

1B+參數量的模型，即便包含多款輿論熱度極高的開源大模型，整體下載占比僅為7.52%，不足輕量化模型的十分之一，這說明大模型的高關注度，似乎并未轉化為真實的落地與采用。

從OpenAI自身的商業賬本來看，做小模型更是一道必答題。

今年2月底，OpenAI宣布ChatGPT全球每周活躍用戶已突破9億，付費用戶約5000 萬，付費轉化率僅約5%左右，絕大多數用戶仍停留在免費版本。這也成為其未來商業化最核心的增長空間。

絕大多數的C端付費用戶，核心使用場景是日常對話、文案潤色、信息檢索、輕量代碼編寫等高頻輕量需求。

這類場景完全不需要GPT-5.4這類旗艦大模型的極限復雜推理能力，百億級以內的輕量化小模型足以覆蓋大部分需求，同時又能提供毫秒級響應、無排隊等待的使用體驗，完美匹配絕大多數用戶的核心訴求。

說了這么多“為什么”，接下來看看這兩款模型到底交出了怎樣的答卷——畢竟，飼料便宜了，蝦的個頭要是也縮水了，那就不叫降本增效，叫偷工減料。

mini、nano能力幾何

mini和nano的優勢就只是小和便宜嗎？

No No No

根據OpenAI官網的一系列跑分測試，可以說它們能力表現也很突出。

在業內公認最權威的AI程序員測試SWE-bench Pro 中，GPT-5.4 mini的準確率達到了54.4%，表現極具殺傷力，逼近滿血版GPT-5.4的57.7%。

GPT-5.4 nano的準確率為52.4%，再考慮到它極低的成本，非常適合作為快速迭代的代碼審查和輔助子agent。

以下兩張圖表看得更直觀，橫軸分別代表模型的響應時長和所用成本，縱軸均表示模型在任務中的準確率。

GPT-5.4雖然準確率穩居第一，但是在橫軸上卻延伸了太遠，也就是不僅思考久，燒的錢還多。而nano和mini的折線則整體居于坐標圖左側，標志了它們極高的性價比。

它們只是犧牲了一點點終極的邏輯上限，就換來了極快的響應速度和極低的成本。

對此，不少網友戲稱：小龍蝦的飼料費終于被打下來了。

的確，mini和nano未來可能會成為養蝦的主流API選擇。

在OSWorld-Verified（真實電腦環境操作測試）中，GPT-5.4 mini達到了72.1%的準確率，幾乎追平了滿血旗艦版的75%。

這項測試主要是讓AI像人一樣，通過看顯示器、動鼠標、敲鍵盤來使用一臺真的電腦，包括使用Chrome、Office、VS Code等軟件。

這才是OpenClaw等agent玩家最看重的指標。

過去讓AI操控電腦，AI經常會瞎點或者反應遲鈍。mini版本的這個高分意味著，它識別按鈕、滑塊、輸入框的精度極高，在一些自動化任務上可以更加得心應手。

然而，也不是所有場景都適合用小模型。

nano模型在OSWorld-Verified上的得分僅為39.0%，甚至低于上一代GPT-5 mini的42.0%。

這意味著在需要精細操控電腦界面的復雜任務上，nano還力有不逮。

同樣，對于需要深度推理、長鏈條邏輯的高難度任務，旗艦版GPT-5.4仍然不可替代。

小模型的價值不在于取代大模型，而在于和大模型搭配使用——把對的模型放在對的位置，才是子agent架構真正的精髓。

這也恰恰是nano和mini發布的深層意義，它們不是來搶旗艦版飯碗的，而是來幫旗艦版分擔那些“高射炮打蚊子”的活兒。

當大模型不再需要親自處理每一個瑣碎步驟，整個系統的效率和成本結構都會發生質變。

OpenAI想打的不是一場簡單的價格戰，OpenAI內心OS是這樣的：“我可以每個token少賺你點錢，但是我要讓你多用我的小模型，把總收入抬上去。”

典型的薄利多銷。

過去“便宜”是國產模型的護城河，可是這道護城河正在被填平。對普通開發者和企業用戶而言，AI可能很快就會變成各行各業用得起、跑得快的新基礎設施。

小龍蝦的飼料費打下來了，養蝦的門檻也在悄悄降低。接下來的問題是：誰能養出最肥的蝦？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

DeepMind之父驚人自白：我造的AI可能滅絕人類，但已無人能停下

新智元 2026-03-30 21:26:17
0 跟貼 0
UCSD 推出 AIBuildAI 智能體，斬獲OpenAI MLE-Bench榜單第一

機器之心Pro 2026-03-30 13:03:41
0 跟貼 0

蘋果AI最新動作：Siri或全面接入三方AI，WWDC迎來重要更新

智東西 2026-03-30 19:55:17
0 跟貼 0

全球OCR新王來自中國開源！GitHub狂攬73300+Star

量子位 2026-03-30 22:11:02
0 跟貼 0
人大林衍凱教授：OpenClaw就像早期Linux，真正的競爭才剛開始

機器之心Pro 2026-03-30 15:29:06
0 跟貼 0

人類一離座AI就進化！伯克利開源MetaClaw，靜態Agent慌了

新智元 2026-03-30 21:27:11
0 跟貼 0

對話騰訊健康用戶平臺總經理吳志剛：商業化非首要，不對標友商，定位醫療AI的“連接者”

每日經濟新聞 2026-03-30 21:36:05
0 跟貼 0
OpenClaw被曝出33個漏洞，螞蟻安全實驗室盯上Agent軟肋

雷科技 2026-03-30 16:20:02
2 跟貼 2

JiuwenClaw助你一鍵養龍蝦-3

機器之心Pro 2026-03-12 17:18:07
0 跟貼 0
早于DeepSeek Engram！用「查表」重置Transformer記憶 | ICLR

新智元 2026-03-30 21:26:03
0 跟貼 0
“物理AI第一股”五一視界董事長李熠：商業模式將從仿真軟件銷售轉型為“物理AI工廠”

每日經濟新聞 2026-03-30 21:53:05
0 跟貼 0
Anthropic史上最大訓練曝光，Ilya錯了？CEO哀嚎：創業公司將被毀滅

新智元 2026-03-30 12:58:33
11 跟貼 11
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
74 跟貼 74
不堆參數不吹牛鉑智7上市夠坦誠

汽車人傳媒 2026-03-29 22:50:57
0 跟貼 0
內存條價格出現斷崖式下跌，16G內存條1天跌了上百元，專家：未來將持續降價

極目新聞 2026-03-29 22:53:03
4754 跟貼 4754
交通運輸部檢查指導組在吉林檢查時發現“百噸王”多發頻發

界面新聞 2026-03-30 11:14:13
35 跟貼 35
印度又官宣自研五代機！17年就憋出個模型，能趕超中美俄嗎？

浩然簡史 2026-03-28 16:39:42
0 跟貼 0
上海男籃的難題又來了！

新民晚報 2026-03-30 10:42:17
376 跟貼 376
1911 模型槍欣賞

飛翔大白鯨 2026-03-29 09:56:29
0 跟貼 0
Nano Banana終于不是文盲了，但我可能會變「傻」

愛范兒 2025-11-24 14:33:39
0 跟貼 0
2027年谷歌利潤將歸零，最新預測引熱議

量子位 2026-03-30 09:06:47
0 跟貼 0
中方決定對日本國會眾議員古屋圭司采取反制措施

央視新聞客戶端 2026-03-30 10:43:13
1796 跟貼 1796
一篇論文砸崩存儲芯片巨頭股價，谷歌干了什么？

量子位 2026-03-28 02:40:37
0 跟貼 0
機器人進汽車廠，給波士頓動力，裝上谷歌最強大腦

機器之心Pro 2026-01-06 19:02:05
4 跟貼 4
獨家對話！帶崩全球存儲股的谷歌論文陷學術爭議，中國學者指其“嚴重失實”且“知錯不改”：使用了我們的方法，但刻意回避相似性

每日經濟新聞 2026-03-30 18:24:12
31 跟貼 31
北京男子依靠養龍蝦實現36小時買房網友：我差的是銀子

快科技 2026-03-30 10:44:08
2 跟貼 2
美國律師打贏了社交媒體致癮案，Meta與YouTube判賠600萬美元

DeepTech深科技 2026-03-30 18:03:09
10 跟貼 10
中國將在長江水下開高鐵

環球網資訊 2026-03-30 09:38:29
949 跟貼 949
2026年想買家用車，就選這3款，都是全球車型其它的請盡量不要碰

鴨梨說車 2026-03-29 16:56:53
3 跟貼 3
美股凈賣壓已逼近新冠暴跌峰值，高盛：CTA未來一月將全面轉向買入

華爾街見聞官方 2026-03-30 21:53:39
0 跟貼 0
蔡磊透露身體近況：四個人同時攙扶也無法邁步

極目新聞 2026-03-29 22:40:10
1400 跟貼 1400
保定一小店售賣咸菜絲燒餅意外爆火，排隊人數太多店鋪宣布暫停營業，店主：流量太大了，我們承接不住，也擔心影響燒餅品質

極目新聞 2026-03-26 22:43:02
1747 跟貼 1747
全民“養龍蝦”，還有什么“手藝”無法替代?

花兒街參考 2026-03-27 15:57:00
0 跟貼 0
谷歌發布新型AI內存壓縮技術！全球存儲芯片股集體下挫

時代周報 2026-03-28 08:47:30
0 跟貼 0
為什么這么多人買五菱Mini？開過才知道

一輛Acartv 2026-03-26 13:33:09
1 跟貼 1
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
推薦605旗艦版 2026款海獅06EV購車指南

車質網 2026-03-30 07:17:03
32 跟貼 32
約80層樓高的神女大扶梯，把巫山縣城推向了臺前

新京報 2026-03-30 16:45:46
58 跟貼 58
Swiggy前高管：10個習慣讓90%人職場卡住

報錯免疫體 2026-03-26 13:05:51
0 跟貼 0
飛凱材料：目前公司光纖光纜涂覆材料產能利用合理，能夠滿足下游客戶的訂單與交付需求

每日經濟新聞 2026-03-30 21:11:06
0 跟貼 0

字母榜

讓未來不止于大。

2329文章數 8055關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機

親子

健康

游戲

數碼

手機 / 數碼

房產 / 家居

GPT-5.4養龍蝦太貴？OpenAI自己出手砍到了一折

一句謊言引發的硅谷血案

開發商承諾有學校3年后交房沒建 業主起訴被當地駁回

開發商承諾有學校3年后交房沒建 業主起訴被當地駁回

想進世界杯，意大利還要過他這一關

全紅嬋聊到體重哭了，每天只吃一頓飯

本輪地緣沖突，A股憑什么走出獨立行情

限時12.58萬起 銀河星耀8遠航家系列上市

態度原創

兩款至尊版機型即將到來，或為一加和REDMI旗下

孩子眼睛出現這些現象，一定要警惕！

干細胞抗衰4大誤區,90%的人都中招

四月PS新會免游戲爆料！類魂與二次元雙大作領銜

TrendForce下修2026年筆記本電腦出貨預測，衰退幅度達14.8%

開發商承諾有學校3年后交房沒建業主起訴被當地駁回

開發商承諾有學校3年后交房沒建業主起訴被當地駁回

限時12.58萬起銀河星耀8遠航家系列上市