![]()
(文/陳濟深 編輯/張廣凱)
3月5日,OpenAI發布了能力"N合1"的統一模型GPT-5.4。
OpenAI本次發布的重點非常明確:把AI從聊天助手,進一步推向真正能交付專業工作的系統。除了GPT-5.4,OpenAI還推出了GPT-5.4 Pro,以及面向金融和表格工作流的ChatGPT for Excel和多家金融數據集成。
這意味著,相比傳統發布強調的更大參數,更強智能,GPT-5.4主推是一項更具體的能力變化:AI可以自己操作電腦。
OpenAI在官方博客里稱,GPT-5.4是他們發布的首個具備原生computer use能力的通用模型,定位是"面向專業工作的最強前沿模型"。
但"讓AI替你干活"這個方向,美國AI不僅沒有遙遙領先,OpenAI甚至是抓緊補課的那個存在。
2025年9月,月之暗面的Kimi就上線了OK Computer功能。它的思路和GPT-5.4不完全一樣——GPT-5.4走的是"像人一樣操作你的電腦桌面",通過截圖和模擬鼠標鍵盤來控制現有軟件;Kimi走的是"給AI配一臺自己的虛擬電腦",讓它在沙盒環境里調度20多種原生工具,自主拆解任務、寫代碼、搭網站、做數據分析,最后把成品交給用戶。
路徑不同,但指向同一個行業共識:AI的競爭維度正在從"誰更聰明"轉向"誰能真正替你干活"。而在這個方向上,Kimi比GPT-5.4早了近半年。
而且即便在GPT-5.4最引以為傲的桌面操控賽道上,在GPT-5.4發布前,OS-World排行榜的冠軍正是Kimi K2.5,得分63.3%,領先Claude Sonnet 4.5的62.9%。
把GPT-5.4的整張能力清單攤開,無論從編程、Office文檔生產力到超長文本處理,中國AI企業不但早已完成了相應的產品布局,而且在多個方向上已經站到了行業前沿。
中國AI不再當追隨者
GPT-5.4本次發布著力強調它的編程和軟件工程能力。OpenAI稱它不只是寫代碼片段,而是能完成完整的軟件項目——從系統設計到調試到測試。
從行業發展來看,AI編程確實正在從"輔助寫代碼"升級為"獨立完成工程"。而中國AI企業們對這個趨勢的判斷并不晚于OpenAI,在功能實現上也毫不遜色。
智譜今年2月發布GLM-5時,核心定位就是"智能體工程"——不再只是幫程序員補全代碼,而是讓AI像一個系統架構師一樣,自主拆解需求、規劃結構、編寫和調試完整項目。
值得注意的是,GLM-5發布前還曾以"Pony Alpha"的匿名身份在海外開發者平臺OpenRouter上線,直接登頂熱度榜首,很多海外開發者對其贊不絕口,認為這可能是美國某家頭部公司的模型,直到官宣后才知道這是一個中國開源模型,這也意味著中國AI的實際能力在盲測中也取得了行業領先的口碑。
而GPT-5.4的另一個重點是Office文檔生產力。OpenAI同步發布了ChatGPT for Excel插件,還接入了FactSet、標普全球等金融數據源,讓用戶可以在ChatGPT里直接做財務建模和情景分析。在OpenAI內部的一組模擬投行初級分析師工作的基準測試中,GPT-5.4的平均分達到87.3%。
在這個賽道上,中國AI早已各顯神通。
智譜的GLM-5已經內置了直接輸出Word、PDF、Excel文件的能力,配合同步推出的ZCode開發環境,用戶用自然語言描述需求,模型就能自動拆解任務并調度多個智能體協同完成——從研究報告到財務表格到演示文稿。
MiniMax的M2.5把Office能力做成了標準化的技能模塊,能根據文件類型自動加載,還能和金融建模等行業SOP結合。
Kimi則在K2.5模型發布時同步推出了"精通Office"功能升級,讓Kimi Agent掌握了Word智能排版、Excel數據分析與金融建模、PPT自動生成、PDF視覺設計等中高階技能,直接交付準專業水平的辦公文檔。三條技術路徑不同,但方向完全一致:AI不只是幫你想,還要幫你把文件做出來。
至于100萬token的超長上下文窗口,DeepSeek、GLM-5、Qwen3.5都已經支持。
這也意味著,中國AI企業們早在OpenAI之前就已經實現了不止幫你想,AI還要幫你做的技術規劃并實現了產品落地。
從"更便宜"到"更早"
把GPT-5.4的能力清單和中國公司的產品線擺在一起,會發現一件事:中國AI在全球競爭中的位置,正在發生第二次躍遷。
第一次躍遷發生在2025年。以DeepSeek為代表的中國開源模型的崛起,Kimi、千問、智譜等中國模型憑借性價比+頭部模型性能大規模滲透進硅谷的開發者生態。
Airbnb的CEO公開表示公司"在很大程度上依賴阿里巴巴的Qwen",硅谷頂級投資人查馬斯則透露已將大量工作負載從OpenAI和Anthropic遷移到了Kimi K2。
今年2月,這個趨勢已經有了一個標志性的數據節點:在全球最大的大模型API聚合平臺OpenRouter上,中國模型的單月Token調用量歷史上首次超過美國模型——其中智譜GLM-5、MiniMax M2.5、月之暗面Kimi K2.5、DeepSeek V3.2分居調用榜前列。
如果說當時的敘事核心在于中國AI"更好更便宜",那GPT-5.4的發布暴露出的信號,已經超出了"性價比"的范疇。
這一次,不是中國模型能用更低的價格做到美國模型能做的事,而是中國公司在技術思路和產品方向上,走到了和OpenAI同一個甚至更前的位置。
Kimi在"AI自主完成任務"方向上比GPT-5.4早近半年布局,智譜對"智能體工程"的判斷比GPT-5.4早近一個月落地發布,MiniMax在Office生產力和編程工程化方向上的布局也完全獨立于OpenAI的節奏。
科技行業長期存在一種刻板印象叫"Copy to China"——美國做什么,中國跟著做什么。但在AI這個領域,這個敘事已經失效了。
GPT-5.4這次發布的直接背景是OpenAI需要追趕Anthropic的Claude——過去大半年里,Claude在computer use、代碼工程、文檔處理上持續加碼,一系列更新直接沖擊了傳統SaaS軟件的地盤,把"AI能不能替你干活"變成了行業最核心的競爭維度。
GPT-5.4主打的每一項能力,幾乎都是在補Claude已經建立起來的產品優勢。而中國公司在這同一個方向上的布局,不是在等美國公司打完之后再入場,而是獨立走到了同一個路口。
無論這背后是更早意識到了行業方向,還是更早完成了研發落地,至少有一點可以確認:在AI行業,方向不再是硅谷單方面定義的了。
當閉源做到的事開源也能做到
如果說能力層面是"并跑",那接下來的問題就變得尖銳:GPT-5.4是閉源的,而上述中國模型幾乎全部開放了模型權重。
閉源模型的溢價邏輯,本質上建立在"我能做到你做不到的事"之上——只要能力是獨占的,定價權就是成立的。
但當開源模型在編程、文檔生產力、長文本處理等核心維度上逐項追平甚至局部超越,這個邏輯就開始松動了。
這有點像智能手機行業的蘋果和安卓:蘋果依然可以賣出溢價,但它的溢價來源已經從"獨占能力"轉向了"生態和品牌",而它面對的不再是一個追趕者,而是一整個陣營。
GPT-5.4的處境正在變得類似。它仍然是一個優秀的產品,但它的定價已經很難再用"獨占能力"來支撐了。
GPT-5.4的API定價是每百萬輸入token 2.5美元、輸出15美元。GPT-5.4 Pro更貴,輸入30美元、輸出180美元。
MiniMax M2.5呢?輸入0.3美元,輸出2.4美元。連續運行一小時的成本大約是1美元。Qwen3.5的API價格大約是同等性能的谷歌Gemini 3 Pro的十八分之一。
而且MiniMax M2.5、智譜GLM-5、月之暗面Kimi K2.5、阿里Qwen3.5,全部開放了模型權重。由于開發者需求過于旺盛,智譜甚至在發布當天就宣布了編程方案漲價,漲幅超過30%——一個開源模型因為太多人搶著用而漲價,這個場景本身就說明了一些問題。
同一水平線上的能力,中國模型的價格是OpenAI的幾分之一到十幾分之一,而且還是開放權重的。這個事實可能比任何一項性能指標都更值得被關注。
美國AI的護城河在哪?
當然,GPT-5.4也有中國模型短期內做不到的東西,而且恰恰不在技術本身。
它同步接入了FactSet、道瓊斯Factiva、LSEG、標普全球等西方主流金融數據源,讓華爾街的分析師可以在一個工作流里完成數據獲取、建模和輸出。法律AI公司Harvey稱GPT-5.4在其BigLaw Bench上拿到91%的成績,在處理復雜交易分析和長合同時表現最優。再加上ChatGPT在全球消費市場積累的品牌認知和用戶基礎,這些生態層面的優勢不是模型性能追上就能解決的。
值得注意的是,GPT-5.4在性能上也有突破,它在OS-World上75.0%的得分超越了人類基準的72.4%,在SWE-Bench Pro上拿到57.7%,在OpenAI內部投行基準上從GPT-5的43.7%飆升到87.3%。在桌面操控這條特定賽道上,GPT-5.4確實把天花板往上推了一大截。
但反過來,中國AI公司也擁有OpenAI難以復制的東西:一個春節期間五六家公司同時發布旗艦模型的產業密度,一個以極低成本向全球開發者開放的開源生態,以及在OpenRouter等開發者平臺中快速積累的海外用戶基本盤。
曾經是行業標桿的OpenAI,這次發布的產品方向與中國公司高度重合。這件事本身就是一個信號:中美AI的位置關系,已經不是"領跑者和追趕者"那么簡單了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.