網易首頁 > 網易號 > 正文申請入駐

GPT-5.4的最大賣點，中國AI半年前就上線了

2026-03-07 12:08:08　來源: 觀察者網

上海舉報

分享至

（文/陳濟深編輯/張廣凱）

3月5日，OpenAI發布了能力"N合1"的統一模型GPT-5.4。

OpenAI本次發布的重點非常明確：把AI從聊天助手，進一步推向真正能交付專業工作的系統。除了GPT-5.4，OpenAI還推出了GPT-5.4 Pro，以及面向金融和表格工作流的ChatGPT for Excel和多家金融數據集成。

這意味著，相比傳統發布強調的更大參數，更強智能，GPT-5.4主推是一項更具體的能力變化：AI可以自己操作電腦。

OpenAI在官方博客里稱，GPT-5.4是他們發布的首個具備原生computer use能力的通用模型，定位是"面向專業工作的最強前沿模型"。

但"讓AI替你干活"這個方向，美國AI不僅沒有遙遙領先，OpenAI甚至是抓緊補課的那個存在。

2025年9月，月之暗面的Kimi就上線了OK Computer功能。它的思路和GPT-5.4不完全一樣——GPT-5.4走的是"像人一樣操作你的電腦桌面"，通過截圖和模擬鼠標鍵盤來控制現有軟件；Kimi走的是"給AI配一臺自己的虛擬電腦"，讓它在沙盒環境里調度20多種原生工具，自主拆解任務、寫代碼、搭網站、做數據分析，最后把成品交給用戶。

路徑不同，但指向同一個行業共識：AI的競爭維度正在從"誰更聰明"轉向"誰能真正替你干活"。而在這個方向上，Kimi比GPT-5.4早了近半年。

而且即便在GPT-5.4最引以為傲的桌面操控賽道上，在GPT-5.4發布前，OS-World排行榜的冠軍正是Kimi K2.5，得分63.3%，領先Claude Sonnet 4.5的62.9%。

把GPT-5.4的整張能力清單攤開，無論從編程、Office文檔生產力到超長文本處理，中國AI企業不但早已完成了相應的產品布局，而且在多個方向上已經站到了行業前沿。

中國AI不再當追隨者

GPT-5.4本次發布著力強調它的編程和軟件工程能力。OpenAI稱它不只是寫代碼片段，而是能完成完整的軟件項目——從系統設計到調試到測試。

從行業發展來看，AI編程確實正在從"輔助寫代碼"升級為"獨立完成工程"。而中國AI企業們對這個趨勢的判斷并不晚于OpenAI，在功能實現上也毫不遜色。

智譜今年2月發布GLM-5時，核心定位就是"智能體工程"——不再只是幫程序員補全代碼，而是讓AI像一個系統架構師一樣，自主拆解需求、規劃結構、編寫和調試完整項目。

值得注意的是，GLM-5發布前還曾以"Pony Alpha"的匿名身份在海外開發者平臺OpenRouter上線，直接登頂熱度榜首，很多海外開發者對其贊不絕口，認為這可能是美國某家頭部公司的模型，直到官宣后才知道這是一個中國開源模型，這也意味著中國AI的實際能力在盲測中也取得了行業領先的口碑。

而GPT-5.4的另一個重點是Office文檔生產力。OpenAI同步發布了ChatGPT for Excel插件，還接入了FactSet、標普全球等金融數據源，讓用戶可以在ChatGPT里直接做財務建模和情景分析。在OpenAI內部的一組模擬投行初級分析師工作的基準測試中，GPT-5.4的平均分達到87.3%。

在這個賽道上，中國AI早已各顯神通。

智譜的GLM-5已經內置了直接輸出Word、PDF、Excel文件的能力，配合同步推出的ZCode開發環境，用戶用自然語言描述需求，模型就能自動拆解任務并調度多個智能體協同完成——從研究報告到財務表格到演示文稿。

MiniMax的M2.5把Office能力做成了標準化的技能模塊，能根據文件類型自動加載，還能和金融建模等行業SOP結合。

Kimi則在K2.5模型發布時同步推出了"精通Office"功能升級，讓Kimi Agent掌握了Word智能排版、Excel數據分析與金融建模、PPT自動生成、PDF視覺設計等中高階技能，直接交付準專業水平的辦公文檔。三條技術路徑不同，但方向完全一致：AI不只是幫你想，還要幫你把文件做出來。

至于100萬token的超長上下文窗口，DeepSeek、GLM-5、Qwen3.5都已經支持。

這也意味著，中國AI企業們早在OpenAI之前就已經實現了不止幫你想，AI還要幫你做的技術規劃并實現了產品落地。

從"更便宜"到"更早"

把GPT-5.4的能力清單和中國公司的產品線擺在一起，會發現一件事：中國AI在全球競爭中的位置，正在發生第二次躍遷。

第一次躍遷發生在2025年。以DeepSeek為代表的中國開源模型的崛起，Kimi、千問、智譜等中國模型憑借性價比+頭部模型性能大規模滲透進硅谷的開發者生態。

Airbnb的CEO公開表示公司"在很大程度上依賴阿里巴巴的Qwen"，硅谷頂級投資人查馬斯則透露已將大量工作負載從OpenAI和Anthropic遷移到了Kimi K2。

今年2月，這個趨勢已經有了一個標志性的數據節點：在全球最大的大模型API聚合平臺OpenRouter上，中國模型的單月Token調用量歷史上首次超過美國模型——其中智譜GLM-5、MiniMax M2.5、月之暗面Kimi K2.5、DeepSeek V3.2分居調用榜前列。

如果說當時的敘事核心在于中國AI"更好更便宜"，那GPT-5.4的發布暴露出的信號，已經超出了"性價比"的范疇。

這一次，不是中國模型能用更低的價格做到美國模型能做的事，而是中國公司在技術思路和產品方向上，走到了和OpenAI同一個甚至更前的位置。

Kimi在"AI自主完成任務"方向上比GPT-5.4早近半年布局，智譜對"智能體工程"的判斷比GPT-5.4早近一個月落地發布，MiniMax在Office生產力和編程工程化方向上的布局也完全獨立于OpenAI的節奏。

科技行業長期存在一種刻板印象叫"Copy to China"——美國做什么，中國跟著做什么。但在AI這個領域，這個敘事已經失效了。

GPT-5.4這次發布的直接背景是OpenAI需要追趕Anthropic的Claude——過去大半年里，Claude在computer use、代碼工程、文檔處理上持續加碼，一系列更新直接沖擊了傳統SaaS軟件的地盤，把"AI能不能替你干活"變成了行業最核心的競爭維度。

GPT-5.4主打的每一項能力，幾乎都是在補Claude已經建立起來的產品優勢。而中國公司在這同一個方向上的布局，不是在等美國公司打完之后再入場，而是獨立走到了同一個路口。

無論這背后是更早意識到了行業方向，還是更早完成了研發落地，至少有一點可以確認：在AI行業，方向不再是硅谷單方面定義的了。

當閉源做到的事開源也能做到

如果說能力層面是"并跑"，那接下來的問題就變得尖銳：GPT-5.4是閉源的，而上述中國模型幾乎全部開放了模型權重。

閉源模型的溢價邏輯，本質上建立在"我能做到你做不到的事"之上——只要能力是獨占的，定價權就是成立的。

但當開源模型在編程、文檔生產力、長文本處理等核心維度上逐項追平甚至局部超越，這個邏輯就開始松動了。

這有點像智能手機行業的蘋果和安卓：蘋果依然可以賣出溢價，但它的溢價來源已經從"獨占能力"轉向了"生態和品牌"，而它面對的不再是一個追趕者，而是一整個陣營。

GPT-5.4的處境正在變得類似。它仍然是一個優秀的產品，但它的定價已經很難再用"獨占能力"來支撐了。

GPT-5.4的API定價是每百萬輸入token 2.5美元、輸出15美元。GPT-5.4 Pro更貴，輸入30美元、輸出180美元。

MiniMax M2.5呢？輸入0.3美元，輸出2.4美元。連續運行一小時的成本大約是1美元。Qwen3.5的API價格大約是同等性能的谷歌Gemini 3 Pro的十八分之一。

而且MiniMax M2.5、智譜GLM-5、月之暗面Kimi K2.5、阿里Qwen3.5，全部開放了模型權重。由于開發者需求過于旺盛，智譜甚至在發布當天就宣布了編程方案漲價，漲幅超過30%——一個開源模型因為太多人搶著用而漲價，這個場景本身就說明了一些問題。

同一水平線上的能力，中國模型的價格是OpenAI的幾分之一到十幾分之一，而且還是開放權重的。這個事實可能比任何一項性能指標都更值得被關注。

美國AI的護城河在哪？

當然，GPT-5.4也有中國模型短期內做不到的東西，而且恰恰不在技術本身。

它同步接入了FactSet、道瓊斯Factiva、LSEG、標普全球等西方主流金融數據源，讓華爾街的分析師可以在一個工作流里完成數據獲取、建模和輸出。法律AI公司Harvey稱GPT-5.4在其BigLaw Bench上拿到91%的成績，在處理復雜交易分析和長合同時表現最優。再加上ChatGPT在全球消費市場積累的品牌認知和用戶基礎，這些生態層面的優勢不是模型性能追上就能解決的。

值得注意的是，GPT-5.4在性能上也有突破，它在OS-World上75.0%的得分超越了人類基準的72.4%，在SWE-Bench Pro上拿到57.7%，在OpenAI內部投行基準上從GPT-5的43.7%飆升到87.3%。在桌面操控這條特定賽道上，GPT-5.4確實把天花板往上推了一大截。

但反過來，中國AI公司也擁有OpenAI難以復制的東西：一個春節期間五六家公司同時發布旗艦模型的產業密度，一個以極低成本向全球開發者開放的開源生態，以及在OpenRouter等開發者平臺中快速積累的海外用戶基本盤。

曾經是行業標桿的OpenAI，這次發布的產品方向與中國公司高度重合。這件事本身就是一個信號：中美AI的位置關系，已經不是"領跑者和追趕者"那么簡單了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.