網易首頁 > 網易號 > 正文申請入駐

突發！OpenAI 放出“代碼之神”GPT-5.2 Codex 劍指谷歌、Anthropic，網友實測后感慨：很貴很好用

2025-12-19 11:09:19　來源: AI前線

北京舉報

分享至

編輯｜冬梅

北京時間昨日深夜，OpenAI 正式發布了新一代智能體編碼模型 GPT-5.2 Codex，并在官網同步發布技術博客，對該模型的定位、能力改進及部署方式進行了說明。

OpenAI 重磅發布 GPT-5.2 Codex

據介紹，GPT-5.2 Codex 基于通用模型 GPT-5.2 構建，并針對“智能體編碼”（Agentic Coding）場景進行了專門優化，主要面向復雜的軟件工程任務。相較此前版本，新模型在長程任務執行、大規模代碼變更、Windows 原生環境支持以及網絡安全相關能力等方面進行了系統性改進。

在工程能力層面，OpenAI 表示，GPT-5.2 Codex 通過引入原生的上下文壓縮（compaction）機制，提高了對超長上下文的理解與利用效率，使模型在跨文件、跨模塊的長期編碼任務中具備更穩定的表現。同時，該模型在代碼重構、遷移等涉及大規模改動的場景下，整體可靠性和一致性有所提升。

安全能力也是此次更新的重點方向之一。OpenAI 在博客中提到，隨著模型在推理與工具調用能力上的增強，其在網絡安全領域的適用性也隨之提升。

官方披露，就在上周，一名安全研究人員使用 GPT-5.1-Codex-Max 配合 Codex CLI，協助發現了 React 框架中的三個安全漏洞，并已通過負責任披露流程提交給相關方，這些漏洞可能導致拒絕服務或源代碼泄露風險。

在此基礎上，OpenAI 表示，GPT-5.2 Codex 是其目前網絡安全能力最強的 Codex 模型，但相關能力仍具有“雙重用途”屬性。根據 OpenAI 內部的“準備框架”（Preparedness Framework）評估，該模型尚未被劃定為“高等級”網絡安全能力水平，但公司在部署策略上已提前考慮未來能力增長所帶來的潛在風險。

在發布策略上，OpenAI 選擇優先通過受控渠道提供 GPT-5.2 Codex。目前，該模型已在 Codex CLI、IDE 擴展、云端環境以及代碼審查流程中上線，并從即日起向所有付費 ChatGPT 用戶開放。與此同時，OpenAI 正在推進 API 層面的安全開放方案，為未來第三方接入做準備。

針對網絡安全相關使用場景，OpenAI 還同步啟動了一項僅限邀請的試點計劃，向經過審查的安全研究人員和組織提供用途受限的訪問權限。該機制旨在支持已授權的防御性安全研究，同時保持對模型使用范圍和風險的控制。

性能表現如何？

具體而言，各項性能表現如何？

在能力融合方面，GPT-5.2 Codex 繼承了 GPT-5.2 在專業推理與事實準確性方面的特性，同時整合了 GPT-5.1-Codex-Max 在智能體編碼和終端操作上的能力。OpenAI 表示，這種組合使模型在復雜工程任務中能夠更穩定地調用工具、理解多模態輸入，并在控制 Token 使用效率的同時完成長時間推理。

官方還指出，新模型在處理編碼過程中共享的截圖、技術示意圖、數據圖表和用戶界面時具備更高的理解精度。在 Windows 原生環境下，GPT-5.2 Codex 的智能體執行效率和可靠性也有所提升。

在基準測試方面，GPT-5.2 Codex 參與了 SWE-Bench Pro 以及 Terminal-Bench 2.0 的評測。這兩項測試主要用于評估模型在真實代碼庫和終端環境中執行實際工程任務的能力。OpenAI 表示，相關結果顯示模型在上述場景中的整體表現較此前版本有所改進。

OpenAI 透露的一項網絡安全評估顯示，從 GPT?5-Codex 到 GPT?5.1-Codex-Max 再到 GPT?5.2-Codex，模型能力在持續提升。

OpenAI 預計，未來的 AI 模型將繼續沿著這一發展軌跡前進。

網友：好用，但成本略高

GPT?5.2-Codex 的發布在各大平臺上引發熱議。

在 Reddit 上，有用戶稱相比此前使用的 GPT-5.2，新模型在編碼能力上體感大約有一成左右的提升。他目前將模型運行在較高配置下，整體感受是表現穩定、可預測性強，執行過程可靠且邏輯清晰，在完成任務的同時還會對推理和操作步驟給出較為詳盡的說明。

不過，他也指出，這一模型在運行過程中會消耗更多的 Token，因此對個人用戶、業余開發者或小型企業而言，成本壓力可能較大，并不一定是最優選擇。但如果是中型企業，正在處理高度復雜、時間緊迫且具有關鍵業務影響的軟件工程問題，這一模型的價值會非常明顯，甚至會讓人“心存感激”。

另一位該模型的深度用戶對上述觀點表示贊同。他表示：

“我從模型發布之初就開始使用，目前主要在中等到高檔配置下運行（尚未嘗試最高檔）。在我的使用場景中，新版本相較于 GPT-5.1 Codex 有明顯提升。我正在編寫復雜的信號處理代碼，并會讓模型進行在線檢索，以確保輸出基于真實數據和已有研究成果。從實際體驗來看，整體效果非常出色。盡管我尚未系統對比該版本與 GPT-5.2 高配或超高配模式的差異，但后者不僅 Token 消耗極大，而且運行速度較慢。相比之下，目前使用的這一版本在速度和成本控制上顯得更為均衡。”

對于 OpenAI 公司如此快速的迭代產品的行為，有用戶任何這是很不可思議的。即便是在 FAANG 級別的公司，通常也需要數月甚至更長時間才能完成。該用戶表示：

“任何在大型組織工作過的人都知道，這種方向性的轉向，即便是在 FAANG 級別的公司，通常也需要數月甚至更長時間才能完成。

反過來看一個例子：ChatGPT 發布之后，谷歌大約花了將近兩年的時間才實現明顯的技術追趕，這一點其實相當夸張——畢竟 Transformer 架構最早就是他們提出的。相比之下，OpenAI 只用了幾個月時間就迅速縮小了差距。

這只是我個人的感受，但在技術類工作上，GPT-5.2 的表現已經優于 Gemini。當然，Opus 的能力確實不錯，但成本也很高，而且很可能是體量更大的模型。在這種前提下，兩者在實際表現上依然咬得很緊，本身就已經很令人意外了。

再加上 OpenAI 最近密集達成的各類合作，不得不說，Sam 在企業層面的運作和談判能力確實相當強。”

OpenAI計劃再融1000億美元，

估值或達8300億美元

在 GPT?5.2-Codex 發布之際，OpenAI 還被曝開啟新一輪融資，最高募集 1000 億美元。

據《華爾街日報》19 日援引知情人士消息稱，這筆新募集的資金將用來支持其在人工智能領域持續擴張的長期戰略。

如果該輪融資順利完成，OpenAI 的整體估值可能升至約 8300 億美元。

報道指出，這輪融資目前仍處于早期階段，相關交易結構和條款尚未最終敲定，未來仍存在調整空間。知情人士稱，OpenAI 希望最快在明年第一季度末完成本輪融資，但具體時間表取決于市場環境和投資者反饋。

若按計劃完成，這將成為 OpenAI 成立以來規模最大的一次融資，也將是當前全球私營科技公司中最具規模的資本運作之一。不過，市場是否具備足夠的投資者需求來消化如此體量的融資，仍有不確定性。

在公開市場對人工智能相關支出趨于謹慎的背景下，這輪融資被視為對 OpenAI 融資能力和長期戰略的一次重要考驗。近期，關于 AI 行業可能存在泡沫的討論持續升溫，已對多家相關科技公司的股價表現形成壓力。但對 OpenAI 而言，維持模型訓練、算力建設以及產品迭代所需的資本投入，仍然處于高位。

OpenAI 首席執行官 Sam Altman 近年來持續在全球范圍內接觸潛在投資者，試圖建立更為穩固的資本池。《華爾街日報》此前曾報道稱，OpenAI 也在權衡未來進行首次公開募股（IPO）的可能性。知情人士指出，在模型能力快速演進、競爭持續加劇的環境下，OpenAI 對資金的需求已遠超傳統科技初創公司的規模。

在本輪融資計劃中，軟銀集團被視為關鍵出資方之一。報道稱，軟銀已同意向 OpenAI 投資約 300 億美元。為支持這一投資承諾，軟銀上個月出售了價值約 58 億美元的英偉達股份。按照當前計劃，OpenAI 預計將在今年年底前從軟銀處獲得剩余約 225 億美元的資金。

除軟銀外，OpenAI 近期也密集推進多項交易。報道提到，該公司在年底前完成了一項內容許可協議，并獲得來自迪士尼的 10 億美元投資。知情人士表示，鑒于本輪融資規模龐大，OpenAI 預計將引入主權財富基金作為重要出資方。此前，該公司已獲得阿聯酋投資機構 MGX 的資金支持。

多筆交易顯示，即便在整體融資環境趨緊的背景下，OpenAI 仍具備較強的資本吸引力，但其長期擴張計劃的資金可持續性仍受到外界關注。

https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2-codex/

InfoQ 老友！請留步！極客邦 1 號客服上線工作啦！

后續我將通過微信視頻號，以視頻的形式持續更新技術話題、未來發展趨勢、創業經驗、商業踩坑教訓等精彩內容，和大家一同成長，開啟知識交流之旅

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.