<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      實測 GPT-5.3-Codex,OpenAI 史上第一個高危模型,連 API 都還不敢給我們

      0
      分享至

      今天凌晨發(fā)布的 GPT-5.3-Codex 可以說是 OpenAI 對這段時間來,各種本地 Agent 爆火的一記重拳回擊,當(dāng)然主要是對 Anthropic 的反擊。

      配合 OpenAI 前幾天的發(fā)布的 Codex 桌面版應(yīng)用,Skill、Cowork、Claude Code,甚至是 Openclaw,這些熱門工具能實現(xiàn)的功能,現(xiàn)在通過 Codex 的外殼 + GPT-5.3-Codex 模型能力,都能做到了。


      在 Codex App 內(nèi)可以直接選擇 GPT-5.3-Codex 模型,也能選擇深度思考的強度

      和之前介紹 Cowork 的能力一樣,我們也丟了一些類似的任務(wù)讓 Codex 來完成,像是直接處理本地文件、各種格式轉(zhuǎn)換、調(diào)用不同的 Skills 組合能力、做 Word/PPT/Excel、下載視頻、開發(fā) App……

      GPT-5.3-Codex 的表現(xiàn)確實亮眼,相比較從頭開始安裝 Claude Code,對新人用戶來說,現(xiàn)在直接下載 Codex 會是一個更好的選擇。

      這也是未來模型廠商的一種趨勢,一開始大家都是從黑乎乎的命令行終端開始做本地 Agent,接著都慢慢回歸到可視化的友好界面。

      網(wǎng)上對 Codex 的評價在這幾天也有了不少逆轉(zhuǎn),許多開發(fā)者從 Claude Code 轉(zhuǎn)向 Codex,一些在國內(nèi)的獨立開發(fā)者也表示 Codex Plus 會員就可以用,而且還不會像 Claude 那般總是無情封號。


      奧特曼更是激動的宣布,Codex 的活躍用戶已經(jīng)超過 100 萬。在模型更新博客,也是毫不掩飾且留有余地的夸贊,

      GPT-5.3-Codex 是我們第一個能夠自我構(gòu)建的模型。通過使用 5.3-Codex,我們能夠以如此快的速度發(fā)布 5.3-Codex。

      跟 Claude 團隊用兩周的時間,使用 Claude Code,100% AI 代碼,搓出一個 Cowork 一樣;還有 OpenAI 去年年底發(fā)布的文章,「使用 Codex 在 28 天內(nèi)構(gòu)建 Android 版 Sora」,Agent 的時代真的來了。

      用 Codex 取代我的 ChatGPT 和 Claude Code

      和大多數(shù)的本地 Agent 類似,無論是終端還是 Cowork,我們都是先選擇一個工作文件夾。在 Codex 中,我們可以創(chuàng)建多個 Project,選擇對應(yīng)的文件夾,再進一步開始對話,Codex 把它們叫做 Threads 線程。

      先用最普遍和簡單的例子,我們添加了一個空的下載文件夾,然后點擊開始一個線程,選擇 GPT-5.3-Codex 模型;就像在 ChatGPT 里面對話一樣,輸入指令。

      要求它幫我們下載一個 X 視頻,Codex 會自動檢查可用的 Skills 來處理,接著通過 yt-dlp 工具進行下載,這個視頻有四個多小時長,Codex 會一直在對話框里自動更新下載進度。


      GIF 圖經(jīng)過加速處理

      視頻下載后,我們還可以要求它提取視頻的逐字稿,給我們一份雙語版本的文檔,最后讓它把整個流程打包為一個 Skill,方便下次使用。


      如果視頻中有一些比較有意思的片段,想要裁剪視頻,或者是把裁出來的視頻轉(zhuǎn)成 GIF 圖,在 Codex 里都能做到。

      例如,我們這里下載了一個視頻,然后要求它把視頻的 5s-25s 裁剪出來成為一個新的視頻;得益于 GPT-5.3-Codex 的 Token 快速處理,整個過程不需要很長時間,反而更多是取決于本地電腦的硬件解碼編碼能力。


      GIF 圖經(jīng)過加速處理

      或者我們也可以直接要求它把視頻的前 5s 轉(zhuǎn)成一個 GIF 文件,并且確保大小在 10MB 以內(nèi),幀數(shù)可以自行調(diào)整,清晰度上將寬度控制在 640px。

      很快,我們就能得到對應(yīng)的 GIF 文件。更極端一點,還能讓它把整個視頻轉(zhuǎn)成圖片,每秒 30 幀,每一幀就是一張圖。


      這些對本地文件的直接處理,和 GPT-5.3-Codex 在 Terminal-Bench-2 測試集上的優(yōu)異表現(xiàn),讓 Codex 基本上能滿足各種生產(chǎn)力工具、效率工具的功能實現(xiàn)。

      作為對比,同樣是剛剛發(fā)布的 Claude Opus 4.6 在 Terminal-Bench 2.0 上得分是 65.4%,GPT-5.3-Codex 是 77.3%。



      上下滑動查看更多內(nèi)容|圖片來源:

      https://x.com/neilsuperduper/status/2019486017703547309/

      例如在這個文件夾中,有多張圖片,我們首先是要求它根據(jù)圖片內(nèi)容,對這些圖片文件進行重命名,并保持文件名不超過 20 個字母,不允許使用符號。


      GIF 圖經(jīng)過加速

      自動修改完成后,我們還能要求他對這些圖片進行拼接,無論是垂直拼接還是水平,調(diào)用對應(yīng)的工具,Codex 都可以做到。


      和 Claude Skills 一樣,Codex 也能安裝 Skills 市場上豐富的技能,并且在應(yīng)用內(nèi),就已經(jīng)提供了包括 pptx、xls、word、canvas、notion 在內(nèi)的多款技能。


      回到基礎(chǔ)的編程能力,升級后的 GPT-5.3-Codex 表現(xiàn)也比 GPT-5.2 要好上不少。我們直接要求它寫一個「每日一詞」的 App。和在 ChatGPT 里面直接用 Canvas 給我們一個帶不走的網(wǎng)頁不同,Codex 能在本地從零開始,完成項目,然后使用 Vercel 或 Cloudflare 等 Skills 部署到網(wǎng)頁上。

      這里我們選擇的推理模式是 Extra High,超強推理模式,于是在每一步操作之前,GPT-5.3-Codex 都會詢問我下一步的操作選擇,這也和 Codex 內(nèi)部能直接根據(jù)任務(wù)情況,調(diào)用不同 Skills 有關(guān),其中的頭腦風(fēng)暴 Skill,會自動進行不斷對話的模式。


      最后,它基本上還是完成了我一開始要求它完成的全部功能,并且還能進一步開發(fā) macOS、iOS,和安卓版本。

      如果我們有現(xiàn)成的代碼項目,也可以選擇該項目文件夾,在 Codex 中打開,GPT-5.3-Codex 會分析項目存在的 Bug,并且修復(fù)它。



      在過去很長一段時間里,無論是工具還是模型,開發(fā)者的首選其實都是 Anthropic 的 Sonnet/Opus 模型和 Claude Code 工具。OpenAI 在編程、尤其是長代碼邏輯推理上的掉隊,曾讓不少開發(fā)者轉(zhuǎn)投陣營。

      GPT-5.3-Codex 的出現(xiàn),就是為了終結(jié)這場爭論。現(xiàn)在 GPT-5.3-Codex 在編程基準(zhǔn)測試和實際表現(xiàn)上,不僅碾壓了自家的前代模型,也確實有把友商模型按在地上摩擦的前兆。它真正具備了編寫、測試和推理代碼的能力。

      做游戲項目,是這次模型介紹博客里,網(wǎng)站開發(fā)部分主要案例,我們也讓 GPT-5.3-Codex 做了一個簡單的物理彈球游戲,整體的效果雖然沒有達到我的期待,因為我在提示詞里面有說希望這是一個 RPG 的游戲,但 GPT-5.3-Codex 給我的界面還是過于簡陋了。不過,好在還是能玩。


      我們也在 X 上找到了一些用 GPT-5.3-Codex 做的小游戲,像這個類似超級瑪麗的收集金幣。


      來源:https://x.com/Angaisb\_/status/2019548783869325331

      強中更有強中手

      對 Anthropic 來說,OpenAI 今天玩的這些,可能會說,這都是我們玩剩下的。無論是代碼、或者 Agent 的能力,還是開始著手去做本地 Agent,從之前 Codex 的終端轉(zhuǎn)成現(xiàn)在的 macOS App。

      在技術(shù)的領(lǐng)域,OpenAI 仿佛都是跟著 Claude 的腳步在走,Claude 深耕代碼能力,OpenAI 搞了 Sora、日報、瀏覽器、ChatGPT agent,都沒什么水花,于是也在代碼上發(fā)力;Claude 一月初推出 Cowork,OpenAI 也緊接著在二月初發(fā)布 Codex App。


      就和今天的密集發(fā)布一樣,凌晨 1:45,Claude 官方發(fā) X 推出 Claude Opus 4.6,緊接著就是 OpenAI 端上 GPT-5.3-Codex。兩款模型其實都是為了給 Agent 更強大的基座能力,以前是說代碼/vibe coding,但現(xiàn)在 Agent 能做好,基本上都是「寫代碼寫得好」。

      Opus 4.6 雖然在 SWE-Bench 上的表現(xiàn)甚至不如 Opus 4.5,并且 Terminal-Bench 2.0 上的成績也沒有 GPT-5.3-Codex 強,但是 Opus 破天荒地把上下文長度拉到了一百萬 token 的窗口。而且,這些 benchmark 的表現(xiàn)還沒有相差很多。

      Claude 說,我的 Sonnet 5 還沒上來,那才是真功夫。

      我們在網(wǎng)上也找了一些 Opus 4.6 最新的測試案例,有網(wǎng)友說 Claude 4.6 Opus 只是一次調(diào)用,就完全重構(gòu)了他的整個代碼庫,將原來混亂的代碼「屎山」全部模塊化,并且沒有模型能像 Opus 這樣做到。


      上下滑動查看更多內(nèi)容

      還有網(wǎng)友拿 Opus 4.6 和 4.5 進行對比,讓兩個模型玩同一款經(jīng)營游戲,看誰的賬戶等級、財富和裝備更高。測試博主提到,4.6 版本在初期制定戰(zhàn)略的時間更長,但是做出了更好的戰(zhàn)略決策,并且在最后確實做到了遙遙領(lǐng)先。



      還有網(wǎng)友也做了一個游戲,不過是一個寶可夢的克隆版。博主提到這是他用 AI 做出來的最酷的東西。他提到,Claude Opus 4.6 思考了 1 小時 30 分鐘,使用了 11 萬個 Token,并且只迭代了三次。

      https://x.com/chatgpt21/status/2019679978162634930

      在 CLaude 官方演示和早期用戶的反饋中,也提到了一個 Opus 表現(xiàn)優(yōu)秀的案例。Opus 4.6 在一天內(nèi)自主關(guān)閉了 13 個 issue,issue 即項目存在的待解決問題,并將另外 12 個 issue 準(zhǔn)確分派給了正確的人類團隊成員。

      和 Kimi K2.5 的智能體蜂群一樣,Opus 4.6 也能管理一個 50 人規(guī)模組織的代碼庫。在 Claude Code 中,我們可以組建 Agent Teams,召喚出一整個隊伍的 AI,不再是一個 AI 在戰(zhàn)斗。這些AI 可以有的負責(zé)寫代碼,有的負責(zé) Review,有的負責(zé)測試,它們之間自主協(xié)作。

      也有網(wǎng)友測試了 Claude Code 里面的 Agent 蜂群,提到啟用蜂群之后的 Opus 4.6,速度提升 2.5 倍,并且效果也更好。


      上下滑動查看更多內(nèi)容

      我們現(xiàn)在的狀態(tài)就跟這張圖片一樣,雖然一山比一山高,但都繞不出這個圈。前幾個月可能是 Gemini 賺走了風(fēng)頭,一月份來,應(yīng)該是 Claude,然后看樣子又要輪到 OpenAI,或者馬斯克的 Grok。


      好在這個輪回的過程中,作為用戶的我們,能明顯感覺到 AI 的能力一直在變強。

      GPT-5.3-Codex 的 API 還沒有開放,原因是模型太強了,會存在很大的風(fēng)險,所以 OpenAI 還在考慮怎么安全地啟用 API。

      Claude Opus 4.6 已經(jīng)可以在 Claude 通用聊天應(yīng)用、Claude Code、API 多種方式使用,這兩個作為今年國外御三家首發(fā)的兩款模型,非常值得一試。


      未來,更好的服務(wù) Agent,讓 Agent 為我們做事,還會是大模型更新的重點。

      歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關(guān)鏈接)


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      小姑子請全家吃大餐,我提前關(guān)掉手機免密支付,結(jié)賬時小姑子急了

      小姑子請全家吃大餐,我提前關(guān)掉手機免密支付,結(jié)賬時小姑子急了

      奶茶麥子
      2026-03-10 16:51:18
      張藝興被封殺事件:網(wǎng)傳張藝興因去年年底赴境外敏感地區(qū)參加活動未提前報備而被開除。

      張藝興被封殺事件:網(wǎng)傳張藝興因去年年底赴境外敏感地區(qū)參加活動未提前報備而被開除。

      貼小君
      2026-03-10 00:02:42
      陳皮加它一起煮,倒頭就睡還疏肝寧神,我靠這招睡飽覺氣色好

      陳皮加它一起煮,倒頭就睡還疏肝寧神,我靠這招睡飽覺氣色好

      江江食研社
      2026-03-10 14:13:03
      火爆全網(wǎng)的“養(yǎng)龍蝦”,第一批受害者已出現(xiàn)!有人被AI燒掉數(shù)萬元

      火爆全網(wǎng)的“養(yǎng)龍蝦”,第一批受害者已出現(xiàn)!有人被AI燒掉數(shù)萬元

      派大星紀錄片
      2026-03-10 11:13:04
      第十日中東戰(zhàn)況:第8名美軍陣亡,伊朗最厲害武器竟不是導(dǎo)彈

      第十日中東戰(zhàn)況:第8名美軍陣亡,伊朗最厲害武器竟不是導(dǎo)彈

      裝甲鏟史官
      2026-03-10 14:12:51
      「俠客島」美國打伊朗,歐洲為啥“不跟”?

      「俠客島」美國打伊朗,歐洲為啥“不跟”?

      海外網(wǎng)
      2026-03-10 19:32:05
      揪心!曝伊朗女足球員被強行拖上車:淚流滿面去機場 大巴車內(nèi)求救

      揪心!曝伊朗女足球員被強行拖上車:淚流滿面去機場 大巴車內(nèi)求救

      風(fēng)過鄉(xiāng)
      2026-03-10 21:00:08
      碎三觀!一河南網(wǎng)友哭訴長期被妻子身體“冷暴力”,評論區(qū)炸鍋…

      碎三觀!一河南網(wǎng)友哭訴長期被妻子身體“冷暴力”,評論區(qū)炸鍋…

      火山詩話
      2026-03-09 05:29:27
      特朗普“停戰(zhàn)”,還挺諷刺的

      特朗普“停戰(zhàn)”,還挺諷刺的

      中國新聞周刊
      2026-03-10 22:22:09
      70余名滯留中東臺胞經(jīng)上海中轉(zhuǎn)順利返臺

      70余名滯留中東臺胞經(jīng)上海中轉(zhuǎn)順利返臺

      極目新聞
      2026-03-10 22:17:59
      伊朗女足已乘機回國!登機時擁抱痛哭 至少1人拒離開+2人最終留守

      伊朗女足已乘機回國!登機時擁抱痛哭 至少1人拒離開+2人最終留守

      我愛英超
      2026-03-10 21:10:58
      近八百架無人機導(dǎo)彈奔襲莫斯科等地!烏克蘭對俄發(fā)動最大規(guī)模攻擊

      近八百架無人機導(dǎo)彈奔襲莫斯科等地!烏克蘭對俄發(fā)動最大規(guī)模攻擊

      項鵬飛
      2026-03-10 16:56:37
      賭球+假球+出賣球隊!被NBA終身禁賽后,他用一場三雙宣告回歸

      賭球+假球+出賣球隊!被NBA終身禁賽后,他用一場三雙宣告回歸

      球童無忌
      2026-03-10 20:13:59
      美國一華人等紅燈時遭人捅傷 !附近店主拿出速凍水餃止血,警方:受害者傷勢危及生命,嫌疑人逃離后不久被捕

      美國一華人等紅燈時遭人捅傷 !附近店主拿出速凍水餃止血,警方:受害者傷勢危及生命,嫌疑人逃離后不久被捕

      觀威海
      2026-03-10 17:03:04
      特朗普發(fā)表“收場”表態(tài)想結(jié)束沖突,伊朗會否同意?

      特朗普發(fā)表“收場”表態(tài)想結(jié)束沖突,伊朗會否同意?

      新民晚報
      2026-03-10 13:38:26
      兩會還沒結(jié)束,央媒對霍啟剛稱呼變了,四字之差釋放兩大強烈信號

      兩會還沒結(jié)束,央媒對霍啟剛稱呼變了,四字之差釋放兩大強烈信號

      格斗社
      2026-03-10 06:28:25
      工信部專家: 黨政機關(guān)、企事業(yè)單位和個人用戶要審慎使用“龍蝦”!國家互聯(lián)網(wǎng)應(yīng)急中心提示四大嚴重安全風(fēng)險

      工信部專家: 黨政機關(guān)、企事業(yè)單位和個人用戶要審慎使用“龍蝦”!國家互聯(lián)網(wǎng)應(yīng)急中心提示四大嚴重安全風(fēng)險

      每日經(jīng)濟新聞
      2026-03-10 22:55:30
      伊朗開啟復(fù)仇!以色列首都已全面停電,小哈梅內(nèi)伊比想象中更強硬

      伊朗開啟復(fù)仇!以色列首都已全面停電,小哈梅內(nèi)伊比想象中更強硬

      派大星紀錄片
      2026-03-10 12:01:56
      金與正發(fā)出警告:后果可怕,不堪設(shè)想!

      金與正發(fā)出警告:后果可怕,不堪設(shè)想!

      IN朝鮮
      2026-03-10 16:38:48
      全國高速統(tǒng)一限速!這4種超速不再罰款,車主:終于不用踩急剎了

      全國高速統(tǒng)一限速!這4種超速不再罰款,車主:終于不用踩急剎了

      劉哥談體育
      2026-03-10 19:15:54
      2026-03-11 03:20:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6170文章數(shù) 26794關(guān)注度
      往期回顧 全部

      科技要聞

      全民"養(yǎng)蝦"背后:大廠集體下場瘋狂賣Token

      頭條要聞

      伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

      頭條要聞

      伊朗新最高領(lǐng)袖在襲擊中受傷未公開發(fā)表講話 官方回應(yīng)

      體育要聞

      加蘭沒那么差,但鱸魚會用嗎?

      娛樂要聞

      《逐玉》注水風(fēng)波升級!315評論區(qū)淪陷

      財經(jīng)要聞

      “龍蝦補貼”密集出爐 最高1000萬!

      汽車要聞

      MG4有SUV衍生 上汽乘用車多款新車規(guī)劃曝光

      態(tài)度原創(chuàng)

      親子
      手機
      教育
      時尚
      家居

      親子要聞

      家長和同學(xué)們都應(yīng)該知道的20英里法則

      手機要聞

      M5 Max 版 16 英寸 MacBook Pro 體驗:算力巔峰與專業(yè)視界

      教育要聞

      南京十三中發(fā)來邀請函!

      看來看去這些才是適合普通人的穿搭!不花哨、不繁瑣,提氣質(zhì)

      家居要聞

      自然肌理 溫度質(zhì)感婚房

      無障礙瀏覽 進入關(guān)懷版