<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="1ma6i"><rt id="1ma6i"></rt></sub>

<blockquote id="1ma6i"><i id="1ma6i"><noscript id="1ma6i"></noscript></i></blockquote>

<var id="1ma6i"><button id="1ma6i"><form id="1ma6i"></form></button></var>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.3上線Codex！OpenAI回應Claude新模型只用了15分鐘

2026-02-06 10:43:56　來源: 量子位

北京舉報

0

分享至

Jay 發自凹非寺
量子位 | 公眾號 QbitAI

火星撞地球，新模型大戰！

Claude Opus 4.6發布僅僅15分鐘，OpenAI也甩出了自己最新最強編程模型——

GPT-5.3-Codex。

最直觀的感受是，這個新模型終于有點美學品味了。

官方展示了兩個Demo：一個賽車游戲、一個潛水游戲。還蠻有風格的。

據說，GPT-5.3-Codex在幾乎沒有人工干預的情況下，持續迭代這些游戲，累計消耗了數百萬token

在網頁開發上，除了UI更好看，對「意圖」的理解也更強了。

即便Prompt給得不清楚，它也能自動補全邏輯，生成一個功能齊全的網站。

就這些Demo來看，設計感確實比之前強了一截。

Computer use能力同樣拉滿，現在已經能用來幫金融從業者直接做PPT。

其他職場工作也能覆蓋，尤其是在專業知識密集型任務上，寫文檔、做電子表格都沒什么問題。

硬實力方面，官方給出的亮點如下：

更聰明：SWE-Bench Pro 57%，TerminalBench 2.0 76%，OSWorld 64%。
更可控：支持任務進行中的實時引導，可隨時調整方向并獲取更新。
更快速：完成相同任務時，所需token不到5.2-Codex的一半，單token速度提升超過25%。
更Agent：不只是更會寫代碼，計算機操作同樣很強。

直接看這張對比表會更直觀，幾乎每一個維度，都比上一代有明顯提升。

網友直呼過于刺激，昨天OpenAI剛被Anthropic拿廣告狙了一槍，今天就對轟了回來。

一天之內，兩個重量級編程模型

評論區也迅速分成了Anthropic派和OpenAI派。

下面來看看，這場奧特曼主動挑起的AI coding大戰，OpenAI到底表現如何？

GPT 5.3 Codex

大家最關心的，當然還是編程能力。

OpenAI表示，GPT-5.3-Codex在SWE-Bench Pro上實現了SOTA。

這是一個專為真實世界軟件工程設計的測試，覆蓋四種編程語言，整體難度更高、任務更豐富，也更貼近真實生產場景。

同時，GPT-5.3-Codex在Terminal-Bench 2.0上的表現也有明顯提升。

更關鍵的是效率。在拿下這些成績的同時，GPT-5.3-Codex使用的token數量少于任何以往模型

除了編程能力，新一代Codex的另一個重點是Computer use

OSWorld是一項面向智能體的計算機使用基準測試，要求模型在可視化的桌面計算機環境中完成各類生產力任務。

結果顯示，GPT-5.3-Codex在計算機使用能力上，明顯強于此前的GPT模型。

綜上，GPT-5.3-Codex不是一次單點模型能力突破，更像是基于智能體的全方位發展，編碼、前端開發、計算機操作全都有提升

更有意思的是，這次GPT-5.3-Codex直接參與了自己的訓練過程

OpenAI表示，這是他們首個參與「自我加速」的模型。Codex團隊在研發過程中使用其早期版本，來調試自身訓練流程、管理部署，并評估測試結果。

官方也給出了一些具體例子。

訓練階段，研究團隊使用Codex監控和調試訓練任務，幫助在整個訓練過程中追蹤模型行為變化，對交互進行深入分析，并提出改進方案。

數據分析方面，一位數據科學家與GPT-5.3-Codex協作，構建了新的數據管道，并以遠超傳統儀表盤工具的方式對結果進行了可視化。

隨后，研究人員與Codex一起分析這些結果，模型在不到三分鐘內，就從數千個數據點中提煉出了關鍵洞見。

工程團隊則借助Codex優化和適配GPT-5.3-Codex的測試與運行框架。

當開始出現影響用戶體驗的異常邊緣案例時，團隊成員通過Codex定位到了上下文渲染相關的缺陷，并進一步追溯到了緩存命中率偏低的原因。

Two More Things

與Anthropic的巔峰對決的確相當精彩，但OpenAI其實還有兩個值得關注的大動作。

1、Frontier：一個幫助企業打造「AI同事」的平臺

這是OpenAI一項相當重磅的ToB業務，目標很明確：讓Agent真正進入公司工作流。

具體實現方式，包括共享上下文、上手式的入職引導、帶反饋的實踐學習，以及清晰的權限與邊界。

據悉，HP、Intuit、Oracle、State Farm、Thermo Fisher和Uber等知名企業，已經早早采用了Frontier。

2、AI4S：OpenAI和Ginkgo聯手，用GPT-5把蛋白質合成成本打下來了40%

這是一家做合成生物學的實驗室型公司，他們將GPT-5接入一座自主實驗室，讓模型可以提出實驗方案、規模化執行實驗、從結果中學習，并決定下一步該嘗試什么，完整跑通了一個閉環。

2026年，或許是AI4S加速演進的一年。

不過，在OpenAI忙著和Anthropic對狙，網友們被一系列新動態弄的眼花繚亂的同時，評論區也有另一種聲音。

把4o還給我！！

直到現在，奧特曼依然沒有回應4o被徹底下架這件事。

或許，真的是和Anthropic打得太忙了。

[1]https://openai.com/index/introducing-gpt-5-3-codex/
[2]https://openai.com/index/introducing-openai-frontier/
[3] https://x.com/i/trending/2019496485793198148

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

豪擲上億只為說我不恰飯？Claude這波騎臉，奧特曼徹底急了

新智元 2026-02-05 17:25:29
0 跟貼 0
AI賣廣告，吵到了超級碗：全球網友圍觀奧特曼破防

機器之心Pro 2026-02-06 14:18:01
0 跟貼 0

超級碗廣告暗諷OpenAI：AI工具到底該不該有廣告？

雷科技 2026-02-06 14:26:08
0 跟貼 0

大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
AgentDoG：為AI智能體戴上「診斷項圈」

機器之心Pro 2026-02-06 14:22:10
0 跟貼 0

人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
16 跟貼 16

“簡直反烏托邦”！這個網站讓AI租用人類干活，8萬人正“待租”

華爾街見聞官方 2026-02-06 14:02:50
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0

這個春節，千問、階躍、Gemini打響2026年「3.5模型大戰」

雷科技 2026-02-06 14:49:58
0 跟貼 0
微信聊天遭老板監視，主流殺毒軟件失明

每日經濟新聞 2025-12-25 19:02:17
0 跟貼 0
AP2O-Coder 讓大模型擁有「錯題本」，像人類一樣按題型高效刷題

機器之心Pro 2026-01-14 15:07:07
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
賈躍亭再闖新賽道！沒賣幾臺車就開始造機器人，遭全網吐槽

雷科技 2026-02-06 14:40:18
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
互聯網大廠布局漫劇野心：3倍速出片，3個人干50人的活

鈦媒體APP 2026-02-05 19:41:08
0 跟貼 0
媒體：李嘉誠遭遇"零元購" 中方或將有兩個方向的操作

看看新聞Knews 2026-02-05 18:39:22
33333 跟貼 33333
我記得美隊要拿一個神奇女俠的模型

C位影視解說 2026-02-04 10:39:31
1 跟貼 1
小姑子強勢霸占嫂子房子，我哥的就是我的，奇葩邏輯讓人憤怒

熊樣動漫 2026-02-04 05:09:10
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
31 跟貼 31
陳丹琦入職Mira翁荔公司，原來是有IOI三金王賽友

量子位 2026-02-06 14:29:49
0 跟貼 0
Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
21 跟貼 21
中國戰機迭代殺瘋了！殲20悄悄變臉，梟龍竟被巴鐵改成核轟炸機

戰武科普 2026-02-03 17:51:38
0 跟貼 0
GPT-5編程成績有貓膩！自刪23道測試題，關鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15
機器人擺俄羅斯方塊明顯第一個干的少

趣閃一刻 2026-02-06 11:14:30
1 跟貼 1
男孩問小姨該怎么稱呼她的老公，小姨不語，只是一味地笑，網友：別說，他的邏輯好像沒錯

城市大眼睛 2026-02-05 15:15:00
0 跟貼 0
這些冷門城市，竟是最具幸福感的地方？

大象新聞 2026-02-05 19:21:08
683 跟貼 683
Claude Opus 4.6殺死編程比賽！挖出500個day0漏洞，生成k線成交量分布，還有PPT直出

智東西 2026-02-06 13:18:06
1 跟貼 1
河南一景區發巨額年終獎，有員工領到45萬

大風新聞 2026-02-05 18:42:03
288 跟貼 288
中國量子計算機崛起！10分鐘干完超級計算機1.6萬年的活

雷科技 2025-11-28 19:11:16
24 跟貼 24
購房邏輯，需求排序，看房之前想清楚

老薛的直播日常 2026-02-05 13:38:14
0 跟貼 0
蘋果破防！App Store暴漲60%，全是「俺尋思」寫出來的？

新智元 2026-02-06 13:15:42
0 跟貼 0
現貨白銀跌幅再度擴大至16%

財聯社 2026-02-05 22:38:07
3867 跟貼 3867
我到現在才知道，那200塊到底去哪里了？原來是計算機出了問題

電工維修技術 2026-02-05 11:15:14
0 跟貼 0
計算機也沒想到，自己還能給人類傳情，真夫妻就是會玩！

土味生活家 2026-02-06 14:18:10
1 跟貼 1
向智而行，建設數字城市新標桿

環球網資訊 2026-02-06 10:01:11
0 跟貼 0
羅馬大學遭網絡攻擊：歐洲最大規模大學之一，計算機系統癱瘓數日

IT之家 2026-02-06 10:33:33
0 跟貼 0
千問的30億春節活動，依靠這家公司“落地”！| 0205

虎嗅APP 2026-02-06 11:07:11
0 跟貼 0
OpenAI奧特曼預測:未來AI會導致通貨緊縮所有東西價格會大幅下降!

網易科技態度見聞 2026-02-05 14:43:56
0 跟貼 0

太平年：水丘滅門才知胡進思病死的真相，錢弘俶的格局藏著高智慧

太平年：水丘滅門才知胡進思病死的真相，錢弘俶的格局藏著高智慧

慫熊劇場

2026-02-06 04:09:48

自由落體的俄羅斯伊爾-76軍用運輸機從空中一頭栽了下來

自由落體的俄羅斯伊爾-76軍用運輸機從空中一頭栽了下來

那些看得見的老照片

2026-02-06 11:20:03

陳冠希一家洛杉磯參加婚禮，留小胡子像趙本山，女兒更像秦舒培！

陳冠希一家洛杉磯參加婚禮，留小胡子像趙本山，女兒更像秦舒培！

明星私服穿搭daily

2026-01-19 07:30:49

北大女學霸與清華丈夫相約丁克，10年后看到他日記，一怒將其毒死

北大女學霸與清華丈夫相約丁克，10年后看到他日記，一怒將其毒死

歷來都很現實

2024-06-07 23:50:40

不到3小時下單100萬單阿里用奶茶拉開AI普及戰序幕 30億大項目開啟前馬云現身

不到3小時下單100萬單阿里用奶茶拉開AI普及戰序幕 30億大項目開啟前馬云現身

財聯社

2026-02-06 11:45:31

再見了，勇士，傳奇終將落幕

體育新角度

2026-02-05 22:49:47

倍輕松實控人一個多月再度遭立案，涉嫌操縱證券市場

倍輕松實控人一個多月再度遭立案，涉嫌操縱證券市場

界面新聞

2026-02-06 09:24:24

精神病院套保牽出A股眼科連鎖巨頭？愛爾眼科回應

精神病院套保牽出A股眼科連鎖巨頭？愛爾眼科回應

21世紀經濟報道

2026-02-06 13:31:04

中國正加速拋售美債，美專家：中國用了新拋售方式，完全無法干預

中國正加速拋售美債，美專家：中國用了新拋售方式，完全無法干預

似水流年忘我

2026-01-29 01:24:08

不出意外，中國未來超50%人，將流入這幾個城市，房價或反彈

不出意外，中國未來超50%人，將流入這幾個城市，房價或反彈

童童聊娛樂啊

2026-02-06 11:28:04

S家洗白失敗！韓國綜藝錘了小S忽視姐姐病情，推卸責任甩鍋給大S

S家洗白失敗！韓國綜藝錘了小S忽視姐姐病情，推卸責任甩鍋給大S

萌神木木

2026-02-04 19:05:07

婚前如果做過人流手術，這事能瞞得住？這是我見過最完美的回答

婚前如果做過人流手術，這事能瞞得住？這是我見過最完美的回答

另子維愛讀史

2026-02-05 22:57:12

文班亞馬29+11+6+3無緣今日最佳球員！杰倫-約翰遜22+16+15創紀錄

文班亞馬29+11+6+3無緣今日最佳球員！杰倫-約翰遜22+16+15創紀錄

Tracy的籃球博物館

2026-02-06 14:24:56

張雨綺又帶火了一種新穿法：“上身去上班，下身去夜店”，好洋氣

張雨綺又帶火了一種新穿法：“上身去上班，下身去夜店”，好洋氣

阿雹娛樂

2026-01-12 14:40:57

120噸中國稀土被印韋丹塔公司非法轉售美軍工，中國嚴查誠信缺失

120噸中國稀土被印韋丹塔公司非法轉售美軍工，中國嚴查誠信缺失

南權先生

2026-02-03 15:45:27

中方領導人將訪美？外交部回應

澎湃新聞

2026-02-05 17:13:03

快船步行者多人交易生變，涉及球員遭“出戰凍結”

快船步行者多人交易生變，涉及球員遭“出戰凍結”

大眼瞄世界

2026-02-06 10:49:15

挪威王儲妃在愛潑斯坦別墅中的照片曝光，金融家對她“垂涎三尺”

挪威王儲妃在愛潑斯坦別墅中的照片曝光，金融家對她“垂涎三尺”

譯言

2026-02-05 06:00:33

紐卡換帥倒計時！功勛主帥已到極限，頭號目標竟是全球最佳少帥

紐卡換帥倒計時！功勛主帥已到極限，頭號目標竟是全球最佳少帥

奶蓋熊本熊

2026-02-06 07:02:35

特斯拉宣布：Model S/X現車上新，是“最后的入手機會”

特斯拉宣布：Model S/X現車上新，是“最后的入手機會”

第一財經資訊

2026-02-06 13:46:30

追蹤人工智能動態

12123文章數 176373關注度

往期回顧全部

科技要聞

微信封禁元寶紅包后，又把阿里千問封了

頭條要聞

媒體：李嘉誠遭遇"零元購" 中方或將有兩個方向的操作

頭條要聞

媒體：李嘉誠遭遇"零元購" 中方或將有兩個方向的操作

體育要聞

西甲射手榜第2，身價不到姆巴佩1/40

娛樂要聞

微博之夜紅毯好精彩，堪比婚禮現場

財經要聞

愛爾眼科卷入騙保疑云公司回應

汽車要聞

標配華為乾崑解決方案華境S完成六座滿載冬測

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

本地

家居

公開課

軍事航空

藝術要聞

Kristin Vestgard：挪威當代畫家

本地新聞

圍觀了北京第一屆黑色羽絨服大賽，我笑瘋了

家居要聞

現代輕奢溫馨治愈系

簡雅序章自然且閑適
灰白意境光影奏鳴曲
極簡木藝術典雅自在

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最正宗的紋飾是什么？
李彥宏：百度離破產30天

軍事要聞

不懼以軍攔截 “全球堅韌船隊”將再赴加沙

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<ruby id="906ay"></ruby>