<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.3上線Codex!OpenAI回應Claude新模型只用了15分鐘

      0
      分享至

      Jay 發自 凹非寺
      量子位 | 公眾號 QbitAI

      火星撞地球,新模型大戰!

      Claude Opus 4.6發布僅僅15分鐘,OpenAI也甩出了自己最新最強編程模型——

      GPT-5.3-Codex。



      最直觀的感受是,這個新模型終于有點美學品味了。

      官方展示了兩個Demo:一個賽車游戲、一個潛水游戲。還蠻有風格的。



      據說,GPT-5.3-Codex在幾乎沒有人工干預的情況下,持續迭代這些游戲,累計消耗了數百萬token

      在網頁開發上,除了UI更好看,對「意圖」的理解也更強了。

      即便Prompt給得不清楚,它也能自動補全邏輯,生成一個功能齊全的網站。



      就這些Demo來看,設計感確實比之前強了一截。

      Computer use能力同樣拉滿,現在已經能用來幫金融從業者直接做PPT。



      其他職場工作也能覆蓋,尤其是在專業知識密集型任務上,寫文檔、做電子表格都沒什么問題。



      硬實力方面,官方給出的亮點如下:

      • 更聰明:SWE-Bench Pro 57%,TerminalBench 2.0 76%,OSWorld 64%。
      • 更可控:支持任務進行中的實時引導,可隨時調整方向并獲取更新。
      • 更快速:完成相同任務時,所需token不到5.2-Codex的一半,單token速度提升超過25%。
      • 更Agent:不只是更會寫代碼,計算機操作同樣很強。

      直接看這張對比表會更直觀,幾乎每一個維度,都比上一代有明顯提升。



      網友直呼過于刺激,昨天OpenAI剛被Anthropic拿廣告狙了一槍,今天就對轟了回來。

      一天之內,兩個重量級編程模型



      評論區也迅速分成了Anthropic派和OpenAI派。





      下面來看看,這場奧特曼主動挑起的AI coding大戰,OpenAI到底表現如何?

      GPT 5.3 Codex

      大家最關心的,當然還是編程能力。

      OpenAI表示,GPT-5.3-Codex在SWE-Bench Pro上實現了SOTA。

      這是一個專為真實世界軟件工程設計的測試,覆蓋四種編程語言,整體難度更高、任務更豐富,也更貼近真實生產場景。



      同時,GPT-5.3-Codex在Terminal-Bench 2.0上的表現也有明顯提升。



      更關鍵的是效率。在拿下這些成績的同時,GPT-5.3-Codex使用的token數量少于任何以往模型

      除了編程能力,新一代Codex的另一個重點是Computer use

      OSWorld是一項面向智能體的計算機使用基準測試,要求模型在可視化的桌面計算機環境中完成各類生產力任務。

      結果顯示,GPT-5.3-Codex在計算機使用能力上,明顯強于此前的GPT模型。



      綜上,GPT-5.3-Codex不是一次單點模型能力突破,更像是基于智能體的全方位發展,編碼、前端開發、計算機操作全都有提升

      更有意思的是,這次GPT-5.3-Codex直接參與了自己的訓練過程

      OpenAI表示,這是他們首個參與「自我加速」的模型。Codex團隊在研發過程中使用其早期版本,來調試自身訓練流程、管理部署,并評估測試結果。

      官方也給出了一些具體例子。

      訓練階段,研究團隊使用Codex監控和調試訓練任務,幫助在整個訓練過程中追蹤模型行為變化,對交互進行深入分析,并提出改進方案。

      數據分析方面,一位數據科學家與GPT-5.3-Codex協作,構建了新的數據管道,并以遠超傳統儀表盤工具的方式對結果進行了可視化。

      隨后,研究人員與Codex一起分析這些結果,模型在不到三分鐘內,就從數千個數據點中提煉出了關鍵洞見。

      工程團隊則借助Codex優化和適配GPT-5.3-Codex的測試與運行框架。

      當開始出現影響用戶體驗的異常邊緣案例時,團隊成員通過Codex定位到了上下文渲染相關的缺陷,并進一步追溯到了緩存命中率偏低的原因。

      Two More Things

      與Anthropic的巔峰對決的確相當精彩,但OpenAI其實還有兩個值得關注的大動作。

      1、Frontier:一個幫助企業打造「AI同事」的平臺



      這是OpenAI一項相當重磅的ToB業務,目標很明確:讓Agent真正進入公司工作流。

      具體實現方式,包括共享上下文、上手式的入職引導、帶反饋的實踐學習,以及清晰的權限與邊界。

      據悉,HP、Intuit、Oracle、State Farm、Thermo Fisher和Uber等知名企業,已經早早采用了Frontier。

      2、AI4S:OpenAI和Ginkgo聯手,用GPT-5把蛋白質合成成本打下來了40%



      這是一家做合成生物學的實驗室型公司,他們將GPT-5接入一座自主實驗室,讓模型可以提出實驗方案、規模化執行實驗、從結果中學習,并決定下一步該嘗試什么,完整跑通了一個閉環。

      2026年,或許是AI4S加速演進的一年。

      不過,在OpenAI忙著和Anthropic對狙,網友們被一系列新動態弄的眼花繚亂的同時,評論區也有另一種聲音。

      • 把4o還給我!!



      直到現在,奧特曼依然沒有回應4o被徹底下架這件事。

      或許,真的是和Anthropic打得太忙了。




      [1]https://openai.com/index/introducing-gpt-5-3-codex/
      [2]https://openai.com/index/introducing-openai-frontier/
      [3] https://x.com/i/trending/2019496485793198148

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      太平年:水丘滅門才知胡進思病死的真相,錢弘俶的格局藏著高智慧

      太平年:水丘滅門才知胡進思病死的真相,錢弘俶的格局藏著高智慧

      慫熊劇場
      2026-02-06 04:09:48
      自由落體的俄羅斯伊爾-76軍用運輸機 從空中一頭栽了下來

      自由落體的俄羅斯伊爾-76軍用運輸機 從空中一頭栽了下來

      那些看得見的老照片
      2026-02-06 11:20:03
      陳冠希一家洛杉磯參加婚禮,留小胡子像趙本山,女兒更像秦舒培!

      陳冠希一家洛杉磯參加婚禮,留小胡子像趙本山,女兒更像秦舒培!

      明星私服穿搭daily
      2026-01-19 07:30:49
      北大女學霸與清華丈夫相約丁克,10年后看到他日記,一怒將其毒死

      北大女學霸與清華丈夫相約丁克,10年后看到他日記,一怒將其毒死

      歷來都很現實
      2024-06-07 23:50:40
      不到3小時下單100萬單 阿里用奶茶拉開AI普及戰序幕 30億大項目開啟前馬云現身

      不到3小時下單100萬單 阿里用奶茶拉開AI普及戰序幕 30億大項目開啟前馬云現身

      財聯社
      2026-02-06 11:45:31
      再見了,勇士,傳奇終將落幕

      再見了,勇士,傳奇終將落幕

      體育新角度
      2026-02-05 22:49:47
      倍輕松實控人一個多月再度遭立案,涉嫌操縱證券市場

      倍輕松實控人一個多月再度遭立案,涉嫌操縱證券市場

      界面新聞
      2026-02-06 09:24:24
      精神病院套保牽出A股眼科連鎖巨頭?愛爾眼科回應

      精神病院套保牽出A股眼科連鎖巨頭?愛爾眼科回應

      21世紀經濟報道
      2026-02-06 13:31:04
      中國正加速拋售美債,美專家:中國用了新拋售方式,完全無法干預

      中國正加速拋售美債,美專家:中國用了新拋售方式,完全無法干預

      似水流年忘我
      2026-01-29 01:24:08
      不出意外,中國未來超50%人,將流入這幾個城市,房價或反彈

      不出意外,中國未來超50%人,將流入這幾個城市,房價或反彈

      童童聊娛樂啊
      2026-02-06 11:28:04
      S家洗白失敗!韓國綜藝錘了小S忽視姐姐病情,推卸責任甩鍋給大S

      S家洗白失敗!韓國綜藝錘了小S忽視姐姐病情,推卸責任甩鍋給大S

      萌神木木
      2026-02-04 19:05:07
      婚前如果做過人流手術,這事能瞞得住?這是我見過最完美的回答

      婚前如果做過人流手術,這事能瞞得住?這是我見過最完美的回答

      另子維愛讀史
      2026-02-05 22:57:12
      文班亞馬29+11+6+3無緣今日最佳球員!杰倫-約翰遜22+16+15創紀錄

      文班亞馬29+11+6+3無緣今日最佳球員!杰倫-約翰遜22+16+15創紀錄

      Tracy的籃球博物館
      2026-02-06 14:24:56
      張雨綺又帶火了一種新穿法:“上身去上班,下身去夜店”,好洋氣

      張雨綺又帶火了一種新穿法:“上身去上班,下身去夜店”,好洋氣

      阿雹娛樂
      2026-01-12 14:40:57
      120噸中國稀土被印韋丹塔公司非法轉售美軍工,中國嚴查誠信缺失

      120噸中國稀土被印韋丹塔公司非法轉售美軍工,中國嚴查誠信缺失

      南權先生
      2026-02-03 15:45:27
      中方領導人將訪美?外交部回應

      中方領導人將訪美?外交部回應

      澎湃新聞
      2026-02-05 17:13:03
      快船步行者多人交易生變,涉及球員遭“出戰凍結”

      快船步行者多人交易生變,涉及球員遭“出戰凍結”

      大眼瞄世界
      2026-02-06 10:49:15
      挪威王儲妃在愛潑斯坦別墅中的照片曝光,金融家對她“垂涎三尺”

      挪威王儲妃在愛潑斯坦別墅中的照片曝光,金融家對她“垂涎三尺”

      譯言
      2026-02-05 06:00:33
      紐卡換帥倒計時!功勛主帥已到極限,頭號目標竟是全球最佳少帥

      紐卡換帥倒計時!功勛主帥已到極限,頭號目標竟是全球最佳少帥

      奶蓋熊本熊
      2026-02-06 07:02:35
      特斯拉宣布:Model S/X現車上新,是“最后的入手機會”

      特斯拉宣布:Model S/X現車上新,是“最后的入手機會”

      第一財經資訊
      2026-02-06 13:46:30
      2026-02-06 15:12:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12123文章數 176373關注度
      往期回顧 全部

      科技要聞

      微信封禁元寶紅包后,又把阿里千問封了

      頭條要聞

      媒體:李嘉誠遭遇"零元購" 中方或將有兩個方向的操作

      頭條要聞

      媒體:李嘉誠遭遇"零元購" 中方或將有兩個方向的操作

      體育要聞

      西甲射手榜第2,身價不到姆巴佩1/40

      娛樂要聞

      微博之夜紅毯好精彩,堪比婚禮現場

      財經要聞

      愛爾眼科卷入騙保疑云 公司回應

      汽車要聞

      標配華為乾崑解決方案 華境S完成六座滿載冬測

      態度原創

      藝術
      本地
      家居
      公開課
      軍事航空

      藝術要聞

      Kristin Vestgard:挪威當代畫家

      本地新聞

      圍觀了北京第一屆黑色羽絨服大賽,我笑瘋了

      家居要聞

      現代輕奢 溫馨治愈系

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      不懼以軍攔截 “全球堅韌船隊”將再赴加沙

      無障礙瀏覽 進入關懷版