<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      GPT-5.4發(fā)布,最適合OpenClaw的天選模型登場(chǎng)了。

      0
      分享至

      深夜凌晨2點(diǎn),我剛準(zhǔn)備睡覺。

      然后,GPT-5.4,突然發(fā)布。


      一下子激動(dòng)的睡不著了。

      真的,這真不是我天天咋咋呼呼啥的,我真的也很少會(huì)用激動(dòng)的睡不著覺這種表述。

      這是因?yàn)椋乙恢痹诘日桨娴腉PT-5.3或者GPT-5.4,來(lái)作為我的OpenClaw的首選模型。

      理由特別簡(jiǎn)單,因?yàn)楝F(xiàn)代世界三十年,本質(zhì)上基層都是代碼,我們現(xiàn)在看到的關(guān)于計(jì)算機(jī)和互聯(lián)網(wǎng)的一切,幾乎都建立在代碼的基礎(chǔ)之上。

      所以你可以理解為,代碼能力,在很多時(shí)候,就代表著Agent能力的一根粗壯的腿。

      一個(gè)優(yōu)秀的Agent基座模型,在我的理解里,一般來(lái)說,需要三種都很強(qiáng):

      代碼能力、世界知識(shí)、多模態(tài)理解。

      當(dāng)你這三個(gè)都能SOTA的時(shí)候,你幾乎必然就是最牛逼的Agent模型,當(dāng)然,還有一個(gè)重要的因素,就是價(jià)格。

      在過去,Claude Opus 4.6,幾乎就是Agent模型的代名詞,因?yàn)榇a、世界知識(shí)都很強(qiáng),多模態(tài)能力雖然比不過Seed 2.0和Gemini 3.1 Pro,但是在一些場(chǎng)景里面,也夠了,因?yàn)楝F(xiàn)在的Agent,跟現(xiàn)實(shí)物理交互還沒有那么多,那個(gè)已經(jīng)是具身智能的范疇了。

      而我過去很喜歡的GPT-5.3-Codex,代碼能力確實(shí)強(qiáng),在做任務(wù)執(zhí)行的時(shí)候,那簡(jiǎn)直就是指哪打哪。

      但是最大的問題,這玩意是一個(gè)編程特化模型啊,世界知識(shí)就是一坨屎,連GPT-5.2都不如,所以O(shè)penAI當(dāng)時(shí)也是沒辦法,為了跟Claude打一打,只能加個(gè)Codex的后綴給放出來(lái)了。

      所以你會(huì)發(fā)現(xiàn),在規(guī)劃能力上,是完全比不過Claude Opus 4.6的,但是最大的問題,其實(shí)還是因?yàn)槭澜缰R(shí)的問題,就導(dǎo)致這玩意。

      它說天書,講的那些話,真的,我不是程序員出身,我看那個(gè)話,看的就真的超級(jí)費(fèi)勁。

      就比如說,我讓他之前對(duì)我的一個(gè)AI熱點(diǎn)網(wǎng)站的項(xiàng)目進(jìn)行審查,主要就是review一下我的文檔規(guī)范和我整個(gè)代碼庫(kù)。

      然后,這哥們寫的文檔,我尼瑪。。。


      你再對(duì)比一下Claude Opus 4.6寫的。


      對(duì)比起來(lái)應(yīng)該一目了然。。。

      就是因?yàn)檫@玩意不說人話,世界知識(shí)也不行,所以,只是在Codex里面用用還好,但是你要是把它接到你的OpenClaw里面,去當(dāng)做默認(rèn)模型,你就知道啥叫災(zāi)難了,這哥們幾乎沒有人味,說起話來(lái)我想揍他。

      所以我當(dāng)時(shí)試了一下,就直接棄了,還是在我的OpenClaw里面,用的Claude Opus 4.6和Sonnet 4.6,做了一下場(chǎng)景調(diào)用。

      那為啥說,我很期待GPT-5.4呢。

      因?yàn)椋珻laude哪都好,但是,它貴啊!!!

      它真的好貴啊!!!!!!

      而且因?yàn)锳nthropic這個(gè)呆逼,它把OpenClaw給瘋了,所以我訂閱的Claude的Max Plan的額度,是完全不能給OpenClaw用的,只能在Claude Code用,你想在OpenClaw上用,只能硬接API Key用。

      但是大家都知道,Claude的API有多貴,那根本不是我們這種窮逼團(tuán)隊(duì)能用的起的,小規(guī)模用用還好,大規(guī)模用那公司直接破產(chǎn)了。

      之前還有一條路是用反代,把Google家的Antigravity里面的Claude額度用插件代理出來(lái),扔給OpenClaw用。


      但是后面Google開始大批量封號(hào),導(dǎo)致也沒辦法用了。

      我過年的時(shí)候Google賬號(hào)還被封了,被迫用AI去給Google寫了一份聲淚俱下的郵件。


      我說我錯(cuò)了,我再也不會(huì)了。

      后面Google才給我解封,但是反代肯定是用不了了。

      而OpenAI就不一樣了,最開始Claude瘋狂封OpenCode賬號(hào)的時(shí)候,OpenAI大手一揮,就站了出來(lái),說我們不封,大家全力使用。


      這是御三家里,唯一一個(gè)這么支持態(tài)度的,可以用第三方的工具,調(diào)用Codex的額度的。

      那對(duì)OpenClaw自然也不例外了,也是幾個(gè)頂級(jí)模型里面,為數(shù)不多的,可以直接走登錄的,其他的都得用API。


      真的,OpenAI這會(huì)真的是大善人。

      還瘋狂的給Codex加額度。


      所以啊,Claude在OpenClaw里用,好是好,但是不能用訂閱額度,只能用API,貴的一筆。

      OpenAI的模型倒是可以用訂閱額度,但是GPT-5.2代碼又不行,GPT-5.3-codex又不說人話。

      你看,要多別扭有多別扭。

      而這一次,GPT-5.4來(lái)了!!!

      終于把這個(gè)短板給補(bǔ)上了!

      代碼能力跟GPT-5.3-Codex齊平,世界知識(shí)比GPT-5.2還要強(qiáng),還能使用訂閱額度,20刀就可以用的超級(jí)爽。

      你就說,這不是最適合OpenClaw的天選模型,還有誰(shuí)是?嗯?

      從今天開始,用OpenClaw的,都把默認(rèn)模型切換到GPT-5.4去,真的,信我。

      回到GPT-5.4,老規(guī)矩,先看跑分。


      就很爽。

      先看最關(guān)鍵的幾個(gè)。

      GDPval:83.0%

      這個(gè)是測(cè)AI在真實(shí)工作任務(wù)中表現(xiàn)的,包括金融、法律等44種職業(yè)的知識(shí)工作。

      GPT-5.4 Thinking拿了83.0%,Claude Opus 4.6是78.0%,GPT-5.3 Codex是70.9%。

      在真實(shí)業(yè)務(wù)場(chǎng)景里,GPT-5.4不只是會(huì)寫代碼,它還能跟你聊業(yè)務(wù)、聊金融、聊法律、聊各種專業(yè)領(lǐng)域的東西。

      而且是用人話聊,不是用天書聊。

      SWE-Bench Pro:57.7%

      這個(gè)是測(cè)AI解決真實(shí)軟件工程問題的,不只是Python,而是測(cè)四種編程語(yǔ)言。

      GPT-5.4 Thinking拿了57.7%,GPT-5.3 Codex是56.8%。

      基本持平。

      這就是我最想看到的結(jié)果。

      代碼能力保住了GPT-5.3 Codex的水平,世界知識(shí)又補(bǔ)上來(lái)了。

      OSWorld-Verified也是,75.0%。這個(gè)是測(cè)AI操作電腦的能力的,就是讓AI像人一樣,用鼠標(biāo)點(diǎn)擊、用鍵盤輸入、在不同應(yīng)用之間切換,完成各種任務(wù)。

      GPT-5.4 Thinking拿了75.0%,超過了Claude Opus 4.6的72.7%,也保持了跟GPT-5.3-Codex的持平。

      而且,GPT-5.4操作電腦的速度,快的離譜。


      看下這個(gè)沒有加速過的視頻,會(huì)更直觀。

      ToolAthon:54.6%

      這個(gè)是測(cè)AI使用工具的能力的,也就是Agent能力的核心指標(biāo)之一。

      GPT-5.4 Thinking拿了54.6%,Claude Opus 4.6是44.8%。

      差了將近10個(gè)點(diǎn)。

      至于學(xué)術(shù)知識(shí)之類的,跟GPT-5.3-codex就沒法比了,因?yàn)镺penAI自己也知道,所以,直接當(dāng)時(shí)就沒跑。


      總之,翻譯成大白話就是。

      GPT-5.4 = GPT-5.3 Codex的代碼能力 + 比GPT-5.2還強(qiáng)的世界知識(shí) + 更強(qiáng)的工具使用能力 + 超級(jí)便宜的codex額度。

      這四樣加在一起,就是一個(gè)完美的OpenClaw天選基座模型。

      然后還有幾個(gè)很棒的特性更新:

      1. 100萬(wàn)token的上下文窗口。

      這是GPT-5.4的一個(gè)大升級(jí)。

      之前GPT-5.3的上下文窗口是40萬(wàn)token,GPT-5.4直接翻了一倍多,到了100萬(wàn)。

      這對(duì)Agent來(lái)說太重要了。

      因?yàn)锳gent在執(zhí)行任務(wù)的時(shí)候,需要保持對(duì)整個(gè)任務(wù)的上下文理解。如果上下文窗口不夠大,Agent干著干著就會(huì)忘事兒,前面說的東西后面就不記得了。

      100萬(wàn)token,基本上足夠應(yīng)對(duì)絕大部分的Agent任務(wù)了。

      當(dāng)然,OpenAI也不傻,他們說,超過27萬(wàn)token之后,你的額度就算兩倍了。


      不過因?yàn)镃odex給的額度實(shí)在是太多太多了,所以即使是2倍,其實(shí)也還好。

      2. 原生計(jì)算機(jī)使用能力。

      這個(gè)是GPT-5.4的另一個(gè)大賣點(diǎn)。

      OpenAI說,GPT-5.4是他們第一個(gè)內(nèi)置原生計(jì)算機(jī)使用能力的主線模型。

      它在編寫通過Playwright等庫(kù)操作計(jì)算機(jī)的代碼方面表現(xiàn)非常的出色,同時(shí)也能根據(jù)屏幕截圖發(fā)出鼠標(biāo)和鍵盤命令。

      也就是代碼和視覺齊飛,我感覺,這個(gè)小龍蝦接入以后,就真的可以,直接用視覺,操控你電腦上絕大多數(shù)的軟件了,真的,原生操控,想想都激動(dòng)。

      他們基于此,還發(fā)布了一個(gè)新的skills,叫playwright-interactive。

      允許Codex同時(shí)以代碼和視覺的兩種方式,調(diào)試Web和Electron應(yīng)用。


      網(wǎng)址在此,大家可以自行安裝。

      https://github.com/openai/skills/tree/main/skills/.curated/playwright-interactive

      3. 支持了工具搜索。

      以前呢,當(dāng)模型被賦予工具時(shí),所有工具定義都會(huì)預(yù)先包含在提示中。

      對(duì)于擁有大量工具的系統(tǒng),這可能會(huì)為每個(gè)請(qǐng)求增加數(shù)千甚至數(shù)萬(wàn)個(gè)token,而且絕大多數(shù)的時(shí)候,都毫無(wú)意義,平白無(wú)故的導(dǎo)致成本上升、響應(yīng)變慢,并在上下文中充斥模型可能永遠(yuǎn)不會(huì)使用的信息。

      所以呢,這次他們也支持了工具搜索,就是GPT?5.4不再直接接收完整工具定義,而是接收一份可用工具的輕量列表以及工具搜索功能。

      當(dāng)模型需要使用某個(gè)工具時(shí),它可以查找該工具的定義并在當(dāng)時(shí)將其追加到對(duì)話中。

      就非常像Skills漸進(jìn)式呈現(xiàn)的方式,目的很簡(jiǎn)單,還是優(yōu)化上下文工程。

      OpenAI在自己測(cè)試完以后,發(fā)現(xiàn)工具搜索配置在保持相同準(zhǔn)確率的同時(shí)將總體token使用量減少47%,這個(gè)就非常牛逼了。


      GPT-5.4 Thinking大概就是這樣。

      這次他們其實(shí)還發(fā)了個(gè)GPT-5.4 Pro,我就不細(xì)說了,反正就是一切都更牛逼了,但是對(duì)于大多數(shù)人來(lái)說,太貴了,也沒啥大用,必須得200刀的Pro會(huì)員才能用。

      API的整體價(jià)格還是得說一下,雖然大家大概率用的都會(huì)是訂閱的額度。


      相比于GPT-5.2,價(jià)格是漲了的,但是還是比Claude Opus 4.6,便宜不少,Claude Opus 4.6的價(jià)格是$5/$25每百萬(wàn)token(輸入/輸出),GPT-5.4只有他們一半。

      目前ChatGPT已經(jīng)上線了。


      Codex也已經(jīng)支持了,我自己在Codex里面粗淺體驗(yàn)了一下。


      首先撲面而來(lái)的,那自然是清新沁人的人話。。。

      比如我讓它去把OpenAI官網(wǎng)的視頻給扒拉下來(lái),你看看這個(gè)發(fā)言:“這種活最煩”,“省的跟Cloudflare互相折壽”。。。


      還有這個(gè)。

      真的,Codex的輸出,我真的能看得懂了。。。


      做出來(lái)的東西,前端審美有了不錯(cuò)的進(jìn)步,但還是不如Opus 4.6和Gemini。


      寫作粗略測(cè)了一下,還是一股子莫名其妙的愛用排比句的詭異的味道。

      奇奇怪怪。

      然后有點(diǎn)可惜的就是,我等到了凌晨6點(diǎn)多,OpenClaw目前使用Codex登錄的方式,還是沒有支持GPT-5.4。


      這就導(dǎo)致,我還是沒有機(jī)會(huì)測(cè)GPT-5.4在小龍蝦上的效果。

      不過估計(jì)我一覺睡醒,估計(jì)小龍蝦就支持了。

      因?yàn)樯鐓^(qū)里已經(jīng)看到很多用戶在催了,而且先行官們,都普遍反饋效果很好。

      坐等支持,我真的已經(jīng)迫不及待了。

      又是開心的一晚。

      如果你也在用OpenClaw,那記得OpenClaw支持了以后,把默認(rèn)模型切換到GPT-5.4。

      如果你還沒用過OpenClaw,那正好,現(xiàn)在是一個(gè)很好的開始時(shí)機(jī)。

      畢竟,有了GPT-5.4這個(gè)天選模型,體驗(yàn)只會(huì)更好。

      2026年,真是瘋狂的一年啊。

      睡了。

      以上,既然看到這里了,如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克

      >/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      爸爸夢(mèng)到已故兒子說腳被刺扎了,立馬驅(qū)車來(lái)到孩子墓前,眼前的一幕讓人驚呆了!

      爸爸夢(mèng)到已故兒子說腳被刺扎了,立馬驅(qū)車來(lái)到孩子墓前,眼前的一幕讓人驚呆了!

      張曉磊
      2026-04-10 11:24:23
      廣廈末節(jié)轟35-15逆轉(zhuǎn)橫掃寧波 胡金秋28+8塔克29+6+10

      廣廈末節(jié)轟35-15逆轉(zhuǎn)橫掃寧波 胡金秋28+8塔克29+6+10

      醉臥浮生
      2026-04-10 21:48:29
      以色列駐美大使強(qiáng)烈抨擊巴基斯坦國(guó)防部長(zhǎng)

      以色列駐美大使強(qiáng)烈抨擊巴基斯坦國(guó)防部長(zhǎng)

      Nee看
      2026-04-10 12:51:50
      廣東3消息!杜鋒再次強(qiáng)調(diào)困難,朱芳雨遭截胡,薩林杰最新傷情

      廣東3消息!杜鋒再次強(qiáng)調(diào)困難,朱芳雨遭截胡,薩林杰最新傷情

      多特體育說
      2026-04-10 22:57:03
      2025年我國(guó)留學(xué)回國(guó)人數(shù)達(dá)53.56萬(wàn)

      2025年我國(guó)留學(xué)回國(guó)人數(shù)達(dá)53.56萬(wàn)

      澎湃新聞
      2026-04-10 10:00:07
      門店腰斬2萬(wàn)家!一線撤離、雜牌泛濫,國(guó)民快餐巨頭徹底扛不住了

      門店腰斬2萬(wàn)家!一線撤離、雜牌泛濫,國(guó)民快餐巨頭徹底扛不住了

      藍(lán)色海邊
      2026-04-08 11:47:50
      薛之謙自曝滿頭斑禿水泡!“很癢的頭,硬挺一周沒洗頭”

      薛之謙自曝滿頭斑禿水泡!“很癢的頭,硬挺一周沒洗頭”

      韓小娛
      2026-04-09 16:45:16
      副國(guó)級(jí)高官錢運(yùn)錄:主政兩省立下鐵血家規(guī),親生長(zhǎng)子錢進(jìn)為何卻在武漢當(dāng)貨車司機(jī)?

      副國(guó)級(jí)高官錢運(yùn)錄:主政兩省立下鐵血家規(guī),親生長(zhǎng)子錢進(jìn)為何卻在武漢當(dāng)貨車司機(jī)?

      歷史回憶室
      2026-04-10 16:44:17
      鄭鈞送兒子出國(guó),jagger走路內(nèi)八、踉蹌崴腳,沒遺傳到父母顏值

      鄭鈞送兒子出國(guó),jagger走路內(nèi)八、踉蹌崴腳,沒遺傳到父母顏值

      翰飛觀事
      2026-04-10 14:48:14
      單親媽媽不停曬13歲女兒,希望能給孩子找個(gè)好的后爸

      單親媽媽不停曬13歲女兒,希望能給孩子找個(gè)好的后爸

      映射生活的身影
      2026-04-09 20:09:42
      商家宣稱1年內(nèi)可助力長(zhǎng)高10厘米,32歲男子付費(fèi)2萬(wàn)元,1年后身高無(wú)明顯變化……北京法院:退一賠三

      商家宣稱1年內(nèi)可助力長(zhǎng)高10厘米,32歲男子付費(fèi)2萬(wàn)元,1年后身高無(wú)明顯變化……北京法院:退一賠三

      極目新聞
      2026-04-09 18:46:01
      美政客竄臺(tái)再揭“民主燈塔”虛偽

      美政客竄臺(tái)再揭“民主燈塔”虛偽

      烽火瞭望者
      2026-04-10 06:35:05
      世體:卡瓦哈爾等7人涉嫌購(gòu)買走私手表,被安道爾法官指控

      世體:卡瓦哈爾等7人涉嫌購(gòu)買走私手表,被安道爾法官指控

      懂球帝
      2026-04-10 22:00:09
      以色列宣布:不停火,將繼續(xù)在黎作戰(zhàn),伊朗已虛弱,真主黨已被孤立!特朗普最新表態(tài),伊朗發(fā)聲!內(nèi)塔尼亞胡腐敗案將恢復(fù)審理

      以色列宣布:不停火,將繼續(xù)在黎作戰(zhàn),伊朗已虛弱,真主黨已被孤立!特朗普最新表態(tài),伊朗發(fā)聲!內(nèi)塔尼亞胡腐敗案將恢復(fù)審理

      每日經(jīng)濟(jì)新聞
      2026-04-10 20:48:29
      中美德“盾構(gòu)機(jī)”速度差距:德國(guó)每小時(shí)6米,美國(guó)3.6米,中國(guó)呢?

      中美德“盾構(gòu)機(jī)”速度差距:德國(guó)每小時(shí)6米,美國(guó)3.6米,中國(guó)呢?

      蜉蝣說
      2026-04-08 15:30:34
      鄭麗文訪陸,戳破“臺(tái)獨(dú)”丑態(tài)

      鄭麗文訪陸,戳破“臺(tái)獨(dú)”丑態(tài)

      烽火瞭望者
      2026-04-10 06:31:50
      烏戈卡位戰(zhàn)犯渾!不上萊迪護(hù)籃板,死用手帝自爆,為啥不用二哥?

      烏戈卡位戰(zhàn)犯渾!不上萊迪護(hù)籃板,死用手帝自爆,為啥不用二哥?

      籃球資訊達(dá)人
      2026-04-10 23:04:18
      傳光伏設(shè)備對(duì)美出口,被全面叫停!

      傳光伏設(shè)備對(duì)美出口,被全面叫停!

      趕碳號(hào)
      2026-04-09 23:27:22
      兩岸共識(shí)達(dá)成,鄭麗文吃完午宴,大陸盛情款待,1位特殊嘉賓現(xiàn)身

      兩岸共識(shí)達(dá)成,鄭麗文吃完午宴,大陸盛情款待,1位特殊嘉賓現(xiàn)身

      哄動(dòng)一時(shí)啊
      2026-04-10 17:15:37
      樊振東棄賽不到2天,荒唐的一幕出現(xiàn),原來(lái)他和全紅嬋處境一樣

      樊振東棄賽不到2天,荒唐的一幕出現(xiàn),原來(lái)他和全紅嬋處境一樣

      科學(xué)發(fā)掘
      2026-04-10 18:53:33
      2026-04-10 23:36:49
      數(shù)字生命卡茲克 incentive-icons
      數(shù)字生命卡茲克
      反復(fù)橫跳于不同的AI領(lǐng)域,努力分享一些很酷的AI干貨
      497文章數(shù) 616關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

      頭條要聞

      與內(nèi)塔尼亞胡通話后 特朗普改口了

      頭條要聞

      與內(nèi)塔尼亞胡通話后 特朗普改口了

      體育要聞

      17歲賺了一百萬(wàn)美元,25歲被CBA裁員

      娛樂要聞

      黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

      財(cái)經(jīng)要聞

      李強(qiáng)主持召開經(jīng)濟(jì)形勢(shì)專家和企業(yè)家座談會(huì)

      汽車要聞

      搭載第二代刀片電池及閃充技術(shù) 騰勢(shì)N8L閃充版預(yù)售35萬(wàn)起

      態(tài)度原創(chuàng)

      家居
      數(shù)碼
      手機(jī)
      公開課
      軍事航空

      家居要聞

      復(fù)古風(fēng)格 自然簡(jiǎn)約

      數(shù)碼要聞

      山靈SM1.3R流媒體數(shù)播解碼一體機(jī)開售預(yù)約,售價(jià)8998

      手機(jī)要聞

      華為Pura90來(lái)了!這個(gè)外觀你喜歡嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:對(duì)美國(guó)與伊朗達(dá)成和平協(xié)議“非常樂觀”

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版