<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<kbd id="gh6zm"></kbd>

<tr id="gh6zm"></tr>

<meter id="gh6zm"></meter>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.4：和OpenClaw更搭配、搞定專業工作場景

2026-03-06 09:16:35　來源: 董指導聊科技

上海舉報

0

分享至

文：董指導

OpenAI 終于祭出了其籌備已久的重磅武器了：GPT-5.4 Thinking 與 GPT-5.4 Pro。

奧特曼（Sam Altman）照例地稱其為“迄今為止最強大的模型”。雖然這句話他每次都說、幾乎每家公司也都會說，但這一次，指標數據的跑分，確實有“資本”。

1、原生電腦操作能力，超過“人類基準線”

最核心的突破在于 OSWorld-Verified 測試中拿到的75%這一高分。而人類在同一測試中的平均水平則是72.4%。

這個對人類的超越有什么意義呢？

OSWorld-Verified是公認的“最硬核”的真實桌面環境測試。AI需要在這個環境中像人一樣，通過視覺（看截圖）和操作（移動鼠標、鍵盤輸入）來完成跨軟件的任務。

簡單說，就是能否絲滑操作電腦。從只會動嘴，到動手。

這個能力對于Agent非常重要，尤其最近火爆的OpenClaw，也很需要相關能力。

OSWorld測試中有幾個挑戰，比如：

視覺延遲（模型識別電腦屏幕、及時進行操作）、

坐標漂移（點不準，比如關閉、放大、縮小的緊密排列按鈕）、

長鏈條推理（比如“在 Excel 里分析數據，然后寫進郵件，根據回復附件改名”。只要中間有一步錯，任務就全毀了）等等。

這個指標在過去兩年經歷了快速迭代和大幅拉升。

之前的領先，一直是Claude，而GPT上一代才47%，根本不夠看的。國產之光Kimi也短暫沖榜第一。

Caude上一次得分，離72.4%仍差臨門一腳；結果，GPT 5.4直接加速沖刺、拔腳射門。OpenAI算是維護住了自己的“王者之風”。

提升的途徑在于“視覺感知能力”更強。

雖然測試、跑分都是有一定的套路的，和真實世界的復雜性仍有差距；但，這個突破，對于智能體、對于OpenClaw的普及還是很有幫助的。

不得不說，OpenClaw之父加入OpenAI之后，是真有效果啊。人才果然是AI時代的核心要素。

2、幻覺率降低了33%，更專業

基準測試只是面子，“不胡扯”才是里子。GPT-5.4事實陳述方面，將錯誤率降低了33%。

一個出錯率極低的模型，才能真正進入銀行、醫療、法律等高容錯要求的生產環境。

與之對應，在GDPval測試中，GPT-5.4在44種職業任務里，有83%的結果達到或超越專業人士水準，比上一代70.9%顯著提升。

3、100 萬 Token 上下文

搭載了百萬級上下文窗口后，GPT-5.4 不再有“走神”的問題。

能夠一次性記錄一家中型企業的年度所有周報和財務報表，并在此基礎上進行關聯分析。

GPT-5.4的能力突破，全面開花，幾乎沒有短板；除了“價格”：

輸入價格2.5美元/百萬token，輸出價格15美元/百萬token；Pro版本，輸入30美元/百萬token，輸出180美元/百萬token。

4、壓力與“追趕者”的陰影

盡管GPT-5.4表現強悍，但這次發布的背景則是被Claude的反超。

Claude 4.6 在代碼邏輯和長文本一致性上長期霸榜，甚至在部分開發者社區中，使用 Claude 的比例已經反超了 GPT。

OpenAI 迫切需要這場勝利來穩住其企業客戶（B 端）的流失。

在追趕不停歇，指標月月變的時代，確實要多思考、多關注。

---全文完，歡迎交流

理工/金融復合背景

暢銷書《英偉達之道》譯者

百億私募/頭部自媒體雙重經歷

看清科技、商業本質，講出精彩故事

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

100萬 Token + 接管鼠標：GPT-5.4 正把 AI 推向“數字員工”

鈦媒體APP 2026-03-06 09:15:15
1 跟貼 1
豆包電腦來了？GPT-5.4發布，這個能力亮了

雷科技 2026-03-06 16:44:48
2 跟貼 2

ChatGPT-5.4發布：和OpenClaw兼容，AI第一次比人類更會操作電腦

DeepTech深科技 2026-03-06 10:47:43
35 跟貼 35

OpenClaw絕配！GPT-5.4問世，AI能力開始大一統，就是太貴

機器之心Pro 2026-03-06 12:00:27
2 跟貼 2
黑馬圖像模型被Nano Banana技術負責人點贊！

量子位 2026-03-06 22:34:17
0 跟貼 0

海外華人團隊打造，統一理解與生成的圖像模型，超越Nano banana

機器之心Pro 2026-03-06 14:31:14
1 跟貼 1

MMLU已死？「人類最后考試」登Nature：全球AI模型集體不及格！

新智元 2026-03-07 09:06:10
0 跟貼 0
DPO「只看總分不看細節」？TI-DPO用Token重要性重塑大模型對齊

機器之心Pro 2026-02-11 13:45:57
0 跟貼 0

Anthropic失業報告炸場！22-25歲年輕人被斬殺，AI淘汰75％編程

新智元 2026-03-06 13:16:27
83 跟貼 83
突然爆火！超多人搶著要，上門服務500元一次，有人稱賺了26萬，專家：先冷靜

浙江之聲 2026-03-07 14:01:40
455 跟貼 455
Gemini攻克宇宙弦難題，還自己想到了費曼技巧

DeepTech深科技 2026-03-07 23:14:50
0 跟貼 0
人社部：正研究措施發揮人工智能創造新崗位

新華社 2026-03-07 10:31:07
27 跟貼 27
美國監控法律為何跟不上AI的發展？

DeepTech深科技 2026-03-07 23:34:16
0 跟貼 0
GPT-5.4「原生操控電腦」實測封神！OpenClaw天選模型來了

新智元 2026-03-06 10:35:47
39 跟貼 39
別被眼睛騙了！小伙倒掛天花板挑戰，結局反轉看傻所有人！

大超搞笑 2026-03-04 15:05:55
9 跟貼 9
bbc 新聞部內部工作場景，人均15臺顯示器辦公

烈焰童子 2026-03-05 16:57:37
174 跟貼 174
兩個圖形看著不一樣，實際卻是一樣的，網友：這是視覺錯覺嗎

星沙時報 2026-03-03 14:13:35
0 跟貼 0
FlashAttention-4正式發布：算法流水線大改，矩陣乘法級速度

機器之心Pro 2026-03-06 14:48:35
0 跟貼 0
媒體:美國打仗遇到人口3000萬以上國家就沒法全身而退

新民周刊 2026-03-07 09:17:30
31955 跟貼 31955
代碼Agent的苦澀教訓！首次拆解上下文檢索，直指自動化軟件瓶頸

新智元 2026-03-07 17:35:04
1 跟貼 1
伊朗局勢匯總！周教授邏輯清晰，是我聽過最客觀的分析！

搞笑桔子 2026-03-07 00:12:22
0 跟貼 0
這份玩命的工作，也難續命了

中國新聞周刊 2026-03-06 18:57:04
6 跟貼 6
純視覺的戰場裸奔？看看伊朗怎么在地上畫假飛機騙M國的

映璇auto工作室 2026-03-07 23:40:27
0 跟貼 0
視覺與聽覺

AKA灰叔 2026-03-07 23:26:43
0 跟貼 0
全景視覺的Depth Anything來了！

機器之心Pro 2025-12-29 16:54:58
0 跟貼 0
仿真落地三難點：物理、視覺、交互

量子位 2025-12-12 04:34:09
0 跟貼 0
春雪潤京城

新浪財經 2026-03-07 18:06:52
0 跟貼 0
怕血管硬化這個指標一定要化驗

普外耿醫生 2026-03-06 11:55:13
0 跟貼 0
星爺這貪污水平沒誰了，1380萬秒變38萬，真是邏輯鬼才

悅悅看劇 2026-03-05 10:33:40
1 跟貼 1
剛下飛機行李就沒了！杭州姑娘花10多萬去南極旅游卻崩潰：衣物全靠借

環球網資訊 2026-03-03 08:53:57
6116 跟貼 6116
羅永浩怒懟算命大V！稱沒了膽也不慣著，網友：踢到鋼板了

雷科技 2026-03-07 23:58:00
17 跟貼 17
林俊旸會去哪？

版面之外 2026-03-08 00:07:16
1 跟貼 1
怎么判斷一家單位已經爛透了？

職場資深秘書 2026-03-07 10:09:03
0 跟貼 0
同學給學校修電腦，卻發現驚天秘密

主持生小爽 2026-03-07 19:16:22
0 跟貼 0
鏟屎官打游戲，貓在電腦后面，一臉生無可奈的樣子！

沖天的搞笑 2026-03-07 10:56:05
1 跟貼 1
發動機模型

制造科技 2026-03-04 18:55:15
0 跟貼 0
伊朗拒絕5G技術安全外包印度引發安全風暴

莉莉和奶奶 2026-03-08 04:43:50
0 跟貼 0
14B規模竟也能單卡實時生成視頻？多虧這個強大的開源底座

機器之心Pro 2026-03-07 20:08:46
0 跟貼 0
GPT-5.4龍蝦味太濃！各種能力全包圓，一個hi燒掉80美元？

機器之心Pro 2026-03-07 09:10:00
0 跟貼 0
斯諾克無法復制的神仙進球，視覺效果堪比電腦特效，桿桿都是驚喜

小七七體育解說 2026-03-06 06:47:40
4 跟貼 4

安徽29歲開邁巴赫相親，女子主動撲上遭拒后爬車頂賴著，網友評辣眼

安徽29歲開邁巴赫相親，女子主動撲上遭拒后爬車頂賴著，網友評辣眼

糖逗在娛樂

2026-03-07 22:30:03

魯迅在北京用3765塊大洋，買一套32間的四合院，如今值多少錢？

魯迅在北京用3765塊大洋，買一套32間的四合院，如今值多少錢？

鶴羽說個事

2026-03-07 18:52:54

網友吐槽別糊弄老百姓了，又是天才少年發國際論文，誰家的公子？

網友吐槽別糊弄老百姓了，又是天才少年發國際論文，誰家的公子？

眼光很亮

2026-03-08 01:43:40

近期，一名中國男子去泰國玩，花6000泰銖找21歲女孩，悲劇發生了

近期，一名中國男子去泰國玩，花6000泰銖找21歲女孩，悲劇發生了

鯨探所長

2026-03-01 14:38:25

汪小菲曝親媽私生活猛料，張蘭公開財產分配，馬筱梅的態度被罵慘

汪小菲曝親媽私生活猛料，張蘭公開財產分配，馬筱梅的態度被罵慘

秋姐居

2026-03-07 19:18:45

以色列特種兵深夜突襲慘敗，伊朗系成功伏擊，遠火轟擊F-35維修廠

以色列特種兵深夜突襲慘敗，伊朗系成功伏擊，遠火轟擊F-35維修廠

軍機Talk

2026-03-07 16:42:12

全校連坐！福州三中因一學生出現嚴重失信行為，和其所在學校說不

全校連坐！福州三中因一學生出現嚴重失信行為，和其所在學校說不

火山詩話

2026-03-07 19:18:12

“挺侮辱人的！”兒子為愛退學，上海阿姨花18萬元求分手，后續來了

“挺侮辱人的！”兒子為愛退學，上海阿姨花18萬元求分手，后續來了

上觀新聞

2026-03-07 20:57:04

鄰居把過道爆改成廚房和廁所后續，態度豪橫，不賣就砸，律師支招

鄰居把過道爆改成廚房和廁所后續，態度豪橫，不賣就砸，律師支招

不寫散文詩

2026-03-07 19:11:32

伊朗宣布發射新一代導彈等，精準打擊以色列從北到南多個目標，“敵方雷達系統在前幾波行動中已遭摧毀，所有導彈均成功命中”

伊朗宣布發射新一代導彈等，精準打擊以色列從北到南多個目標，“敵方雷達系統在前幾波行動中已遭摧毀，所有導彈均成功命中”

每日經濟新聞

2026-03-08 00:00:00

伊朗女足被逼唱國歌！否則親屬將被逮捕遭批：叛國者可判絞刑

伊朗女足被逼唱國歌！否則親屬將被逮捕遭批：叛國者可判絞刑

念洲

2026-03-07 20:39:56

商務部：如再次引發全球半導體產供鏈危機，荷方必須對此承擔全部責任

商務部：如再次引發全球半導體產供鏈危機，荷方必須對此承擔全部責任

每日經濟新聞

2026-03-07 21:14:20

離譜！67億身價的宇樹科技王興興被扒在青藤相親，網友急了

離譜！67億身價的宇樹科技王興興被扒在青藤相親，網友急了

雷科技

2026-03-07 15:42:00

德黑蘭突發巨大爆炸；伊朗稱已做好長期戰爭準備，正研發新型武器，已掌握敵軍的戰線、裝備和彈藥情況

德黑蘭突發巨大爆炸；伊朗稱已做好長期戰爭準備，正研發新型武器，已掌握敵軍的戰線、裝備和彈藥情況

揚子晚報

2026-03-07 09:50:23

她是上海著名演員，巔峰時遠赴美國，嫁給資本巨鱷，69歲人生贏家

她是上海著名演員，巔峰時遠赴美國，嫁給資本巨鱷，69歲人生贏家

白面書誏

2026-03-07 17:18:19

天助穆帥：2-2，穆帥爭冠勁敵遭絕平，多賽一場僅領先本菲卡4分

天助穆帥：2-2，穆帥爭冠勁敵遭絕平，多賽一場僅領先本菲卡4分

側身凌空斬

2026-03-08 04:47:00

同樣搞核武，美國為啥不敢動朝鮮，卻把伊朗往死里打？

同樣搞核武，美國為啥不敢動朝鮮，卻把伊朗往死里打？

三目觀史

2026-03-06 07:31:12

中東版農夫和蛇——伊朗瘋狂襲擊阿聯酋和伊拉克

中東版農夫和蛇——伊朗瘋狂襲擊阿聯酋和伊拉克

史政先鋒

2026-03-07 18:46:12

沒想到，2026兩會最火的提案不是醫療和就業，而是靳東的這一建議

沒想到，2026兩會最火的提案不是醫療和就業，而是靳東的這一建議

天天熱點見聞

2026-03-07 10:11:29

CBA史上最水全明星！徐杰被女高中生擊敗：一老將三分賽比肩喬丹

CBA史上最水全明星！徐杰被女高中生擊敗：一老將三分賽比肩喬丹

籃球快餐車

2026-03-08 04:13:12

董指導聊科技

遠川研究所原所長，得到APP“光伏產業報告”主理人，多家公司產業研究顧問。聚焦科技、能源領域。

118文章數 14關注度

往期回顧全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

中國貨船通過霍爾木茲海峽后美國宣布200億美元計劃

頭條要聞

中國貨船通過霍爾木茲海峽后美國宣布200億美元計劃

體育要聞

塔圖姆298天走完這段路只用27分鐘征服這座城

娛樂要聞

汪小菲曝親媽猛料，張蘭公開財產分配

財經要聞

針對"不敢休、不讓休"怪圈國家出手了

汽車要聞

逃離ICU，上汽通用“止血”企穩

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

時尚

手機

本地

游戲

轉頭就暈的耳石癥，能開車上班嗎？

2026春夏一定要擁有的6只包，好看又百搭

手機要聞

vivo X300 Max真機曝光，圓形后攝方案

本地新聞

食味印象｜一口入魂！康樂烤肉串起千年絲路香

津南好·四時總相宜
妝藝大游行2026：愿
春花齊放2026：《駿馬奔騰迎新歲》

外媒:Xbox新主機恐成微軟絕唱!失敗即退出硬件市場

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<acronym id="4onkd"></acronym>

<tfoot id="4onkd"><strike id="4onkd"><pre id="4onkd"></pre></strike></tfoot>

<abbr id="4onkd"><rp id="4onkd"></rp></abbr>