<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      100萬 Token + 接管鼠標:GPT-5.4 正把 AI 推向“數字員工”

      0
      分享至


      如果一個 AI 能夠閱讀整套項目文檔,在復雜問題上進行長時間推理,并且自己操作電腦完成任務,它就不再只是一個聊天機器人。

      它更像是一種新的軟件形態。

      隨著 OpenAI 推出 GPT-5.4 Thinking 與 GPT-5.4 Pro,這種變化正在變得具體。100 萬 Token 上下文、推理時計算模式,以及原生計算機操作能力,第一次在同一代模型中同時出現。

      當這些能力開始匯合,大模型的角色也在發生轉變——從回答問題,轉向直接完成工作。

      GPT-5.4:一次圍繞“執行能力”的模型升級

      2026 年 3 月初,硅谷再次進入密集的 AI 發布周期。

      在多輪業內傳聞之后,OpenAI 推出了 GPT-5.4 系列模型。與過去幾次升級主要強化聊天體驗或推理能力不同,這一版本的能力組合明顯指向一個更實際的目標:讓 AI 更直接地參與真實工作流程。


      公開信息顯示,模型的核心能力包括:最高 100 萬 Token 上下文窗口GPT-5.4 Thinking 推理模式Computer-Use 原生計算機操作能力,以及 Tool Search 工具檢索機制。這些能力并非單點突破,而是圍繞“執行能力”的系統性升級。

      在桌面任務基準 OSWorld benchmark 的測試中,模型完成任務的成功率約為 75%,略高于該 benchmark 的人類測試基線約 72%。而在職業任務評估 GDPval benchmark 中,模型在 44 種知識型工作任務中約 83% 的評分進入專家區間。


      這些指標本身或許仍需要更多實際驗證,但它們指向的趨勢非常明確:AI 正在從信息處理工具變成任務執行系統。

      長上下文:模型第一次能“讀完整個項目”

      企業在部署大模型時,一直面臨一個結構性限制——上下文窗口。早期模型只能處理有限的信息量,這迫使企業構建復雜的 Retrieval-Augmented Generation(RAG)系統:文檔被拆分、向量化、索引,再在查詢時重新拼接給模型

      這種架構在過去兩年成為 AI 工程的標準方案,但也帶來了新的復雜度。數據被切塊后,上下文關系容易丟失;檢索系統本身也增加了延遲與維護成本。

      GPT-5.4 將上下文窗口擴展到 100 萬 Token。這意味著模型在單次任務中理論上可以處理完整代碼庫、長期財務記錄,甚至整個項目文檔集合。

      RAG 并不會消失,因為權限控制、實時數據更新以及索引效率仍然是企業系統不可替代的一部分。但在很多分析型任務中,超長上下文確實降低了對復雜檢索架構的依賴。

      更重要的是,模型開始具備一種過去難以實現的能力:理解完整項目,而不是零散信息片段

      Computer-Use:AI 開始直接操作軟件

      如果說長上下文改變的是理解能力,那么 Computer-Use 改變的則是執行能力。

      在這一模式下,模型可以通過視覺理解軟件界面,并模擬鼠標點擊、鍵盤輸入以及應用導航等操作。這意味著 AI 不再只通過 API 調用系統,而是可以像用戶一樣直接操作軟件界面。

      這一變化對企業自動化領域尤其重要。過去二十年,大量企業流程自動化依賴 Robotic Process Automation(RPA)系統,其核心邏輯是通過腳本執行固定步驟,例如錄入數據或在系統之間復制信息。

      而具備視覺理解與規劃能力的 AI,則可能承擔更復雜的任務,例如:

      • 跨系統整理數據

      • 執行多步驟后臺流程

      • 在陌生界面中尋找操作路徑

      RPA 并不會立即被取代,但 AI 代理已經開始進入它們長期占據的自動化領域。

      推理時計算:AI 學會“慢思考”

      GPT-5.4 的另一項關鍵變化,是 Thinking 模式。這一模式并不是簡單擴大模型規模,而是在推理階段投入更多計算資源,從而提高復雜任務的可靠性。

      這代表著大模型發展的一條重要路線:推理時計算(compute-at-inference)。過去十年,模型能力主要依賴訓練階段的大規模數據與算力,但隨著預訓練收益逐漸遞減,越來越多公司開始把算力投入到推理階段。

      類似趨勢也出現在其他 AI 公司,例如 Anthropic 的深度推理模式,以及 Google 在復雜任務中的推理系統。

      這種模式的特點很明顯:響應時間更長、計算成本更高,但復雜任務的成功率明顯提高。在法律分析、財務建模或復雜決策任務中,這類“慢思考 AI”反而更接近真實的專業工作方式。

      Tool Search:被低估的架構升級

      相比百萬 Token 與 computer-use,Tool Search 可能是這次發布中最容易被忽視的一項升級。

      過去,當模型需要調用工具時,開發者通常必須把所有工具說明都加載進提示詞中。這不僅占用上下文空間,也增加了 Token 成本。


      Tool Search 改變了這一機制:模型可以在需要時檢索工具定義,而不是預加載全部工具。

      在多工具系統中,這種方式可顯著減少工具相關的 Token 消耗。對于構建復雜 AI 系統的開發者而言,這類架構優化往往比單純提升模型能力更重要。

      因為真正的大規模 AI 應用,通常由幾十甚至上百個工具共同組成。

      AI 競爭的真正焦點正在改變

      如果把這些變化放在一起觀察,就會發現 AI 競爭的重心正在發生變化。

      過去幾年,大模型競爭主要集中在規模、參數與價格。但現在,競爭正在逐漸轉向另一件事情:誰能讓 AI 真正完成任務。

      在這個維度上,不同公司的策略逐漸分化:

      • OpenAI:強調 AI 代理與執行能力

      • Anthropic:強調可靠推理與安全性

      • Google:強調工具生態與云基礎設施

      這場競爭的終點,很可能不是更聰明的聊天機器人,而是一種新的軟件形態。

      一種可以理解任務、規劃步驟并執行操作的 AI 工作代理

      軟件范式正在變化

      從更長的上下文,到更強的推理,再到直接操作軟件界面,大模型正在同時獲得三種能力:理解信息、思考問題、執行操作。

      當這三種能力結合在一起時,AI 就不再只是軟件的一個接口,而可能逐漸成為新的軟件平臺。

      在這種結構下,大模型不僅會改變搜索、寫作或編程工具,還可能重新塑造企業軟件的基本形態。

      問題已經不再是 AI 能否理解工作。而是 AI 何時開始真正接管工作流程(本文首發鈦媒體App , 作者|硅谷Tech news,編輯|秦聰慧)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      剛入境就落網!普拉托五名中國男子因攜帶武器和爆炸物被捕

      剛入境就落網!普拉托五名中國男子因攜帶武器和爆炸物被捕

      意大利華人網0039
      2026-03-08 00:33:36
      重慶市公安局沙坪壩區分局刑偵支隊原副支隊長李燦到訪平臺

      重慶市公安局沙坪壩區分局刑偵支隊原副支隊長李燦到訪平臺

      蘭妮搞笑分享
      2026-03-07 21:51:17
      1-0險勝!2億天才破門,西甲領頭羊狂飆:3連勝,皇馬被甩開

      1-0險勝!2億天才破門,西甲領頭羊狂飆:3連勝,皇馬被甩開

      足球狗說
      2026-03-08 05:55:36
      為了掏空老百姓的口袋、故意捏造出來的5大騙局,早知道早好

      為了掏空老百姓的口袋、故意捏造出來的5大騙局,早知道早好

      貓叔東山再起
      2026-02-28 10:00:03
      一醫院“副高”工資單曝光!不同職稱醫務人員收入差距竟如此之大

      一醫院“副高”工資單曝光!不同職稱醫務人員收入差距竟如此之大

      華醫網
      2026-03-08 05:42:30
      下午17點,中國女足vs朝鮮!賽前傳來2個好消息,感謝亞足聯助攻

      下午17點,中國女足vs朝鮮!賽前傳來2個好消息,感謝亞足聯助攻

      侃球熊弟
      2026-03-08 01:25:03
      TOP14位身高170以上的女神,有顏有燈有演技

      TOP14位身高170以上的女神,有顏有燈有演技

      素然追光
      2026-01-02 02:45:02
      中國撤僑,持臺胞證可登記撤離,臺當局卻急了,國臺辦只回一句話

      中國撤僑,持臺胞證可登記撤離,臺當局卻急了,國臺辦只回一句話

      阿雹娛樂
      2026-03-08 05:44:49
      中國2000多個縣城的生存現狀:除了性生活就是打麻將!

      中國2000多個縣城的生存現狀:除了性生活就是打麻將!

      談史論天地
      2026-03-03 18:02:29
      男子養豪豬拔刺 每斤刺能賣400元

      男子養豪豬拔刺 每斤刺能賣400元

      閃電新聞
      2026-03-08 00:25:56
      國行 iPhone,終于解除 eSIM 限制!

      國行 iPhone,終于解除 eSIM 限制!

      黑貓科技迷
      2026-03-08 01:26:22
      阿爾瓦羅高級貨!泰山上了狠心一課,二雷最高分,大羽對不起了

      阿爾瓦羅高級貨!泰山上了狠心一課,二雷最高分,大羽對不起了

      刀鋒體育
      2026-03-07 19:18:50
      東方樞紐上海東站雛形已現!首次引入航空模塊 對標國際最好水平

      東方樞紐上海東站雛形已現!首次引入航空模塊 對標國際最好水平

      快科技
      2026-03-07 16:40:05
      記者:除非重返歐冠,否則曼聯無法與曼城競爭安德森、沃頓

      記者:除非重返歐冠,否則曼聯無法與曼城競爭安德森、沃頓

      懂球帝
      2026-03-07 23:14:14
      不焯水等于“吃毒”?醫生提醒:5種菜再懶也要焯水,別害了自己

      不焯水等于“吃毒”?醫生提醒:5種菜再懶也要焯水,別害了自己

      展望云霄
      2026-03-03 09:58:34
      陜西女警花臥底被揪出,被歹徒折磨7天解救:人都已經垮了

      陜西女警花臥底被揪出,被歹徒折磨7天解救:人都已經垮了

      罪案洞察者
      2025-03-07 08:59:25
      特朗普深夜驚聞噩耗,美國內憂外患一起襲來,美債被大規模拋售

      特朗普深夜驚聞噩耗,美國內憂外患一起襲來,美債被大規模拋售

      奇思妙想生活家
      2026-03-07 18:59:37
      延安時期:我黨真的一窮二白嗎?紅軍的主要收入是什么?

      延安時期:我黨真的一窮二白嗎?紅軍的主要收入是什么?

      冰語歷史
      2026-03-07 07:38:08
      林峰中學校草級舊照網上瘋傳!原名曝光,家庭日常顯溫馨

      林峰中學校草級舊照網上瘋傳!原名曝光,家庭日常顯溫馨

      TVB的四小花
      2026-03-06 07:10:52
      中國可能會流失約30%的工廠,不是倒閉,而是外遷

      中國可能會流失約30%的工廠,不是倒閉,而是外遷

      流蘇晚晴
      2026-03-07 18:29:05
      2026-03-08 07:40:49
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      130356文章數 861903關注度
      往期回顧 全部

      科技要聞

      OpenClaw最大的推手是閑魚和小紅書

      頭條要聞

      中國貨船通過霍爾木茲海峽后 美國宣布200億美元計劃

      頭條要聞

      中國貨船通過霍爾木茲海峽后 美國宣布200億美元計劃

      體育要聞

      塔圖姆298天走完這段路 只用27分鐘征服這座城

      娛樂要聞

      汪小菲曝親媽猛料,張蘭公開財產分配

      財經要聞

      針對"不敢休、不讓休"怪圈 國家出手了

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      家居
      游戲
      數碼
      公開課
      軍事航空

      家居要聞

      暖棕撞色 輕法奶油風

      外媒:Xbox新主機恐成微軟絕唱!失敗即退出硬件市場

      數碼要聞

      蘋果MacBook Neo跑分出爐:A18 Pro少了一個核心 GPU被反殺

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美第三個航母打擊群據稱準備部署至中東

      無障礙瀏覽 進入關懷版