<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      100萬 Token + 接管鼠標:GPT-5.4 正把 AI 推向“數字員工”

      0
      分享至


      如果一個 AI 能夠閱讀整套項目文檔,在復雜問題上進行長時間推理,并且自己操作電腦完成任務,它就不再只是一個聊天機器人。

      它更像是一種新的軟件形態。

      隨著 OpenAI 推出 GPT-5.4 Thinking 與 GPT-5.4 Pro,這種變化正在變得具體。100 萬 Token 上下文、推理時計算模式,以及原生計算機操作能力,第一次在同一代模型中同時出現。

      當這些能力開始匯合,大模型的角色也在發生轉變——從回答問題,轉向直接完成工作。

      GPT-5.4:一次圍繞“執行能力”的模型升級

      2026 年 3 月初,硅谷再次進入密集的 AI 發布周期。

      在多輪業內傳聞之后,OpenAI 推出了 GPT-5.4 系列模型。與過去幾次升級主要強化聊天體驗或推理能力不同,這一版本的能力組合明顯指向一個更實際的目標:讓 AI 更直接地參與真實工作流程。


      公開信息顯示,模型的核心能力包括:最高 100 萬 Token 上下文窗口、GPT-5.4 Thinking 推理模式Computer-Use 原生計算機操作能力,以及 Tool Search 工具檢索機制。這些能力并非單點突破,而是圍繞“執行能力”的系統性升級。

      在桌面任務基準 OSWorld benchmark 的測試中,模型完成任務的成功率約為 75%,略高于該 benchmark 的人類測試基線約 72%。而在職業任務評估 GDPval benchmark 中,模型在 44 種知識型工作任務中約 83% 的評分進入專家區間。


      這些指標本身或許仍需要更多實際驗證,但它們指向的趨勢非常明確:AI 正在從信息處理工具變成任務執行系統。

      長上下文:模型第一次能“讀完整個項目”

      企業在部署大模型時,一直面臨一個結構性限制——上下文窗口。早期模型只能處理有限的信息量,這迫使企業構建復雜的 Retrieval-Augmented Generation(RAG)系統:文檔被拆分、向量化、索引,再在查詢時重新拼接給模型。

      這種架構在過去兩年成為 AI 工程的標準方案,但也帶來了新的復雜度。數據被切塊后,上下文關系容易丟失;檢索系統本身也增加了延遲與維護成本。

      GPT-5.4 將上下文窗口擴展到 100 萬 Token。這意味著模型在單次任務中理論上可以處理完整代碼庫、長期財務記錄,甚至整個項目文檔集合。

      RAG 并不會消失,因為權限控制、實時數據更新以及索引效率仍然是企業系統不可替代的一部分。但在很多分析型任務中,超長上下文確實降低了對復雜檢索架構的依賴。

      更重要的是,模型開始具備一種過去難以實現的能力:理解完整項目,而不是零散信息片段

      Computer-Use:AI 開始直接操作軟件

      如果說長上下文改變的是理解能力,那么 Computer-Use 改變的則是執行能力。

      在這一模式下,模型可以通過視覺理解軟件界面,并模擬鼠標點擊、鍵盤輸入以及應用導航等操作。這意味著 AI 不再只通過 API 調用系統,而是可以像用戶一樣直接操作軟件界面。

      這一變化對企業自動化領域尤其重要。過去二十年,大量企業流程自動化依賴 Robotic Process Automation(RPA)系統,其核心邏輯是通過腳本執行固定步驟,例如錄入數據或在系統之間復制信息。

      而具備視覺理解與規劃能力的 AI,則可能承擔更復雜的任務,例如:

      • 跨系統整理數據

      • 執行多步驟后臺流程

      • 在陌生界面中尋找操作路徑

      RPA 并不會立即被取代,但 AI 代理已經開始進入它們長期占據的自動化領域。

      推理時計算:AI 學會“慢思考”

      GPT-5.4 的另一項關鍵變化,是 Thinking 模式。這一模式并不是簡單擴大模型規模,而是在推理階段投入更多計算資源,從而提高復雜任務的可靠性。

      這代表著大模型發展的一條重要路線:推理時計算(compute-at-inference)。過去十年,模型能力主要依賴訓練階段的大規模數據與算力,但隨著預訓練收益逐漸遞減,越來越多公司開始把算力投入到推理階段。

      類似趨勢也出現在其他 AI 公司,例如 Anthropic 的深度推理模式,以及 Google 在復雜任務中的推理系統。

      這種模式的特點很明顯:響應時間更長、計算成本更高,但復雜任務的成功率明顯提高。在法律分析、財務建?;驈碗s決策任務中,這類“慢思考 AI”反而更接近真實的專業工作方式。

      Tool Search:被低估的架構升級

      相比百萬 Token 與 computer-use,Tool Search 可能是這次發布中最容易被忽視的一項升級。

      過去,當模型需要調用工具時,開發者通常必須把所有工具說明都加載進提示詞中。這不僅占用上下文空間,也增加了 Token 成本。


      Tool Search 改變了這一機制:模型可以在需要時檢索工具定義,而不是預加載全部工具。

      在多工具系統中,這種方式可顯著減少工具相關的 Token 消耗。對于構建復雜 AI 系統的開發者而言,這類架構優化往往比單純提升模型能力更重要。

      因為真正的大規模 AI 應用,通常由幾十甚至上百個工具共同組成。

      AI 競爭的真正焦點正在改變

      如果把這些變化放在一起觀察,就會發現 AI 競爭的重心正在發生變化。

      過去幾年,大模型競爭主要集中在規模、參數與價格。但現在,競爭正在逐漸轉向另一件事情:誰能讓 AI 真正完成任務。

      在這個維度上,不同公司的策略逐漸分化:

      • OpenAI:強調 AI 代理與執行能力

      • Anthropic:強調可靠推理與安全性

      • Google:強調工具生態與云基礎設施

      這場競爭的終點,很可能不是更聰明的聊天機器人,而是一種新的軟件形態。

      一種可以理解任務、規劃步驟并執行操作的 AI 工作代理。

      軟件范式正在變化

      從更長的上下文,到更強的推理,再到直接操作軟件界面,大模型正在同時獲得三種能力:理解信息、思考問題、執行操作。

      當這三種能力結合在一起時,AI 就不再只是軟件的一個接口,而可能逐漸成為新的軟件平臺。

      在這種結構下,大模型不僅會改變搜索、寫作或編程工具,還可能重新塑造企業軟件的基本形態。

      問題已經不再是 AI 能否理解工作。而是 AI 何時開始真正接管工作流程。(本文首發鈦媒體App , 作者|硅谷Tech news,編輯|秦聰慧)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      突發!卡塔爾首都遭導彈襲擊

      突發!卡塔爾首都遭導彈襲擊

      新快報新聞
      2026-03-06 10:15:08
      CBA瘋狂夜!積分榜亂了:廣州爆冷,山東升第四,5隊僅差1分

      CBA瘋狂夜!積分榜亂了:廣州爆冷,山東升第四,5隊僅差1分

      阿錯田間生活
      2026-03-05 22:54:30
      德國人日常三餐曝光!6個習慣讓人不去醫院,國人看完沉默了?

      德國人日常三餐曝光!6個習慣讓人不去醫院,國人看完沉默了?

      路醫生健康科普
      2026-03-04 12:30:03
      澳洲楊蘭蘭是誰?五層“身份套娃”揭秘:她或許根本就不存在

      澳洲楊蘭蘭是誰?五層“身份套娃”揭秘:她或許根本就不存在

      麥大人
      2025-08-18 18:02:38
      不得不說!宮魯鳴做出了1個重要的決定,挽救了中國女籃

      不得不說!宮魯鳴做出了1個重要的決定,挽救了中國女籃

      體育哲人
      2026-03-05 12:38:35
      凌晨4點皇馬保衛戰!輸球將創27年之恥+西甲3連敗 9人缺戰

      凌晨4點皇馬保衛戰!輸球將創27年之恥+西甲3連敗 9人缺戰

      葉青足球世界
      2026-03-06 08:26:11
      下手太狠了,廉價版 MacBook:能砍的地方全砍了

      下手太狠了,廉價版 MacBook:能砍的地方全砍了

      黑貓科技迷
      2026-03-05 23:22:36
      加拿大總理:難道任由霸權主義說了算?

      加拿大總理:難道任由霸權主義說了算?

      新華社
      2026-03-05 18:02:14
      第17波打擊!以色列頂不住,連夜通電北京求助,中方強勢回應

      第17波打擊!以色列頂不住,連夜通電北京求助,中方強勢回應

      薦史
      2026-03-05 00:16:27
      莫迪驚了!他萬萬沒想到,美國與伊朗開戰,最大輸家卻是印度

      莫迪驚了!他萬萬沒想到,美國與伊朗開戰,最大輸家卻是印度

      起喜電影
      2026-03-06 06:54:00
      全國政協委員施乾平:應在海外重點地區試點設立“中國籍人員子女學?!?>
    </a>
        <h3>
      <a href=經濟觀察報
      2026-03-05 08:56:05
      兩會開始才1天,已有4位演員的建議火出圈,句句直戳全國觀眾心窩

      兩會開始才1天,已有4位演員的建議火出圈,句句直戳全國觀眾心窩

      墨印齋
      2026-03-06 10:21:53
      美軍發布摧毀中國造防空導彈畫面,它曾擊落過大名鼎鼎的U2偵察機

      美軍發布摧毀中國造防空導彈畫面,它曾擊落過大名鼎鼎的U2偵察機

      愛吃醋的貓咪
      2026-03-05 21:05:02
      沖突第7天,中俄都意識到同一個問題,海灣國家已經站在十字路口

      沖突第7天,中俄都意識到同一個問題,海灣國家已經站在十字路口

      李健政觀察
      2026-03-06 09:54:45
      全球唯一明朝狀元卷,字跡如機器印刷,無一處筆誤,看完無地自容

      全球唯一明朝狀元卷,字跡如機器印刷,無一處筆誤,看完無地自容

      收藏大視界
      2026-03-03 17:33:09
      澳政客承認在停車場廁所與13歲男孩發生性關系,但稱對方謊報年齡

      澳政客承認在停車場廁所與13歲男孩發生性關系,但稱對方謊報年齡

      石辰搞笑日常
      2026-03-06 01:11:55
      華國鋒擔任中央主席時,中央先后任命了15位開國將帥輔佐他

      華國鋒擔任中央主席時,中央先后任命了15位開國將帥輔佐他

      雍親王府
      2026-03-02 15:55:03
      消息稱蘋果MacBook Neo未配A19 Pro芯片原因是臺積電產能受限

      消息稱蘋果MacBook Neo未配A19 Pro芯片原因是臺積電產能受限

      IT之家
      2026-03-06 10:25:09
      B-52“同溫層堡壘”加入對伊朗打擊,釋放了什么信號?

      B-52“同溫層堡壘”加入對伊朗打擊,釋放了什么信號?

      南文視界
      2026-03-05 08:00:23
      美伊開出停戰條件,伊朗內部形成共識,讓強硬派放開手腳打一場

      美伊開出停戰條件,伊朗內部形成共識,讓強硬派放開手腳打一場

      面包夾知識
      2026-03-03 14:54:40
      2026-03-06 11:03:00
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      130294文章數 861884關注度
      往期回顧 全部

      科技要聞

      獨家|除夕加班、毫無黑料!林俊旸無奈離場

      頭條要聞

      上海一男子銀行取20萬出門遭"搶劫" 警方查完直呼離譜

      頭條要聞

      上海一男子銀行取20萬出門遭"搶劫" 警方查完直呼離譜

      體育要聞

      跑了24年,他終于成為英超“最長的河”

      娛樂要聞

      周杰倫社交媒體曬昆凌,夫妻感情穩定

      財經要聞

      黃金,牛市沒了?!

      汽車要聞

      710km長續航+閃充 宋Ultra EV預售15.5萬起

      態度原創

      時尚
      房產
      教育
      藝術
      旅游

      看來看去還是這些穿搭最高級,不老套、不死板,舒適又顯氣質

      房產要聞

      超猛!又有2800套房源砸出,2026??诎簿臃浚瑥氐妆l!

      教育要聞

      別焦慮!蘭州大學2025年招生三大亮點

      藝術要聞

      敦煌壁畫里的“動物世界”,溫馨有愛!

      旅游要聞

      三八節福利!臺兒莊古城對全國女性大放價!

      無障礙瀏覽 進入關懷版