2026年3月6日,OpenAI官方正式上線(xiàn)GPT-5.4系列大模型,分為適配日常復(fù)雜任務(wù)的Thinking版與主打?qū)I(yè)場(chǎng)景的Pro版。這一具有里程碑意義的更新,迅速點(diǎn)燃全球開(kāi)發(fā)者社區(qū)的熱情,作為OpenAI首次將前沿推理、編碼能力與智能體功能深度融合的核心產(chǎn)品,GPT-5.4憑借多模態(tài)能力的突破性提升,重新界定AI與人類(lèi)的協(xié)作邊界,推動(dòng)人工智能從“被動(dòng)響應(yīng)”向“主動(dòng)執(zhí)行”加速邁進(jìn)。
![]()
核心升級(jí):多模態(tài)能力突破,多項(xiàng)指標(biāo)趕超人類(lèi)水平
GPT-5.4最具突破性的升級(jí),集中在多模態(tài)能力的全面升級(jí),尤其在原生計(jì)算機(jī)操控、視覺(jué)感知及專(zhuān)業(yè)任務(wù)處理三大領(lǐng)域?qū)崿F(xiàn)關(guān)鍵性突破,多項(xiàng)權(quán)威基準(zhǔn)測(cè)試指標(biāo)成功趕超人類(lèi)平均水平。該模型無(wú)需額外搭載第三方工具,僅通過(guò)截圖識(shí)別與鍵盤(pán)鼠標(biāo)指令,就能完成跨應(yīng)用的復(fù)雜操作,大幅優(yōu)化了AI與計(jì)算機(jī)的交互邏輯。
在多項(xiàng)權(quán)威基準(zhǔn)測(cè)試中,GPT-5.4表現(xiàn)突出:OSWorld-Verified桌面操作基準(zhǔn)測(cè)試中,其成功率達(dá)到75.0%,較前代GPT-5.2提升28個(gè)百分點(diǎn),首次超越人類(lèi)平均水平(72.4%);Online-Mind2Web網(wǎng)頁(yè)操作測(cè)試中,成功率高達(dá)92.8%,顯著優(yōu)于ChatGPT Atlas智能體模式的70.9%。此外,其MMMU-Pro視覺(jué)理解測(cè)試成功率達(dá)81.2%,OmniDocBench文檔解析平均錯(cuò)誤率降至0.109,較前代均有大幅提升。
與此同時(shí),GPT-5.4新增“思考過(guò)程預(yù)覽”功能,可提前展示自身推理邏輯,方便用戶(hù)及時(shí)調(diào)整需求;支持100萬(wàn)tokens的上下文窗口(可理解為AI能同時(shí)處理的文本長(zhǎng)度),助力智能體高效完成長(zhǎng)周期任務(wù),進(jìn)一步拓寬了多模態(tài)技術(shù)的應(yīng)用場(chǎng)景。
里程碑價(jià)值:AI從“輔助工具”向“數(shù)字員工”升級(jí)
GPT-5.4的正式發(fā)布,不僅是OpenAI發(fā)展歷程中的重要節(jié)點(diǎn),更標(biāo)志著全球AI產(chǎn)業(yè)正式邁入“全能協(xié)作”的全新階段。與前代模型“能力碎片化”“需外掛工具才能實(shí)現(xiàn)復(fù)雜操作”的局限不同,該模型將推理、編碼、智能體三大核心能力深度整合,定位為“可獨(dú)立完成各類(lèi)真實(shí)工作的AI數(shù)字員工”,實(shí)現(xiàn)了從“對(duì)話(huà)交互”到“落地執(zhí)行”的模式升級(jí)。
在專(zhuān)業(yè)領(lǐng)域,GPT-5.4的表現(xiàn)已接近人類(lèi)專(zhuān)家水平:GDPval基準(zhǔn)測(cè)試中,83.0%的項(xiàng)目達(dá)到行業(yè)專(zhuān)業(yè)標(biāo)準(zhǔn),較前代提升12個(gè)百分點(diǎn);投行級(jí)電子表格建模平均得分87.3%,其生成的演示文稿獲得68.0%評(píng)審者的認(rèn)可。同時(shí),該模型的單個(gè)陳述錯(cuò)誤率下降33%,有效改善了前代模型“幻覺(jué)現(xiàn)象突出”的行業(yè)痛點(diǎn)。
OpenAI相關(guān)負(fù)責(zé)人表示,GPT-5.4的迭代核心是“讓AI更貼合人類(lèi)需求、更易落地應(yīng)用”,其原生集成的多元能力,將推動(dòng)AI技術(shù)在金融、法律、設(shè)計(jì)等多個(gè)領(lǐng)域?qū)崿F(xiàn)規(guī)模化落地。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.