![]()
![]()
OpenAI 今年猛猛自我迭代
文 |動點科技
作者|黃塵
排版|Miziko
本文預計閱讀時長7分鐘
如果說2024年是文生圖的黃金期,那么2025年的 Sora 2 讓視頻生成進入了“導演時代”。在這款產品里,提示詞不再只是描述,而是指令。用戶可以操縱鏡頭角度、控制人物動作、甚至加入聲音同步。
Sora 2 的發布引起了一波小型創作革命。社交平臺上,創作者用它生成短片、品牌用它快速制作廣告、普通用戶則在 Sora App 里體驗著導演們的快感。這不是簡單的模型升級,而是一次從工具到娛樂生態的跨界嘗試。
而這只是 OpenAI 在2025年的冰山一角。
![]()
當ChatGPT逐漸博士化
如果 Sora 2 是 OpenAI 展示創意的一面,那么 Deep Research(深入研究)則是它補上思考能力的那塊拼圖。OpenAI 于2025年2月在 ChatGPT 內部引入了 Deep Research模式。這是一項新的代理功能,可在互聯網上針對復雜任務進行多步驟研究,查找、分析并整合數百個在線來源,生成具有分析師水平的全面報告。
對于需要深度和細節的多方面專業領域查詢,Deep Research能夠進行廣泛探索,并對每項主張進行引證,這就是快速摘要與有據可查、經過驗證并可作為工作成果使用的答案之間的區別。
2024年底至2025年初,Google 推出了集成 Search + Gemini Advanced 的搜索式 AI 答案流,Anthropic 的 Claude 3.5 也引入了研究助手與多文檔閱讀功能。市場開始傾向能提供“帶引用的動態答案”的產品。
OpenAI 必須在這一競爭節奏下回應,否則 ChatGPT 將被視為封閉模型而非信息智能體。
Deep Research采用端到端強化學習方法,針對跨領域復雜瀏覽與推理任務進行訓練。通過這種訓練,它學會了規劃和執行多步驟軌跡來查找所需的數據,并在必要時進行回溯和對實時信息做出反應。它讓 ChatGPT 擁有真正意義上的“思考—檢索—驗證”流程,而非單次生成,從而使其輸出更可靠、更可追溯。
在 Humanity’s Last Exam(人類的最后考試,這是為了追蹤大型語言模型能力快速發展的覆蓋廣泛學科的終極封閉式學術基準測試)中,Deep Research 的準確率達到了創紀錄的 26.6%,遠超之前的模型,包括 OpenAI 自己的 o1(9.1%)、DeepSeek-R1(9.4%)和 Claude 3.5 Sonnet(4.3%)。
值得注意的是,相比 OpenAI 的 o1,Deep Research 在化學、人文社會科學和數學領域取得了最大的進步,在這些領域,Deep Research 展現了其分解復雜問題和檢索權威信息的能力。
![]()
旗艦模型———最聰明的“大腦”
GPT 系列的持續迭代,是 OpenAI 的核心戰略。而今年的主角 GPT-5,無疑是這家公司最重要的答卷。
GPT-5 不再只是語言模型,而是一個跨文字、圖像、音頻、視頻、代碼與結構化數據的通用智能體內核。它的目標是讓任何人都能輕松構建具備自主推理與操作能力的 AI Agent。
與 GPT-4 系列相比,GPT-5 在三個方面提升最明顯:推理深度、持久記憶與多模態協同。它的邏輯與鏈式推理能力顯著增強,能在復雜問題(尤其是科研、編程、金融分析等)上保持一致性和解釋性。同時引入了持續上下文記憶,使模型可以記住長期交互內容,執行多步任務而不丟失目標。
在生態層面,GPT-5 與 OpenAI 的 AgentKit、ChatGPT Apps SDK 等工具深度整合,允許用戶像搭積木一樣構建個性化智能體。換言之,GPT-5 不只是一個聊天模型,而是一個面向現實應用的智能操作系統內核,它既能生成知識,也能執行任務、調用外部工具和 API。
由康奈爾大學運營的開放學術平臺 arXiv 上,有一篇名為《GPT-5 在多模態醫學推理方面的能力》的論文指出,在醫學多模態推理任務上,GPT-5 相比 GPT-4o 在“文本+圖像診斷/醫學問答”上取得了顯著提升。部分任務中,GPT-5 在理解、推理和圖像融合能力上都超過前代模型。
然而,認知科學家Gary Marcus 在其文章中稱 GPT-5 為 “overhyped and underwhelming”(高估多于兌現),他表示:“GPT-5 或許在數量上有所改進(而且成本可能更低),但它在質量方面仍然與其前輩一樣失敗,比如在國際象棋、推理、視覺方面;有時甚至在計數和基礎數學方面。幻覺揮之不去。”
![]()
從工具到平臺
如果說 GPT-5 是大腦,那 ChatGPT Apps 就是讓這個大腦接軌世界的神經網絡。
在2025年的 DevDay 上,OpenAI 讓整個行業意識到:ChatGPT 不僅是一個聊天界面,它正在變成一個 AI 應用平臺。其正式推出了Apps in ChatGPT功能與 Apps SDK,讓第三方服務能直接嵌入 ChatGPT 對話里。用戶只需在聊天中提一句“Spotify,給我做個派對歌單”或“Canva,幫我做個海報”,ChatGPT 會自動調用對應 App,展示圖形界面、交互組件,甚至支持切換到全屏或畫中畫模式進行深度操作。
以前用戶需要通過鏈接跳出 ChatGPT 界面去調用其他服務,體驗割裂;現在 App 成為聊天的一部分,對話和操作界面合一,大幅提升效率與連貫性。
對開發者而言,這一生態的開放也至關重要。他們可借助統一標準觸達龐大的用戶群體,甚至實現變現與目錄分發。
智能自動化平臺 Celigo 認為 AgentKit / Apps SDK 有助于集成 AI 與業務流程,但是缺乏協調混合工作流程(將確定性自動化與代理步驟相結合)所需的編排,沒有原生機制來強制執行防護措施,也沒有集中監督,無法確保團隊能監控人工智能活動、追蹤行動或確保跨系統的可靠性能。這對于平臺治理將會是一個艱難課題。
![]()
結語
盡管仍有不完美,但在這一年里,OpenAI 在多個方向上都實現了顯著的推進。Sora 2 擴展了 AI 在視頻創作領域的能力,Deep Research 將語言模型的檢索與論證能力推向新的高度,GPT-5 在多模態整合與推理能力上邁出關鍵一步,而 ChatGPT Apps 構建了 AI 與外部服務交互的橋梁。
目前來看,OpenAI 正在從一個以提供應用為主的 AI 公司向一個更為平臺化的平臺型公司轉變。即便前方仍有技術挑戰與倫理邊界,OpenAI 此番布局已展示出其在創作、智能、系統融合等領域的野心與路徑。
本文為動點科技記者原創文章,未經授權不得轉載,如需轉載或開白請在后臺回復“轉載”。
- - - - - - - - END - - - - - - - -
互動話題
Sora 2 會讓我們都成為導演嗎?
快來評論區留下你的觀點吧!
*想要獲取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群里更有不定期福利發放!
精彩好文值得推薦!
一鍵轉發,戳個在看!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.