網易首頁 > 網易號 > 正文申請入駐

OpenAI 年度發布會：Agent平臺/Sora API/第三方接入ChatGPT/... 講的沒講的，都在這了

2025-10-07 05:30:55　來源: 賽博禪心

北京舉報

分享至

今天是 OpenAI 的年度發布會：

OpenAI Dev Day 2025

10月7日凌晨一點召開，算是國慶獻禮

不愧是你：山偉國

按 Sam 的話來說，這場發布會是聚焦于「如何讓人更好的用 AI 去創造」，并帶來了以下新鮮內容

App inside ChatGPT：加強版的 Plugin 系統
Agent Kit：OpenAI 的「扣子全家桶」
Codex 正式版：OpenAI 版的「Claude Code」
API Update：GPT-5 Pro、Sora、Real-Time Mini 的 API 都發布了
還有個大會上沒講的新模型 gpt-image ，這個也以 API 發布了，是個生圖的模型

本次發布

不過按我的看法，這次的發布，更像是是聚焦于：讓開發者去定義「人與 AI 的交互方式」

這里，讓我按發布順序，仔細盤盤。并且，補充一些發布會上沒說的內容

App Inside ChatGPT

可以理解為，這是更加 Plugin 系統的加強版

先說下插件系統，這是 MCP 或者 Function Call 的鼻祖，于 2023年3月14日發布、5月中灰度上線的到了 ChatGPT。通過這個系統，ChatGPT 可以向外部請求數據，比如聯網搜索、查詢數據庫，或者干脆生成一個視頻（HeyGen 當時也接入了 Plugin 系統）

后來，這個系統在去年4月9日下線，取而代之的，是大家更熟悉的 GPTs + 自定義 Action

這次的發布，更像是 Plugin 系統的加強版，第三方應用給到的不單單是數據，而且可以是界面

比如說，在之前的 plugin 系統中，用戶通過 ChatGPT 讓 Canva 去做一個 ppt，那么用戶會獲得一個鏈接，點開后打開對應的 Canva 的對應頁面，然后繼續編輯

在這個過程中，ChatGPT 也可以直接看到對應的東西，方便了不少。你甚至可以直接在 ChatGPT 里播放 Coursera 的課程視頻，一邊看一邊問問題

Zillow 是美國的鏈家，在 Zillow 地圖上點了個房子，問「這離狗狗公園有多遠」，它能結合地圖上的信息去搜索回答

配合這個發布的，還有一個 Apps SDK。開發者們可以使用這個 SDK 把自己的應用集成到 ChatGPT 里面，獲取流量。Apps SDK 基于 MCP 標準構建，如果你已經有 MCP 服務器，只需要加個返回 HTML 的 resource，就能快速升級成完整的 app

這項功能今天就開始 Preview，可以去 OpenAI 平臺開始構建，年底會開放正式提交和審核流程，到時候還會有個 app 目錄讓用戶瀏覽

首批合作伙伴包括 Figma、Canva、Coursera、Spotify、Zillow 等，今天就能用

即將，還會有更多的專業伙伴加入，比如 Uber（美國的滴滴）、Tripadvisor（美國的攜程/大眾點評）

同時，未來還會支持多種變現方式，包括新的 Agentic Commerce Protocol，幫助開發者完成商業化的閉環

Agent Kit

看這個界面，像不像扣子？沒錯，OpenAI 發布了他們的 Workflow 編輯器

從產品延續的角度，也可以說是 GPTs 的升級版：給 GPTs 加了更復雜的工作流，也能定義輸出的形式

對于上面說的「定義輸出的形式」，對于這次的 OpenAI 發布會，如果我想做一個指定場景的工具「DevDay 百事通」，除了能像常規 Workflow 編輯器那樣上傳數據庫之外，還可以給它一個樣式模板，比如這個：

在這種情況下，我去問它問題：有什么關于 building agents 的分享？

它回復的，便不再是純文字：“11:15 有一場 Orchestrating Agents at Scale，由 James 和 Rohan 主講，講的是如何構建 agents”

而是給你一個卡片：帶著會議時間、主講人、地點

對了，這個 case 是一個叫做 Christina 小姐姐（看著是華裔）在臺上現場搓的，累計沒用到 8 分鐘，流程包括：

設置工作流邏輯（分類器 + 條件判斷）
上傳會議日程文檔
加 PII 保護的 guardrail
配置輸出的 widget 樣式
部署到網站上

對于這套東西，Ramp 團隊用 Agent Builder 幾小時就搭出了采購 agent，迭代周期縮短了 70%，兩個 sprint 就上線了（以前要兩個季度）

這套東西，叫做 Agent Kit，包含以下核心組件：

Agent Builder
Chat Kit
Evals for Agents

逐個來說說

Agent Builder

可視化編輯工作流，拖拽節點就能搭。左邊是常用的構建模塊，包括工具（file search、MCP）、guardrails、human-in-the-loop、各種邏輯節點。支持預覽運行、內聯 eval 配置、完整版本管理。滿意了就發布，拿到 workflow ID 直接用

另外，Agent Builder 里可以啟用 Guardrails——開源的模塊化安全層，能屏蔽或標記 PII、檢測越獄攻擊等，讓 agent 更可靠、更安全

扯個題外話，這東西很像扣子的「開發平臺」

Chat Kit

可嵌入的聊天組件，直接集成到你自己的產品里。處理流式響應、管理對話線程、展示模型思考過程這些復雜的事情都幫你搞定。可以自定義品牌、主題、樣式。Canva 說他們用 ChatKit 給開發者社區做支持 agent，省了兩周時間，集成只花了不到一小時

扯個題外話，這東西很像扣子的「WebSDK」

Evals for Agents

去年發布的 Evals，這次加了四個新能力：

Datasets：快速構建 agent evals，用自動評分器和人工標注不斷擴充
Trace grading：端到端評估 agent 工作流，自動評分找出問題
自動化 prompt 優化：根據人工標注和評分器輸出生成改進的 prompt
第三方模型支持：在 OpenAI 平臺上直接評估其他廠商的模型

扯個題外話：這東西，很像扣子的「扣子羅盤」

此外，還有個發布會上沒提的、也算在這個 kit 里的東西：Connector Registry

這玩意兒就在 ChatGPT 的設置里面，幫你把所有數據源整合到一個管理面板里，橫跨 ChatGPT 和 API。

包括預構建的連接器（Dropbox、Google Drive、SharePoint、Microsoft Teams）和第三方 MCP，讓企業能統一管理多個工作區和組織的數據

編程工具 Codex

Codex 今天開始，來到了正式版

這東西，5月發布的：

上個月，更新了一版

現在的 Codex 用的是 GPT-5 Codex 模型，專門為寫代碼和 agentic coding 優化的。現在，OpenAI 內部幾乎所有新代碼都是 Codex 用戶寫的，用 Codex 的工程師每周多完成 70% 的 PR，基本上每個 PR 都過 Codex review

現在的 Codex 不只是命令行工具了，可以在你的 IDE、終端、GitHub、ChatGPT 賬號里都能用，無縫切換

Codex 這東西，還是靠譜的，在現場的工程師小哥 Ramon 做了個炸裂演示：

Ramon 拿了個會場上方的攝像頭，讓 Codex 寫代碼控制它。Codex 自己找到了 30 年前的 VISCA 協議文檔，寫好了控制代碼，還做了個控制面板，并且用 XBox 手柄就能控制攝像頭

最后來了個大的：用 Real-time API 加語音，控制會場的燈光系統（通過 MCP）

現場對著 ChatGPT 說：“把觀眾席的燈打亮”，燈就亮了

整個過程，小哥一行代碼都沒手寫，純口噴

除此之外，Codex 還多了以下倆玩意兒：

Slack Integration：直接在 Slack 里問 Codex 寫代碼或回答問題，團隊協作更方便

Enterprise Control：給企業用的管理工具，包括環境控制、監控、分析儀表板等，讓大公司也能放心用

API 迭代

敲黑板，這里是正片

本次發布會，明面上帶來了三套模型的 API：

GPT-5 Pro
Sora2 & Sora2 Pro
Real-Time Mini

但其實...還發布了他們家的圖像生成 API gpt-image-1-mini，低至 0.005 美分一張圖。下面，讓我來分別說說

GPT-5 Pro API

8 月發布的 GPT-5 Pro，現在開放 API 了

這模型有 400k 上下文，272k 最長輸出，適合金融、法律、醫療這種需要高準確度和深度推理的場景。Cursor、Windsurf、Replit 等頭部編程工具都在用 GPT-5 系列改變軟件開發方式

內部數據：GPT-5 Codex 已經處理了超過 40 萬億 tokens，是 OpenAI 增長最快的模型之一

Sora 2 發布

重頭戲來了，Sora 2 API 開放 Preview，分兩個版本：

sora-2：快速版，適合快速迭代。幾分鐘出結果，適合社交媒體、產品原型、概念設計

sora-2-pro：更大更強，渲染時間更長價格更貴，但畫質更精致穩定。適合高分辨率電影鏡頭、營銷素材等對視覺精度要求高的場合

價格呢...如下圖，一個 15 秒的視頻，需要至少 1.5 美金～10.5 人民幣

調用的話，代碼大概這么寫

from openai importOpenAI openai = OpenAI() # 生成視頻 video = openai.videos.create(     model="sora-2",     prompt="草地公園的廣角鏡頭，孩子放著紅色風箏，黃金時刻陽光" ) # 輪詢狀態直到完成 while video.statusin ("in_progress", "queued"):     video = openai.videos.retrieve(video.id)     time.sleep(2) # 下載視頻 content = openai.videos.download_content(video.id) content.write_to_file("video.mp4")

Real-Time Mini

語音模型 Real-Time Mini，比之前的 Advanced Voice 便宜 70%，質量一樣

Sam 說他覺得語音會成為人跟 AI 交互的主要方式，所以把價格打下來，讓大家都用得起

（Sam：家人們，我把價格打下來了）

GPT Image

這是個畫圖的新模型，支持圖片、文字輸入，然后生圖，效果挺不錯的

模型也分正式版和mini版，價格如下

One More Thing

這次發布會，還有幾個很有意思的點：

Sam 炫了個數據

開場就說現在有 400 萬開發者在用 OpenAI，每周 8 億人用 ChatGPT（沒聽錯，8億），API 每分鐘處理 60 億 tokens

而在兩年前的時候，是 200 萬開發者、1 億用戶、3 億 tokens/分鐘。翻了一倍不止

現場表彰

大屏幕上列出了處理過 100 億、1000 億、甚至 1 萬億 tokens 的、在現場的開發者名字，全場鼓掌，頗有種「這些才是真正推動未來的人」的儀式感

日本 89 歲老爺爺

Sam 提到了一個案例，日本一個 89 歲的退休老人用 ChatGPT 自學編程，做了 11 個 iPhone app，專門給老年人用。這種故事聽著就很暖

以及，開場有一句話我很喜歡

"AI has gone from something people build, play with to something people build with every day."

按 Sam 的話說，AI 已經從「大家拿來研究、試驗的新鮮玩意兒」，變成了「每天都在用的生產工具」，一切潛移默化，一切順利應然

OpenAI 會在每年秋天，進行一場面向開發者的發布會，稱為 OpenAI DevDay

第一場 DevDay 2023，聚焦于模型能力，于2023年11月6號召開

這場發布會，帶來了新模型 GPT?4 Turbo（有了多模態理解）、JSON Mode（現在的結構化輸出）、GPTs（OpenAI 最早的場景 Agent 探索）

提前拿到了 GPTs 權限...前 100 個 GPTs 里，可能有 3 個是我搓的

第二場是 DevDay 2024，聚焦于業務應用，一連開了3場，分別在舊金山（10月1號）、倫敦（10月30號）和新加坡（11月21號）

這系列的發布，帶來了 Realtime API、Prompt Cache、蒸餾工具，并預告了 o1 的各項更新（比如：函數調用、開發者消息、結構化輸出和圖片理解）

發布會送的徽章，還挺好看的

今天是第三場：Dev Day 2025，N 倍擴大了規模，OpenAI 的朋友跟我說，這次來了上千人，人山人海...那烏壓壓的場面

這次陰差陽錯沒去成現場（心痛）

老實來說，每次 DevDay 最有意思的，其實不是臺上講了啥，而是散會之后，一群人開始琢磨「我能用這玩意兒搞點什么」

然后大家對著新的 API 文檔，在 GitHub 上傳著各種項目，并在 Twitter、朋友圈、即刻、小紅書上發布著各種 Demo...

這個時代，著實令人贊嘆

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.