今天是 OpenAI 的年度發布會:
OpenAI Dev Day 2025

10月7日凌晨一點召開,算是國慶獻禮
不愧是你:山偉國
![]()
按 Sam 的話來說,這場發布會是聚焦于「如何讓人更好的用 AI 去創造」,并帶來了以下新鮮內容
- App inside ChatGPT:加強版的 Plugin 系統
- Agent Kit:OpenAI 的「扣子全家桶」
- Codex 正式版:OpenAI 版的 「Claude Code」
- API Update:GPT-5 Pro、Sora、Real-Time Mini 的 API 都發布了
- 還有個大會上沒講的新模型 gpt-image ,這個也以 API 發布了,是個生圖的模型
本次發布
不過按我的看法,這次的發布,更像是是聚焦于:讓開發者去定義「人與 AI 的交互方式」
這里,讓我按發布順序,仔細盤盤。并且,補充一些發布會上沒說的內容
App Inside ChatGPT
可以理解為,這是更加 Plugin 系統的加強版
先說下插件系統,這是 MCP 或者 Function Call 的鼻祖,于 2023年3月14日發布、5月中灰度上線的到了 ChatGPT。通過這個系統,ChatGPT 可以向外部請求數據,比如聯網搜索、查詢數據庫,或者干脆生成一個視頻(HeyGen 當時也接入了 Plugin 系統)
后來,這個系統在去年4月9日下線,取而代之的,是大家更熟悉的 GPTs + 自定義 Action
這次的發布,更像是 Plugin 系統的加強版,第三方應用給到的不單單是數據,而且可以是界面
比如說,在之前的 plugin 系統中,用戶通過 ChatGPT 讓 Canva 去做一個 ppt,那么用戶會獲得一個鏈接,點開后打開對應的 Canva 的對應頁面,然后繼續編輯
![]()
在這個過程中,ChatGPT 也可以直接看到對應的東西,方便了不少。你甚至可以直接在 ChatGPT 里播放 Coursera 的課程視頻,一邊看一邊問問題
![]()
Zillow 是美國的鏈家,在 Zillow 地圖上點了個房子,問「這離狗狗公園有多遠」,它能結合地圖上的信息去搜索回答
![]()
配合這個發布的,還有一個 Apps SDK。開發者們可以使用這個 SDK 把自己的應用集成到 ChatGPT 里面,獲取流量。Apps SDK 基于 MCP 標準構建,如果你已經有 MCP 服務器,只需要加個返回 HTML 的 resource,就能快速升級成完整的 app
這項功能今天就開始 Preview,可以去 OpenAI 平臺開始構建,年底會開放正式提交和審核流程,到時候還會有個 app 目錄讓用戶瀏覽
首批合作伙伴包括 Figma、Canva、Coursera、Spotify、Zillow 等,今天就能用
![]()
即將,還會有更多的專業伙伴加入,比如 Uber(美國的滴滴)、Tripadvisor(美國的攜程/大眾點評)
![]()
同時,未來還會支持多種變現方式,包括新的 Agentic Commerce Protocol,幫助開發者完成商業化的閉環
Agent Kit
![]()
看這個界面,像不像扣子?沒錯,OpenAI 發布了他們的 Workflow 編輯器
從產品延續的角度,也可以說是 GPTs 的升級版:給 GPTs 加了更復雜的工作流,也能定義輸出的形式
對于上面說的「定義輸出的形式」,對于這次的 OpenAI 發布會,如果我想做一個指定場景的工具「DevDay 百事通」,除了能像常規 Workflow 編輯器那樣上傳數據庫之外,還可以給它一個樣式模板,比如這個:
![]()
在這種情況下,我去問它問題:有什么關于 building agents 的分享?
它回復的,便不再是純文字:“11:15 有一場 Orchestrating Agents at Scale,由 James 和 Rohan 主講,講的是如何構建 agents”
而是給你一個卡片:帶著會議時間、主講人、地點
![]()
對了,這個 case 是一個叫做 Christina 小姐姐(看著是華裔)在臺上現場搓的,累計沒用到 8 分鐘,流程包括:
- 設置工作流邏輯(分類器 + 條件判斷)
- 上傳會議日程文檔
- 加 PII 保護的 guardrail
- 配置輸出的 widget 樣式
- 部署到網站上
對于這套東西,Ramp 團隊用 Agent Builder 幾小時就搭出了采購 agent,迭代周期縮短了 70%,兩個 sprint 就上線了(以前要兩個季度)
![]()
這套東西,叫做 Agent Kit,包含以下核心組件:
- Agent Builder
- Chat Kit
- Evals for Agents
逐個來說說
Agent Builder
可視化編輯工作流,拖拽節點就能搭。左邊是常用的構建模塊,包括工具(file search、MCP)、guardrails、human-in-the-loop、各種邏輯節點。支持預覽運行、內聯 eval 配置、完整版本管理。滿意了就發布,拿到 workflow ID 直接用
![]()
另外,Agent Builder 里可以啟用 Guardrails——開源的模塊化安全層,能屏蔽或標記 PII、檢測越獄攻擊等,讓 agent 更可靠、更安全
扯個題外話,這東西很像扣子的「開發平臺」
![]()
Chat Kit
可嵌入的聊天組件,直接集成到你自己的產品里。處理流式響應、管理對話線程、展示模型思考過程這些復雜的事情都幫你搞定。可以自定義品牌、主題、樣式。Canva 說他們用 ChatKit 給開發者社區做支持 agent,省了兩周時間,集成只花了不到一小時
扯個題外話,這東西很像扣子的「WebSDK」
![]()
Evals for Agents
去年發布的 Evals,這次加了四個新能力:
- Datasets:快速構建 agent evals,用自動評分器和人工標注不斷擴充
- Trace grading:端到端評估 agent 工作流,自動評分找出問題
- 自動化 prompt 優化:根據人工標注和評分器輸出生成改進的 prompt
- 第三方模型支持:在 OpenAI 平臺上直接評估其他廠商的模型
![]()
扯個題外話:這東西,很像扣子的「扣子羅盤」
![]()
此外,還有個發布會上沒提的、也算在這個 kit 里的東西:Connector Registry
![]()
這玩意兒就在 ChatGPT 的設置里面,幫你把所有數據源整合到一個管理面板里,橫跨 ChatGPT 和 API。
包括預構建的連接器(Dropbox、Google Drive、SharePoint、Microsoft Teams)和第三方 MCP,讓企業能統一管理多個工作區和組織的數據
編程工具 Codex
Codex 今天開始,來到了正式版
這東西,5月發布的:
上個月,更新了一版
現在的 Codex 用的是 GPT-5 Codex 模型,專門為寫代碼和 agentic coding 優化的。現在,OpenAI 內部幾乎所有新代碼都是 Codex 用戶寫的,用 Codex 的工程師每周多完成 70% 的 PR,基本上每個 PR 都過 Codex review
![]()
現在的 Codex 不只是命令行工具了,可以在你的 IDE、終端、GitHub、ChatGPT 賬號里都能用,無縫切換
![]()
Codex 這東西,還是靠譜的,在現場的工程師小哥 Ramon 做了個炸裂演示:
Ramon 拿了個會場上方的攝像頭,讓 Codex 寫代碼控制它。Codex 自己找到了 30 年前的 VISCA 協議文檔,寫好了控制代碼,還做了個控制面板,并且用 XBox 手柄就能控制攝像頭
![]()
最后來了個大的:用 Real-time API 加語音,控制會場的燈光系統(通過 MCP)
現場對著 ChatGPT 說:“把觀眾席的燈打亮”,燈就亮了

整個過程,小哥一行代碼都沒手寫,純口噴
除此之外,Codex 還多了以下倆玩意兒:
Slack Integration:直接在 Slack 里問 Codex 寫代碼或回答問題,團隊協作更方便
![]()
Enterprise Control:給企業用的管理工具,包括環境控制、監控、分析儀表板等,讓大公司也能放心用
![]()
API 迭代
敲黑板,這里是正片
本次發布會,明面上帶來了三套模型的 API:
- GPT-5 Pro
- Sora2 & Sora2 Pro
- Real-Time Mini
但其實...還發布了他們家的圖像生成 API gpt-image-1-mini,低至 0.005 美分一張圖。下面,讓我來分別說說
GPT-5 Pro API
8 月發布的 GPT-5 Pro,現在開放 API 了
這模型有 400k 上下文,272k 最長輸出,適合金融、法律、醫療這種需要高準確度和深度推理的場景。Cursor、Windsurf、Replit 等頭部編程工具都在用 GPT-5 系列改變軟件開發方式
內部數據:GPT-5 Codex 已經處理了超過 40 萬億 tokens,是 OpenAI 增長最快的模型之一
![]()
Sora 2 發布
重頭戲來了,Sora 2 API 開放 Preview,分兩個版本:
sora-2:快速版,適合快速迭代。幾分鐘出結果,適合社交媒體、產品原型、概念設計
sora-2-pro:更大更強,渲染時間更長價格更貴,但畫質更精致穩定。適合高分辨率電影鏡頭、營銷素材等對視覺精度要求高的場合
價格呢...如下圖,一個 15 秒的視頻,需要至少 1.5 美金~10.5 人民幣
![]()
調用的話,代碼大概這么寫
from openai importOpenAI openai = OpenAI() # 生成視頻 video = openai.videos.create( model="sora-2", prompt="草地公園的廣角鏡頭,孩子放著紅色風箏,黃金時刻陽光" ) # 輪詢狀態直到完成 while video.statusin ("in_progress", "queued"): video = openai.videos.retrieve(video.id) time.sleep(2) # 下載視頻 content = openai.videos.download_content(video.id) content.write_to_file("video.mp4")Real-Time Mini
語音模型 Real-Time Mini,比之前的 Advanced Voice 便宜 70%,質量一樣
Sam 說他覺得語音會成為人跟 AI 交互的主要方式,所以把價格打下來,讓大家都用得起
(Sam:家人們,我把價格打下來了)
![]()
GPT Image
這是個畫圖的新模型,支持圖片、文字輸入,然后生圖,效果挺不錯的
模型也分正式版和mini版,價格如下
![]()
One More Thing
這次發布會,還有幾個很有意思的點:
Sam 炫了個數據
開場就說現在有 400 萬開發者在用 OpenAI,每周 8 億人用 ChatGPT(沒聽錯,8億),API 每分鐘處理 60 億 tokens
![]()
而在兩年前的時候,是 200 萬開發者、1 億用戶、3 億 tokens/分鐘。翻了一倍不止
![]()
現場表彰
大屏幕上列出了處理過 100 億、1000 億、甚至 1 萬億 tokens 的、在現場的開發者名字,全場鼓掌,頗有種「這些才是真正推動未來的人」的儀式感
![]()
日本 89 歲老爺爺
Sam 提到了一個案例,日本一個 89 歲的退休老人用 ChatGPT 自學編程,做了 11 個 iPhone app,專門給老年人用。這種故事聽著就很暖
![]()
以及,開場有一句話我很喜歡
"AI has gone from something people build, play with to something people build with every day."
![]()
按 Sam 的話說,AI 已經從「大家拿來研究、試驗的新鮮玩意兒」,變成了「每天都在用的生產工具」,一切潛移默化,一切順利應然
OpenAI 會在每年秋天,進行一場面向開發者的發布會,稱為 OpenAI DevDay
第一場 DevDay 2023,聚焦于模型能力,于2023年11月6號召開
這場發布會,帶來了新模型 GPT?4 Turbo(有了多模態理解)、JSON Mode(現在的結構化輸出)、GPTs(OpenAI 最早的場景 Agent 探索)
![]()
提前拿到了 GPTs 權限...前 100 個 GPTs 里,可能有 3 個是我搓的
第二場是 DevDay 2024,聚焦于業務應用,一連開了3場,分別在舊金山(10月1號)、倫敦(10月30號)和新加坡(11月21號)
這系列的發布,帶來了 Realtime API、Prompt Cache、蒸餾工具,并預告了 o1 的各項更新(比如:函數調用、開發者消息、結構化輸出和圖片理解)
![]()
發布會送的徽章,還挺好看的
今天是第三場:Dev Day 2025,N 倍擴大了規模,OpenAI 的朋友跟我說,這次來了上千人,人山人海...那烏壓壓的場面
![]()
這次陰差陽錯沒去成現場(心痛)
老實來說,每次 DevDay 最有意思的,其實不是臺上講了啥,而是散會之后,一群人開始琢磨「我能用這玩意兒搞點什么」
![]()
然后大家對著新的 API 文檔,在 GitHub 上傳著各種項目,并在 Twitter、朋友圈、即刻、小紅書上發布著各種 Demo...
這個時代,著實令人贊嘆
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.