全文 3,000字 | 閱讀約 8 分鐘
![]()
(播客片段|Sam Altman:為什么 Sora 不只是視頻工具)
9 月 30 日,OpenAI 發(fā)布 Sora 2,同步推出全新 App,加入肖像授權(quán)機(jī)制。
上線不到一周,Cameo 表情包刷爆社交平臺,Altman 的 AI 形象出現(xiàn)在無數(shù)群聊、朋友圈、創(chuàng)作者社區(qū)。Sora 迅速從技術(shù)演示變成現(xiàn)象級產(chǎn)品。
但這一次,OpenAI 打響了 AI 時代的“入口之戰(zhàn)”。
10 月 8 日,Sam Altman 現(xiàn)身 a16z 播客,首次全面闡釋了 OpenAI 的戰(zhàn)略方向: “我們不會只是發(fā)布技術(shù)演示,而是讓社會提前體驗(yàn)即將到來的事物。AI 的入口,不再是對話框,而是生成一整段畫面,甚至幫你先想一步。”
他透露:視頻只是前奏,真正的入口革命來自 4 個判斷:
視頻變界面、模型變科學(xué)家、Agent 走向“零員工公司”,到自建 AI 工廠。
這 4 個判斷,正在決定 AI 入口之戰(zhàn)的走向。
第一節(jié)|視頻,是 AI 理解世界的新眼睛
你可以把 Sora 看作一個不斷渲染視頻的界面,一個新的世界建模方式。——Sam Altman
Sora 火了,但它的意義并不只是生成視頻。
Altman 的判斷很清楚:Sora 的價值,不在于畫面精美,而在于教會 AI 理解物理世界。
過去,AI 只能讀文字、看圖片,是靜態(tài)認(rèn)知;
現(xiàn)在,視頻讓 AI 開始理解動作、空間、因果關(guān)系。這是認(rèn)知方式的質(zhì)變。
Altman 舉了個例子:不是你打開一個網(wǎng)頁,問它“這段話什么意思”;而是你在真實(shí)世界里拍一段視頻,AI 自動看懂畫面,知道誰在動、發(fā)生了什么,甚至能預(yù)判“接下來可能出什么問題”。
從看圖到讀動作,AI 的理解維度變了。
但 OpenAI 發(fā)布 Sora 還有更深一層考慮:讓社會提前適應(yīng)即將到來的現(xiàn)實(shí)。很快,任何人都能用 AI 生成以假亂真的視頻。
Altman 的原話是:
“視頻的情緒共鳴遠(yuǎn)超文本。文本可以騙你一次,視頻直擊人心。”
當(dāng) AI 視頻無處不在時,沖擊會比想象中更大。社會必須盡早建立免疫力。
而從技術(shù)層面看:
Sora 不只是內(nèi)容工具,更是 AI 觀察世界的新方式。
這雙“眼睛”正在變成一個新入口。不是你輸入問題,而是 AI 主動觀察、理解,替你想一步。
視頻,正在成為 AI 通往 AGI 的關(guān)鍵訓(xùn)練場。
第二節(jié)|AI 的價值不在答題,而在主動思考
Sam Altman 在這次訪談里提到一個變化:我們第一次看到 AI 開始在科學(xué)研究中提出新想法。不是總結(jié)別人的觀點(diǎn),而是自己想到從沒出現(xiàn)過的解法。
GPT-5 的某些能力,已經(jīng)跨過了日常工具的邊界。
它不再只是寫郵件、潤色文案,而是在數(shù)學(xué)、物理、生物研究中,給出科學(xué)家都沒想到的推導(dǎo)路徑。
Altman 表示:
“我們過去以為圖靈測試是 AI 的終極標(biāo)準(zhǔn)。結(jié)果呢?它在不知不覺中就通過了。真正大的轉(zhuǎn)折,是 AI 開始做‘我們做不到的事’。”
比如:
在物理研究中幫忙計(jì)算復(fù)雜公式
在數(shù)學(xué)問題中找出新的證明思路
在生命科學(xué)里幫助建立假設(shè)模型(哪怕它不是 100% 準(zhǔn)確,但它敢提出)
過去我們問 AI:這是什么意思?
現(xiàn)在它開始主動告訴我們:也許可以這么想。
Altman 對 AGI 的標(biāo)準(zhǔn)很明確:當(dāng) AI 能做出科學(xué)發(fā)現(xiàn)時,才算真正的通用智能。
現(xiàn)在,它已經(jīng)開始了。
很多人還停留在 AI 能寫代碼、畫圖的印象中。 但在 OpenAI 內(nèi)部,GPT-5 的研究人員已經(jīng)在嘗試讓它做研究助理甚至研究搭檔。它不會取代科學(xué)家,但它能成為一位每天 24 小時在線的“靈感提出者”。
他認(rèn)為:
“AI 做科學(xué)這件事,可能是接下來幾年里最深遠(yuǎn)的改變。”
而這背后意味著什么?
AI 的角色變了:不再只是被動回答,而是主動觀察、尋找線索、提出可能性。
從“等你問”到“替你想”。
而這,已經(jīng)在發(fā)生。
第三節(jié)|從零代碼到零員工,Agent 重置創(chuàng)業(yè)起點(diǎn)
我們現(xiàn)在真的在賭,什么時候會出現(xiàn)第一家零員工公司。 ——Sam Altman
在這場長達(dá) 40 分鐘的訪談中,Altman 多次提到一件事:Agent,已經(jīng)能真正干活了。
不需要懂代碼,不用組建團(tuán)隊(duì)。你只要會寫一句話,AI 就能自動處理任務(wù)、生成流程、完成執(zhí)行。
Altman 在后臺看過 OpenAI 內(nèi)部的 Agent Builder 流程演示后感慨:
“這些東西一年前還要花很久才能完成,現(xiàn)在你幾乎可以實(shí)時搞定。我感覺自己想創(chuàng)意的速度都跟不上了。”
過去,你可能需要一個運(yùn)營、一個客服、一個銷售、再加一個數(shù)據(jù)分析師。 現(xiàn)在,只要你能描述清楚要做什么,AI 就能一并幫你完成:
回客戶消息
整理 Excel 報(bào)表
查找資料
撰寫文案
調(diào)用外部工具提交結(jié)果
OpenAI 稱之為 Agent:一個真正能執(zhí)行任務(wù)的 “AI 同事”。
不是陪你聊天的助手,而是真正能接需求、出結(jié)果的執(zhí)行層。
Altman 舉了個例子:今天有人跟我說,AI 已經(jīng)能完成一整天的工作任務(wù)了,太驚人了。也許現(xiàn)在還達(dá)不到“一周不用管”,但這個目標(biāo)并不遙遠(yuǎn)。
這不再是提升效率那么簡單。
而是出現(xiàn)了一種全新的工作單位: 一個人加一套 AI,能撐起一個完整業(yè)務(wù)。
Altman 回憶,過去他和朋友們賭什么時候出現(xiàn)一個人運(yùn)營的十億美元公司;現(xiàn)在他們的新賭局,是零員工公司什么時候會成為現(xiàn)實(shí)。
他親眼看到,越來越多團(tuán)隊(duì)在用 AI 做流程,做運(yùn)營,甚至做產(chǎn)品。
所以他強(qiáng)調(diào):
“AI 帶來的改變,很多不是模型更強(qiáng)了,而是人做事的方式變了。”
當(dāng) AI 不再只是工具,而是能持續(xù)執(zhí)行任務(wù)的執(zhí)行層, 組織的起點(diǎn)就被重置了。
你不再需要“一個團(tuán)隊(duì)”,而是一個想法 + 一套 AI。
第四節(jié)|從模型到入口,全棧自建才有主導(dǎo)權(quán)
OpenAI 已經(jīng)不是一家只做模型的公司了。
過去,它被看作“模型公司”。核心能力是訓(xùn)練 ChatGPT、Sora 背后的技術(shù)。
但 Altman 在這次訪談中直言:為了做出真正有用的 AI,光靠模型不夠。我們得自己建基礎(chǔ)設(shè)施,自己控制用戶接觸 AI 的方式。
這不是說說而已。
OpenAI 正在建人類歷史上最大的基礎(chǔ)設(shè)施項(xiàng)目之一,包括:
和 AMD 合作造 AI 芯片
和微軟、NVIDIA 搭建大規(guī)模數(shù)據(jù)中心
親自推進(jìn)建設(shè) AI 電廠,解決用電問題
投入數(shù)十億美元,布局從底層硬件到終端應(yīng)用的全部鏈路
為什么要投入這么多?
Altman 的答案是:如果入口在別人手里,OpenAI 最終只能依附于別人的平臺。
這讓他徹底改變了一個長期觀點(diǎn)。
他說:我以前是反對一家公司從頭做到尾的,覺得太笨重、不靈活。但現(xiàn)在我承認(rèn)我錯了。我們必須自己掌握全鏈路。
邏輯很簡單:只有掌握入口,AI 才能真正落地。
今天的 OpenAI,已經(jīng)是三位一體:
一個研究團(tuán)隊(duì):不斷突破模型邊界
一個產(chǎn)品團(tuán)隊(duì):把突破變成用戶產(chǎn)品
基礎(chǔ)設(shè)施團(tuán)隊(duì) :從電開始自己解決
核心就一句話:想給人類提供真正有用的 AI,就得親手建出這套東西,而不是等別人幫忙。
入口在哪,主導(dǎo)權(quán)就在哪。
OpenAI 不再等別人給入口,而是選擇從底層開始重新搭建。
結(jié)語|誰先想清楚,誰就掌握入口
這場入口之戰(zhàn),表面看是 Sora 爆紅、視頻模型進(jìn)化,
但 Sam Altman 真正推動的,是一套全新的交互邏輯:不是你點(diǎn)開 App,而是 AI 主動理解、回應(yīng)、替你想一步。
他的 4 個判斷,指向同一個核心:
視頻 —— 讓 AI 理解物理世界
科學(xué) —— 讓 AI 主動發(fā)現(xiàn)問題
Agent —— 讓 AI 執(zhí)行完整任務(wù)
基礎(chǔ)設(shè)施 —— 掌握從生產(chǎn)到交付的完整鏈路
未來的 AI,不是你問一句它答一句,而是它先觀察、先推理、先給出可能性。
Altman 已經(jīng)開始親手搭建這個未來。
而每一個使用 AI、開發(fā)產(chǎn)品、構(gòu)建組織的人,也必須做出選擇: 下一步,是讓 AI 等你的指令,還是讓它先想清楚,你再做判斷?
這才是真正的入口之變。
本文由 AI 深度研究院出品,內(nèi)容整理自 Sam Altman 在 a16z 播客訪談。未經(jīng)授權(quán),不得轉(zhuǎn)載。
星標(biāo)公眾號, 點(diǎn)這里 1. 點(diǎn)擊右上角 2. 點(diǎn)擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)
https://www.youtube.com/watch?v=JfE1Wun9xkk&t=1369s
https://www.youtube.com/watch?v=zwnVUiwObl8&t=633s
https://blog.samaltman.com/sora-update-number-1
https://openai.com/index/sora-2/
https://podcasts.apple.com/us/podcast/a16z-podcast/id842818711?utm_source=chatgpt.com
來源:官方媒體/網(wǎng)絡(luò)新聞,
排版:Atlas
編輯:深思
主編:圖靈
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.