本來已經備好我的Switch2開始愉快的國慶之旅了。
結果好死不死的,這群AI廠商又卷起來了。
OpenAI大半夜的,宣布,Sora2來了。
![]()
看完直播之后,我的困意基本消失殆盡。
我在劇組的群里說:
![]()
我之前一直說,我們做AI電影工業化的時候,有一個原則,就是AI生成的片段不進成片。只是輔助,純粹的輔助。
但,我今天收回這句話。
![]()
一聲長嘆,時代的車輪滾滾向前。
誰知道2027年的時候,這個世界,又是什么樣的光景呢?
Sora 2,用OpenAI的原話描述就是:
“With Sora 2, we are jumping straight to what we think may be the GPT?3.5 moment for video。”
AI視頻的ChatGPT時刻,正式來了。
全新的Sora 2,是一個原生的視頻和音頻生成模型。
注意用詞,是視頻和音頻生成模型,這不是一個純粹的視頻模型了。
類似于Veo3,但是從現在放出來的Demo看,整體效果卻遠超于Veo3。
直接看官方宣傳片吧。
這質量我只能跪著給他們磕頭。
GPT-5拉了個大的,Sora 2又是王者歸航。
不愧是OpenAI。
這次主要是發布了兩個東西,一個是Sora 2模型,一個是Sora APP。
Sora 2模型基本就是現在的SOTA了,而Sora APP的野心則更大,他們要做新時代的AI抖音,而且確實很有創意,以社交驅動,讓我想起了當年的激萌Faceu。
我們,一個一個來說吧。
一. Sora 2
現在的AI視頻模型,基本卷的目標和方向是比較一致的,就是物理運動、人物表演、一致性、音頻。
物理運動比較好理解,就是真實,極度的真實,跟現實一樣真實。
Sora 2在這個部分,確實有極強的進步。
我們一直說,體育運動,特別是體操和球類運動,幾乎就是AI視頻模型的圖靈測試,幾乎沒有太多AI視頻模型能做的特別好的,即使是hailuo 02和可靈2.5,也只是成功部分或者局部。
而Sora 2非常離譜,可以完成奧運體操動作,在槳板上完成后空翻,甚至還能打排球。
Prompt:一名體操運動員在平衡木上翻轉,電影感十足。

對比一下當年Sora 1的。

真的,這個進步,實在是過于明顯了,1年半的時間,卻好像過去了好久好久。
Prompt:滑板運動員做了一個空翻。

Promp:一個男人從跳水板上跳下,做炸彈式入水動作。

這些我放的是GIF,但是不要忘了,這些里面其實是有聲音的。
比如這個打排球。
還有在槳板上完成后空翻。
里面的聲音幾乎沒有瑕疵,極度寫實,還有人打排球的運動也是。
目前這確實是我看到的,運動質量和物理規律最牛逼的了。
在動漫風格上,也還不錯。
然后就是人物表演,這個其實要跟一致性和多模態能力一起說。
因為如果是不念臺詞的人物表演,其實現在已經差不太多不分伯仲了,而念臺詞的人物表演,也就是我們俗稱的AI演員,或者是數字人,才是現在大家卷的重點,所以必須要帶上多模態也就是音頻能力。
現在,你可以在Sora產品中,進行身份驗證,生成一個你的分身,作為一個你的數字人的固定ID。
后續你就可以直接調用這個角色,來進行特定的人物生成了。
而配合上固定角色以及極度真實的人物表演,還有幾乎完美的音頻生成,讓AI做真正的故事片,不再是幻想。
而這個腦袋撞橋,就非常的短視頻了,但是也特別的真實。
Prompt:@daniel 在斑馬群的中間吹小號。
Prompt:@daniel 和 @duxin 進行一場臂力比賽,你決定誰獲勝。
人物的表演和神態,還有分鏡,跟真實視頻相比已經看不出來什么區別了,音頻級別也是現在的SOTA。
環境聲、風聲、碰撞聲,甚至是多人在同一個片段里,你就跳不出來音頻的錯誤。
而且可以看到兩個視頻片段里的 @daniel,人臉幾乎就是一模一樣的。
ID的一致性也得到了完美的還原。
從代碼里看,Sora 2應該是有兩款模型。
![]()
Sora 2和Sora 2 Pro,應該類比可靈的標準版和高品質版。
目前比較坑爹的是,雖然說優先考慮ChatGPT Pro用戶的訪問,但是目前僅限于美國和加拿大地區,并且啟用了萬惡的邀請碼機制。
我雖然靠著朋友搞到了邀請碼,但是這玩意,門檻還是高。。。
![]()
首批用戶會收到4個邀請碼,可以分享給朋友一起體驗,因為團隊認為這款應用最適合社交場景使用,甚至可能成為一種新的消息傳遞方式。。。
目前已上線可用的版本,說實話沒啥參考意義,被閹割的比較狠,在生成的時候,你幾乎無法選擇參數。
![]()
只有橫屏和豎屏,直出10s視頻,清晰度低的離譜,360P。
![]()
等著OpenAI后面更新吧。
二. Sora APP
這一次,Sora產品本身成為了重點。
目前Web版已經更新,IOS版已經在美區Appstore上限,但是沒有安卓。
![]()
但正如我上面說的,邀請制,現在沒有邀請碼的用戶,都進不去。
我盡可能的讓大家看懂這個產品是個啥。
先來看他們的片子。
如果用一句話總結的話,這好像是AI版的抖音。
用戶可以在上面刷到公域里玩家生成的AI視頻,可以點贊轉發關注等等一些列操作,甚至整個交互形式和UI,都跟抖音完全一個樣。
但是最有趣的功能,其實還說數這個“cameos”功能,中文名出鏡秀。
![]()
這張圖,就是非常標準的cameo界面,可以簡單的理解為,每一個頭像,都是一個cameo,你在生成視頻的時候,可以@他們,讓特定的角色來出演。
比如第一個就是我,你可以@rockhazix,讓我和第二個人sam,一起在很酷的餐廳里吃一頓有趣的晚餐。
這,就是cameo,就是讓你的好友來你的視頻里客串,一起共演。
OpenAI自己認 為,Sora APP是純粹的 為了跟朋友一起使用而制作的。
他們說,測試者們的壓倒性反饋表明,正是因為cameo讓這款應用顯得與眾不同且有趣,它是一種與人們交流的新穎獨特方式。
不過這塊OpenAI做了嚴格的限制。
你在創建你自己的cameo的時候,要做非常復雜的身份驗證。
會要求你錄制動態音頻提示,完成隨機音頻挑戰后,還需要通過活體檢測,以確保這個手機面前的人,是你自己。
![]()
在錄完以后,你還可以通過Cameo偏好設置來調整模型對你的呈現方式。
![]()
最后一切搞定后,你就可以在創作的時候,@你自己了。
比如我就@了我自己和奧特曼,一起吃了一頓晚餐。
運動幅度上,也是確實牛逼的,比如我在大街上喊Sora 2 is out。。。就是我也不知道,為什么面部這么猙獰。
但是我說實話,歐美人的人臉ID保持確實不錯,但是亞洲人,還是老問題,比較一般,這是歐美公司的通病了。
比如我的這個視頻,我是真的不太想放,有點辣眼睛,但是吧,為了給你們看效果,我還是放一下。。。
玩法還是蠻多的,但是不穩定也是真的。
最后,花一點篇幅,來聊聊這個AI版抖音,Sora APP。
坦誠的講,我對這個產品是非常看不清的。
過去所有做AI視頻信息流的,有一個算一個,要么不瘟不火,要么幾乎都淹沒在了歷史的塵埃里。
因為,你完全無法解決一個問題,創作者發作品,是希望得到流量和正反饋的,那同樣的視頻,我為什么要發在你這,而不發在抖音上呢?
還有,現在的普通用戶,真的對在乎是不是AI視頻嗎?沒人在乎,技術只為作品服務,你作品做的好,用戶管你是手繪是CG是實拍還是AI呢?
所以我一直覺得,為了單獨去看AI作品而去一個新的產品去接受一個幾乎沒什么人的生態,這一直都是一個偽命題。
而Sora APP這次不一樣點是,因為模型的巨幅飛躍,所以他們搞出了cameo這個東西,硬生生把一個AI版抖音,做成了一個社交產品。
對,Sora APP這玩意,雖然大家都在說它是AI版抖音,但其實根本不是什么AI版抖音,這是以對朋友搞整活和抽象為核心的,社交產品。
有點像當年的Snapchat、激萌Faceu。
而很多新的社交產品,天然的弊端就是,火的快,去的也快。
之前有個產品叫BeReal,2022年爆火,當時強迫所有用戶每天同一時間拍攝一張前后攝像頭同時記錄的照片,迅速席卷歐美年輕群體,一度下載量登頂。
但不到一年,用戶新鮮感消退后,迅速陷入困境,現在已經淡出主流視線。
AI視頻+cameo當然是一個全新的物種,再加上AI會讓所有的人都有創作的權利,上來整蠱朋友+remix,可能會出現很棒的生態。
但,也有可能讓社區同質化嚴重,最后消失。
說實話,我現在看不清Sora這個產品的未來。
我只能說,在現在這個階段。
先玩起來再說!
歡迎大家來加我好友,隨意整活!
https://sora.chatgpt.com/profile/rockhazix
![]()
國慶快樂~
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.