最近琢磨事群里,大家在秀自己的各種產(chǎn)出,我就也順道拿視頻參與了下,試了試基模的能力。
試完后最大感慨就是:AI折疊速度太快了,再不從業(yè)務(wù)回看技術(shù)(無(wú)人公司是這個(gè)視角),還是從技術(shù)看業(yè)務(wù)就真太危險(xiǎn)了。
下面上一些結(jié)果,這是純粹使用體驗(yàn),不專業(yè),不是評(píng)測(cè),不整成懂車帝那樣。
我不會(huì)做視頻剪輯,所以下面的所有內(nèi)容全部靠基模。
1. 20s的人物短視頻
這個(gè)視頻過程是用GPT生成了一張皮克斯風(fēng)格的圖,然后可靈圖生視頻,聲音是自己錄后對(duì)的口型。
總計(jì)大概花了10多塊錢,用時(shí)10~20分鐘(不算等待的時(shí)間),也不算文案時(shí)間。
沒寫任何復(fù)雜提示詞,就正常和人說(shuō)話一樣完成的。
語(yǔ)音合成比較拉胯,和當(dāng)年做智能音箱的時(shí)候差別不大,還得自己錄。GPT精修人物形象比較拉胯,比如會(huì)把人物修成這樣...
![]()
2. 帶視覺效果的視頻
這是veo 3,也沒設(shè)計(jì)復(fù)雜提示詞,就是給了篇文章,讓它匹配一段視頻。
文章類似這篇:
這個(gè)也啥也沒干,就是把上面文章的段落給模型了。
上面這視頻也是沒干什么,就是扔了上面的文章的一段給模型,模型自己設(shè)計(jì)提示詞,自己生成。
這個(gè)模型能力還是很好的,比Sora好,但是沒啥配套的輔助工具,我又不會(huì)剪輯,就扔在哪兒了。
3. 文字問題看起來(lái)也接近解決
群里大家還很是貢獻(xiàn)了點(diǎn)其它創(chuàng)意,比如:
![]()
![]()
![]()
大家看起來(lái)都是用qwen image和豆包整的。文字是個(gè)神煩的問題,如果能解決就真的很好。
這里面十分要命的點(diǎn)是:每個(gè)這種改善估計(jì)都有N個(gè)團(tuán)隊(duì)做過N種工具吧。可基礎(chǔ)模型一進(jìn)步,這些工具的價(jià)值就真的會(huì)大幅削減。
從業(yè)務(wù)看AI,AI是成本,AI越進(jìn)展能做的業(yè)務(wù)越多;從技術(shù)看AI,AI是能力,能力在AGI面前只可能加速貶值。
動(dòng)筆寫無(wú)人公司,基本上是基于這個(gè)初衷,它應(yīng)該是很少的從業(yè)務(wù)看AI的書吧。
注:入群或者加入AI碰撞局,聯(lián)系:shuixiu2024
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.