AI時代,無論你主不主動,都與你有關,歡迎來到AI變革
FORCE LINK AI創新巡展·上海站,火山引擎狠狠亮了一把家底:不僅帶來了全新的視頻生成模型Seedance 1.0 lite和視覺深度思考模型豆包1.5,還順手把音樂模型也升級了。這波操作,目標很明確,打通企業從“干活”到“智能干活”的全過程,不只是提供模型,更是要把智能體工具玩出花樣,把AI徹底裝進業務流程里。
新出的Seedance 1.0 lite,主打一個輕盈快準,既能看文字變視頻,也能把靜圖整活變動態,支持5秒、10秒兩個時長,畫質嘛,有480P和720P兩檔,剛好卡在“能看清又不卡”的黃金位置。
別看這模型體積不大,Seedance 1.0 lite堪稱“輕騎兵”里的狠角色:畫質直接沖到影視級別,生成速度更是跑得飛快,效果、效率、價格,三者之間居然做到了一個不落,完美踩在性價比的點上。
這模型最大的本事之一,就是聽得懂“人話”還干得漂亮。你要她生成個金發卷發小姑娘,穿旗袍、帶微笑、舉杯敬酒,Seedance統統能懂。
不止人物細節把控得好,就連多個角色之間如何互動、怎么切鏡頭、情緒語氣輕重這些細枝末節,它也拿捏得準準的。
豆包1.5這次可算是出盡了風頭,在60場公開考核里拿了38個第一。別看它只用了20B的激活參數,輕裝上陣,但多模態理解、視覺推理、界面操作這些難點,它全都能游刃有余地搞定。
這模型在“看片”方面特別拿手,不光能智能調節幀率,還能從時間線上精確找到你說的那一幕,配合向量搜索,就是一個AI剪輯助理。
至于那位“豆包音樂家”,這回也迎來了新技能解鎖——不僅能唱英文歌了,還能看著視頻編配BGM,氛圍拿捏得死死的。一段畫面配點節奏感十足的音樂,瞬間就能提升整個作品的檔次,不管是廣告、短劇還是Vlog,都能來點“氛圍拉滿”的背景聲。
來看一看官方給出的視頻和prompt:
prompt:荒涼的戈壁環境,鏡頭跟隨一位駕駛哈雷摩托的男性,特寫鏡頭,騎手的額頭綁著土黃色的頭巾,身著藍色和銀色條狀裝飾的皮質騎手服,露出狂野的笑容后,鏡頭突然向上搖,有一只禿鷲在上空盤旋。
prompt:旋轉鏡頭,三只長得一模一樣的猿猴圍成一個圈,一個用手捂住眼睛,一個用手捂住耳朵,一個用手捂住嘴巴
prompt:手持鏡頭,畫面微微抖動體現手持感,跟隨在一只在玫瑰花園中散步的貓身側
國漫視頻:
來源官方影調細膩的超清畫質
來源官方
S eedance 1.0 lite模型在視頻生成質量方面實現了重大突破,達到了影視級別的視覺效果。作為豆包視頻生成模型系列的小參數量版本,它在取得出色視頻生成質量的同時,顯著提升了生成速度,是兼顧效果與效率的性價比之選。
火山引擎方面也給了個定心丸:豆包以后還會繼續練“內功”,一邊降低使用成本,一邊再壓低響應延遲,目標就是讓AI不再是“高冷天價貨”,而是能跑進每個企業、用在每個場景的“數字勞模”。
使用地址:doubao-seedance-1.0-lite:https://www.volcengine.com/docs/82379/1553576
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.