品玩3月10日訊,據(jù) the-decoder 報道,開源視頻生成模型Helios正式發(fā)布,成為首個在單張GPU上實現(xiàn)19.5幀/秒(FPS)推理速度的140億參數(shù)視頻模型,并支持生成長達(dá)一分鐘的連續(xù)視頻。其代碼與模型權(quán)重已全面公開。
當(dāng)前主流視頻生成模型多局限于5至10秒片段,且渲染耗時數(shù)分鐘;而實時方案通常依賴13億參數(shù)以下的小模型,難以兼顧畫質(zhì)。即便是同類14B模型如Krea-RealTime-14B,在H100上僅達(dá)6.7 FPS,并存在明顯畫面漂移問題。
Helios基于Wan-2.1-14B架構(gòu)改進(jìn),通過三階段訓(xùn)練流程——Helios-Base(抗漂移架構(gòu))、Helios-Mid(令牌壓縮,1.05 FPS)及Helios-Distilled(三步極速推理)——顯著提升效率。開發(fā)者實測顯示,蒸餾版Helios達(dá)19.53 FPS,性能甚至超越參數(shù)量約七分之一的SANA Video Long(13.24 FPS),在長視頻生成領(lǐng)域樹立新標(biāo)桿。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.