網易首頁 > 網易號 > 正文申請入駐

春節AI視頻“技術擂臺”：Seedance 2.0被稱“地表最強”，可靈3.0“電影感”能否反超？實測來了

2026-02-09 20:38:07　來源: 每日經濟新聞

四川舉報

分享至

AI（人工智能）超級入口競賽正酣，穩坐國內AI商業化第一陣營的快手“可靈AI”，自然也不會放過春節前這波沖量的機會。

2月4日晚間，可靈AI官宣上線可靈AI 3.0系列——“All-in-One”多模態輸入與輸出的大一統模型體系，包括視頻3.0、視頻3.0 Omni與圖片3.0、圖片3.0 Omni，目前已面向黑金、鉆石、鉑金會員上線，近期將全量開放。這也意味著，可靈AI在不到兩年時間里完成了三次關鍵升級。與此前解決“多任務統一”與“基礎一致性”的可靈AI O1模型相比，可靈AI 3.0強調從“生成畫面”邁向“理解創作語言”。

2月9日，知名科普博主“影視颶風”的一則評測視頻讓字節跳動旗下視頻生成模型Seedance 2.0“出圈”，評測顯示其在視頻大范圍運動、分鏡、音畫匹配等方面均有突破。游戲科學CEO（首席執行官）馮驥當天也在微博公開評價了Seedance 2.0，甚至直呼“當前地表最強的視頻生成模型，沒有之一”。

圖片來源：Bilibili官網截圖

此外，同日還有消息稱小紅書技術團隊正研發視頻剪輯類AI產品OpenStoryline，目前尚在測試階段，后續或開源。雖然小紅書方面暫未回應，但國內大模型公司這波“瘋狂更新”疊加春節“紅包大戰”的如期到來，無疑引爆了2026年AI競賽的整體態勢。

單純比拼模型實力的賽段或將成為過去，搶用戶、爭入口、拼規模，已然是一場“生死戰”。在最新這波春節“技術擂臺”中，可靈3.0究竟有沒有機會反超？《每日經濟新聞》記者獲得了為數不多的超前內測名額，一測究竟。

實測可靈AI 3.0“智能分鏡”：初步具備鏡頭調度意識

據官方介紹，可靈AI 3.0系列模型不再局限于生成畫面，而是開始理解視頻創作本身。具體有何表現？可靈AI方面向《每日經濟新聞》記者表示，這一能力主要體現在鏡頭關系、敘事節奏、角色邏輯與視聽語言等方面。AI視頻模型開始理解鏡頭、運鏡、節奏和上下文關聯，可針對臺詞設計分鏡、搭配畫外音，對各類高階視聽語言需求均能作出響應。

每經記者實測了可靈AI 3.0“智能分鏡”功能，并輸入包含專業名詞的復雜提示詞：“超高速動漫戰斗，電影攝像機并行飛行，劇烈震動以展示規模感，運用遠、全、中、近、特寫不同景別，結合俯拍與仰拍視角。”

從生成視頻效果來看，可靈AI 3.0生成了包含全景展現場面、中近景聚焦角色搏斗、特寫捕捉沖擊波和面部表情的連貫視頻。打斗場面連貫性強，不再是隨機堆砌炫酷畫面，而是有意識地運用鏡頭語言來服務“戰斗的暴力感與規模感”這一核心敘事。

圖片來源：可靈AI3.0智能分鏡功能實測截圖

這說明可靈AI 3.0初步具備鏡頭調度意識。對于普通用戶而言，這意味著用相對專業的術語描述想法，就有可能獲得結構成熟、富有電影感的短片，在一定程度上降低了專業敘事影像的制作門檻。

此外，在多角色、多語言敘事上，可靈AI 3.0系列模型也有升級。

這一輪測試，每經記者輸入了簡單的提示詞：“一人說優雅英式英語，一人說美式英語，一人穿插日語臺詞。”從生成效果能夠看出，一是音畫同步有明顯提升，二是支持多語言與方言混說。

圖片來源：可靈AI 3.0功能實測截圖

記者實測后發現，視頻中不同角色說不同語言時，口型、面部肌肉運動甚至神態情緒都與語音高度匹配。這無疑將AI視頻長期“對口型”不準的尷尬問題向前推進了一步。官方介紹稱，模型通過“原生跨模態音頻引擎”，實現了音色還原與提示詞指代的精確對齊。而官方支持中文多種方言，也為本土化內容創作打開了空間。

值得注意的是，“智能分鏡”已成為快手、字節跳動本輪技術升級的重點，在科普博主“影視颶風”最新發布的字節視頻模型Seedance 2.0的評測中，影視颶風創始人Tim高度稱贊其生成視頻的精細度、分鏡連續性及音畫匹配度等。比如，Tim稱其分鏡具有“明顯的角度切換”，能夠像真人導演一樣不斷改變攝影機的位置，并直言其是“改變視頻行業的AI”。

“一致性”升級：從“主題不崩壞”到“角色、表演、語音、敘事的跨模態統一”

“一致性”幾乎是AI視頻創作中最難攻克的問題。其不僅包括人物主體一致性，如人物不崩壞、動作連續等，還包括時序的一致性即長鏡頭、多鏡頭銜接穩定；場景與風格一致性，即多風格同框仍自然協調；多語言輸出一致性，即跨語言版本仍保持視覺與角色統一等。

此外，商業一致性，即文字可用、不變形，商品與Logo（品牌標志）穩定等也同樣重要。視頻生成高度一致性的保持，是決定AI視頻是否可以實現“直接交付”的關鍵。

每經記者將此前實測可靈AI 2.6模型時使用的同一提示詞——“《瘋狂動物城》里的兔子朱迪和狐貍尼克，正在跳雙人華爾茲的舞蹈，場景在水晶王宮的舞會上，添加其他舞會成員”輸入至3.0模型進行了對比測試。結果發現，3.0模型在一致性提升方面相對明顯。

圖片來源：可靈AI 3.0功能實測截圖

首先是人物主體的一致性。記者發現，3.0模型在快速動作時主體沒有崩壞痕跡；其次是風格與場景一致性，2.6模型在補充“其他舞會成員”時模糊處理了場景、風格，而3.0模型則相對保持風格一致。此外，兩款模型在語義理解上差異明顯，3.0模型生成的主體人物更接近描述要求。同時，3.0模型的智能分鏡功能可以為靜態提示詞補充分鏡設計，讓視頻更具看點和觀感。在多角色表現上，3.0模型能讓角色在完成動作的同時，保持語音情緒、音色準確以及風格的相對統一。

圖片來源：可靈AI 3.0功能實測截圖

整體而言，在3.0體系下，“一致性”已從“主體不崩壞”升級為“角色、表演、語音、敘事邏輯的跨模態統一”。這使得從創意到成品的視頻生成流程變得相對省時省力，尤其適用于需要強表現力的交付場景等。對于普通C端（消費者）用戶而言，能夠快速獲得觀感良好的視頻成品，體驗感明顯提升。

對于一致性的提升，可靈AI方面告訴記者，可靈AI 3.0 是“ All-in-One”的多模態視頻模型，即通過一個模型實現文字、圖片、聲音、視頻等多模態信息的輸入與輸出。“All-in-One”并非功能堆疊，而是通過一體化模型實現更為原生的多模態交互。

值得一提的是，從字節視頻模型Seedance2.0的測評效果，馮驥在微博中也提及：“AI理解多模態信息（文、畫、影、音）并整合的能力完成了一次飛躍，令人驚嘆。”

普通用戶使用門檻依然較高

整體實測下來記者發現，對于普通C端用戶而言，這個從靜態概念到動態影片的視頻創作流程仍需相對專業的操作，使用起來有一定的門檻。特別是在利用3.0 Omni對內容進行修改時，若提示詞輸入不夠專業，視頻往往需要反復抽卡。

每經記者用國產大模型DeepSeek生成了一個復雜提示詞，實測整個視頻生成的場景推演流程。

第一步：用“圖片3.0”完成構思。利用其“強化影視級敘事畫面”和“4K輸出”能力，生成一張電影級角色設定圖或場景氛圍圖。

圖片來源：可靈AI 3.0功能實測截圖

第二步：用“視頻3.0”實現動態化。將上圖作為“圖生視頻+主體參考”輸入，通過“自定義分鏡”功能精確規劃每個鏡頭的時長、景別，生成一段有敘事節奏的動態視頻。

圖片來源：可靈AI 3.0功能實測截圖

第三步：用“視頻3.0 Omni”進行替換與精修。將原生成視頻中的數字角色，替換成此前測試一致性時所用提示詞中的《瘋狂動物城》朱迪這個主體。

從視頻生成效果來看，3.0模型在“主體相似度更穩定”“對文本指令響應更靈敏”上有進步，復雜敘事的可控性也有一定提升。

圖片來源：可靈AI 3.0功能實測截圖

綜合來看，3.0系列這一升級更偏向可靈AI當前主要的P端（指自媒體視頻創作者和廣告營銷從業者等專業用戶）用戶或專業團隊，普通C端用戶很難完整執行這個創作流程。對于個人創作者、小團隊而言，它將傳統流程上需要多個軟件、反復導入導出的“概念設計—預演—實拍合成”環節壓縮在單一平臺內，一定程度上降低了實驗成本等。

貼近C端市場才是可靈AI的大考

近段時間，多家國產大模型廠商幾乎同步更新模型進展。阿里千問、DeepSeek與月之暗面Kimi紛紛下場參賽。從此次各家更新方向來看，大模型的能力進階以及市場競爭的焦點，已然跳出了單純比拼參數與輸出表現的階段，邁向了工程化階段。

但與大語言模型有所不同，視頻生成模型在C端用戶特別是國內用戶的日常使用場景中相對低頻，且天然具備更高使用門檻，可靈想要與阿里千問、騰訊元寶以及字節跳動豆包等搶食C端市場蛋糕，難度更大。

對于普通用戶而言，使用全新可靈AI 3.0模型生成一次高質量的3秒到15秒視頻，需要耗費36至180“靈感值”（可靈AI貨幣），其在C端的普及度現階段依舊很難與免費的大語言模型抗衡。

隨著OpenAI正式發布第二代AI視頻生成模型Sora 2，并將視頻生成與社交互動深度融合，C端消費級應用的落地進程明顯加快。2025年12月，阿里千問App（應用程序）第一時間接入了萬相2.6視覺大模型，全力對標Sora 2。記者了解到，萬相2.6支持音畫同步、多鏡頭生成及聲音驅動等功能，號稱“全球功能最全的視頻生成模型”。

快手科技創始人兼首席執行官程一笑在2025年三季度財報電話會上指出，“當前我們的主要精力依然是面向專業創作者，但未來也會將可靈的技術能力進一步產品化，與社交互動結合，加速C端應用的商業化”。從目前情況來看，上述產品化思路尚未落地兌現，可靈AI仍聚焦于模型能力的進化迭代。

事實上，2025年年底，豆包已開始向抖音商城導流——當用戶詢問選購意見時，豆包會直接推薦商品并附上來自抖音商城的購買鏈接。由此可見，可靈AI的產品化以及與整個快手生態的聯動可能會變得更加緊迫。新的一年，可靈AI還要持續面對來自阿里、字節等國內科技大廠的輪番轟炸式“襲擊”，快手只能既快又穩。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.