2026年開年,字節跳動內測的AI視頻模型Seedance2.0意外引爆全球關注,其“文本生成多鏡頭電影級視頻”的能力被業界稱為“導演級AI”。2月10日開盤,中文在線42.32元的股價較前一日收盤時上漲20%,閱文40.08港元的開盤價較前一日的收盤價上漲6%,掌閱科技股價再度出現10%漲幅。
這股熱潮并非孤例。海外,OpenAI的Sora、Runway的Gen-3持續迭代;國內,快手“可靈”、生數科技“Vidu”、Mini-Max“Hailuo”等競品亦在長視頻、主體一致性等賽道激烈角逐。然而,當AI僅憑一張照片就能“復刻”聲音與未見場景時,數據合規與版權邊界問題也隨之浮出水面。
![]()
“對物理規則的遵循”
“當前地表最強的視頻生成模型”試用Seedance2.0模型后,游戲科學CEO、《黑神話:悟空》制作人馮驥發布數百字評論,并稱其標志著“AIGC(人工智能生成內容)的童年時代結束”。
在海外社交媒體上,AI影視創意內容領域最為活躍的創作者之一“el.cine”坦言,Seedance2.0是目前唯一讓他產生強烈危機感的AI模型。
何為Seedance2.0?Seedance2.0是字節跳動推出的新一代AI視頻生成模型,從2月7日開始小范圍內測。該模型主打多模態參考與高效創作能力。模型支持首尾幀、視頻片段及音頻綜合參考,能精準復刻運鏡邏輯、動作細節與音樂氛圍,核心突破在于將AI生成與后期編輯融合,用戶可直接修改不滿意部分。Seedance2.0模型在復雜敘事、打斗鏡頭、短劇生成等場景表現優異,能自動生成適配的背景音樂與音效,支持多種語言和指定歌曲歌詞輸入。
以馮驥提到的AI理解多模態信息為例,Seedance2.0支持同時上傳最多12個參考文件(圖片、視頻、音頻),AI自動學習并復刻畫面構圖、角色特征、動作風格、鏡頭語言,不需要復雜提示詞。
開源證券研報則提及了Seedance2.0的自運鏡和分運鏡能力。北京商報記者了解到,Seedance2.0支持分鏡圖直接生成視頻,在多個鏡頭中保持角色一致性、燈光連貫性和風格統一,可制作預告片、故事片等復雜敘事內容。
一位內容制作者體驗后表示,Seedance 2.0的轉場和人物一致性比較驚艷。他告訴北京商報記者,“以前視頻生成模式更多是讓畫面動起來,現在解決了一些細節問題,比如一致性、對物理規則的遵循,這些變化很細微,但體現在畫面上會很明顯”。
還有誰在起飛
另一位制作者站在成本角度觀察視頻生成模型,“一個3秒480P的視頻,大概3毛錢。720P的3秒視頻快1元,視頻模型發展非常快,應該算是除了語言模型外,用量最大的模型了”。
北京商報記者了解到,由于Seedance2.0尚在內測狀態,暫無公開的收費標準。2025年6月,字節跳動推出的Seedance1.0 pro模型每千token 0.01元,每生成一條5秒的1080P視頻3.67元。
“一款全新的人工智能視頻模型Seedance2.0正在中國進行測試,這絕對會讓你大吃一驚。”“el.cine”感慨道,“中國的獨立電影制作人已經開啟了‘瘋狂模式’,開始使用Seedance2.0制作電影。”
這股在創作者端掀起的熱情,與資本市場的活躍形成了情緒共振。
2月9日,A股傳媒板塊應聲大漲,根據金融數據服務商東方財富的統計,文化傳媒板塊當天上漲4.79%,領漲A股所有行業板塊。個股方面,榮信文化、中文在線、海看股份、捷成股份股價收獲漲停板。
“傳媒板塊上漲背后有春節檔預期等多重因素,但Seedance2.0的火爆也為市場注入了新的增長邏輯。”比達分析師李錦清向北京商報記者表示。
2月10日,中文在線繼續漲停,股價收于42.34元,閱文集團收盤股價43.58港元,較前一日收盤價上漲15.4%。
狂歡之下亦有隱憂,有創作者在測試中發現,模型僅憑一張人臉照片,就能生成高度相似的聲音,并“腦補”出從未展示過的場景視角。
對于用戶反饋,字節跳動做出反應。2月9日,即夢創作者社群中,平臺運營人員發布消息稱:“我們正在針對反饋進行緊急優化,Seedance2.0目前暫不支持輸入真人圖片或視頻作為主體參考。”并表示平臺深知創意的邊界是尊重,產品調整后會以更完善的面貌與大家正式見面。
北京航空航天大學人工智能研究院教授沙磊表示:“AI的進步從不會因爭議停下腳步,而如何在技術創新與數據合規、版權保護之間找到平衡?”
“戰國時代”
從OpenAI的Sora到字節跳動的Seedance2.0,全球AI視頻賽道已進入深水區。
僅2026年開年至今,xAI的視頻生成模型Grok Imagin1.0版本全面上線,支持文生視頻、圖生視頻,單次生成時長10秒,分辨率為720P,核心能力主要是視頻生成與視頻剪輯,xAI的老板馬斯克(特斯拉CEO)第一時間轉發了該消息。
生數科技的Vidu Q3強調專為漫劇、短劇、影視劇打造,支持16秒音視頻、音畫同出、多人對話。在國際權威AI基準測試機構Artificial Analysis最新公布的榜單中,Vidu Q3排名中國第一,全球第二,硬剛馬斯克xAI Grok,超越Runway Gen-4.5、Google Veo3.1和OpenAI Sora2。
可靈3.0系列模型是2月初上線的“前輩”,這次快手一口氣發布了可靈視頻3.0、可靈視頻3.0 Omni及可靈圖片3.0、可靈圖片3.0 Omni模型,覆蓋圖片生成、視頻生成、編輯及后期等影視級全流程鏈路,全生產環節切入。
在文淵智庫創始人王超看來,“中國視頻模型和國內同行幾乎同時起步,在Sora之后,OpenAI沒有推出更加驚艷的模型。但中國各個視頻模型的各種能力比海外同行有過之而無不及。中國AI視頻模型獨樹一幟”。
“很難說,哪款視頻模型絕對更強,或海外與國內產品孰強孰劣。”一位從業者告訴北京商報記者,“因為評價標準高度場景化,很多‘最強’評價來自KOL(關鍵意見領袖)主觀體驗或特定案例,不具備普適性,而且企業推出視頻模型的初衷也不一樣。”
“我們布局視頻生成的整體思路是從視頻內容生產逐步邁向世界模型。”Long-Cat-Video模型研究員康卓梁坦白了美團發布視頻生成模型的原因,“我們期望通過視頻生成任務壓縮物理世界知識,為未來內容創作、新型娛樂交互(如數字人)、自動駕駛機器人等場景提供基礎的技術底座。基于這一差異化目標,我們將長視頻生成作為核心方向。”
未來,視頻生成不僅服務于內容創作,更將成為模擬物理世界的重要載體。在這樣的邏輯下,這一賽道的競爭將不再局限于“誰能生成更逼真的畫面”。
北京商報記者 魏蔚
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.