<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      又一國(guó)產(chǎn)全模態(tài)視頻大模型殺入Artificial Analysis榜單Top 2

      0
      分享至



      編輯|Panda、冷貓

      1895 年,盧米埃爾兄弟的無(wú)聲電影《火車(chē)進(jìn)站》曾讓觀眾驚嘆甚至驚慌失措 ;而直到 1927 年,當(dāng)電影《爵士歌手》讓演員的聲音與嘴唇動(dòng)作同步時(shí),電影這項(xiàng)藝術(shù)才算真正「活」了過(guò)來(lái) 。

      爵士歌手片段,1927 年

      在人類(lèi)的感知中,視覺(jué)提供空間結(jié)構(gòu)與構(gòu)圖語(yǔ)境,聽(tīng)覺(jué)則傳遞著時(shí)間節(jié)奏、情感紋理與敘事的連貫性。如今的 AI 視頻大模型領(lǐng)域,也正在經(jīng)歷一場(chǎng)從單模態(tài)視覺(jué)合成向音視頻聯(lián)合生成的決定性范式轉(zhuǎn)變。

      2026 年 2 月 27 日,昆侖天工正式發(fā)布多模態(tài)視頻基礎(chǔ)模型SkyReels-V4。該模型支持最高 1080p 分辨率、32 FPS 幀率、最長(zhǎng) 15 秒的電影級(jí)畫(huà)質(zhì)輸出,實(shí)現(xiàn)了音頻與畫(huà)面精準(zhǔn)同步,并可全面覆蓋從創(chuàng)意構(gòu)思到精細(xì)修輯的一站式視頻創(chuàng)作工作流。



      根據(jù)獨(dú)立分析機(jī)構(gòu) Artificial Analysis 最新公布的標(biāo)準(zhǔn)化測(cè)試結(jié)果,SkyReels-V4 在文本生成視頻 T2V(含音頻)的現(xiàn)役模型榜單中取得全球第 2的成績(jī),并在全球歷史所有 T2V 模型總榜中位列第 4。成績(jī)超過(guò)了 Veo 3.1、Sora 2、Vidu Q3 以及 Wan 2.6 等當(dāng)前主流模型。





      榜單地址:https://artificialanalysis.ai/video/leaderboard/text-to-video?audio-output=true&include-non-current=true

      空口無(wú)憑,我們不妨直接看效果。以冬奧會(huì)為契機(jī)的冰雪運(yùn)動(dòng)依然熱度不減,下面這段由 SkyReels-V4 生成的滑雪視頻,直觀展示了其在復(fù)雜場(chǎng)景下的生成實(shí)力:

      文本生成視頻(T2V),簡(jiǎn)版提示詞:電影級(jí)質(zhì)感開(kāi)場(chǎng):中遠(yuǎn)景中,@Actor-1 身穿亮橙色滑雪服、黑色頭盔與橙黃雪鏡,在雪脊上騰躍,遠(yuǎn)處雪峰與藍(lán)天鋪陳背景。鏡頭切至低角度跟拍:他在陡坡深雪中 carving,雪霧翻飛;中景展現(xiàn)壓低姿態(tài)控板,遠(yuǎn)景鋪開(kāi)遼闊山谷??焖偌糨嫶┎逄貙?xiě)與廣角:急轉(zhuǎn)彎時(shí)雪粒飛濺,側(cè)向橫切雪坡掠過(guò)松林,騰空跳躍與層疊山脊形成戲劇構(gòu)圖。最后側(cè)后跟拍特寫(xiě),毛皮飾邊隨風(fēng)揚(yáng)起,手套緊握雪杖,雪沫炸裂。畫(huà)面定格在夕陽(yáng)下,@Actor-1 滑向坡底。

      這個(gè)視頻是 SkyReels-V4 基于純文本提示詞生成的,其中展現(xiàn)出了模型對(duì)高度復(fù)雜的多鏡頭敘事指令的驚人理解力。從低角度跟拍到遠(yuǎn)景橫切,再到雪沫飛濺的動(dòng)態(tài)特寫(xiě),SkyReels-V4 完美扛住了極高頻的鏡頭調(diào)度。它不僅保持了人物主體和場(chǎng)景在多重機(jī)位切換下的高度一致性,更將提示詞中要求的「電影級(jí)質(zhì)感」與物理運(yùn)動(dòng)學(xué)特征呈現(xiàn)得淋漓盡致。

      如果說(shuō)復(fù)雜的鏡頭調(diào)度是對(duì)視覺(jué)能力的考驗(yàn),那么下面這個(gè)「關(guān)公戰(zhàn)秦瓊」視頻,則直觀展示了其原生音視頻同步生成的硬實(shí)力:

      圖像生成視頻(I2V),提示詞:史詩(shī)級(jí)電影鏡頭,@Actor-0 與 @Actor-1 在一片雷鳴交加的荒蕪之地中對(duì)峙。@Actor-0 橫刀向前,怒喝道:「來(lái)者何人,竟敢擋我去路?!」@Actor-1 高舉雙锏,厲聲回吼:「大唐秦叔寶,看锏!」吼聲在荒野中回蕩。瞬間兩人沖鋒,刀锏相撞,火星四濺。動(dòng)態(tài)動(dòng)作,激烈的決斗,周?chē)鸁焿m旋繞,高對(duì)比度光線,慢動(dòng)作,體積光,史詩(shī)氛圍,特寫(xiě)他們嘴唇翕動(dòng)和兇狠表情。

      這段視頻的初始提示包括兩張人物圖像和一段文本??梢钥吹?,在這個(gè)充滿(mǎn)張力的橋段里,模型做到了音畫(huà)維度的深度咬合。兵器相撞的清脆音效與火星四濺的視覺(jué)反饋嚴(yán)絲合縫;更難得的是,在特寫(xiě)鏡頭下,人物高亢激烈的臺(tái)詞發(fā)音與嘴唇肌肉的翕動(dòng)完美對(duì)齊。這種原生的視聽(tīng)耦合能力,讓數(shù)字生成的角色具備了真實(shí)的生命力。

      SkyReels-V4 也能生成高質(zhì)量的豎屏短視頻:

      I2V,同樣使用了兩張人物圖像和一段文本,簡(jiǎn)版提示詞:短劇風(fēng)格,奢華室內(nèi)場(chǎng)景。#Role_1 近景,神情隱憂。切至 #Role_2 接電話,語(yǔ)氣堅(jiān)定:「我說(shuō)我現(xiàn)在回來(lái)。好?!勾髲d遠(yuǎn)景,兩人對(duì)立而站。#Role_2 放下手機(jī),中近景說(shuō)道:「那我讓二妹過(guò)來(lái),讓她送你回去?!狗创?#Role_1,輕搖頭回應(yīng):「不用,不用這么麻煩?!够氐?#Role_2,伸手欲觸她肩,語(yǔ)氣堅(jiān)決,背景響起低沉緊張氛圍音樂(lè):「不行?!?/p>

      在這段主打微表情與對(duì)白交互的文戲片段中,模型展現(xiàn)了對(duì)內(nèi)斂情感與視聽(tīng)同步的精準(zhǔn)控制力。從廣角全景的空間調(diào)度到逆向機(jī)位的特寫(xiě)反打,鏡頭的連貫性得到了極好維持。更值得探究的是其在中文語(yǔ)境下的聲畫(huà)耦合表現(xiàn),當(dāng)角色講出「那我讓二妹過(guò)來(lái),讓她送你回去」與輕聲婉拒的「不用,不用這么麻煩」時(shí),不僅中文口型咬字準(zhǔn)確無(wú)誤,連同眉頭微蹙、眼神錯(cuò)愕等細(xì)微的面部肌肉調(diào)度,也與臺(tái)詞的重音及情緒起伏高度對(duì)齊。伴隨著底層富有律動(dòng)感的低音懸疑配樂(lè)適時(shí)切入,系統(tǒng)將一段日常的對(duì)話拉扯,渲染出了極具沉浸感的戲劇張力??雌饋?lái),SkyReels-V4 有望成為短劇制作者們的得力工具。當(dāng)然,看得出來(lái),SkyReels-V4 在生成畫(huà)面中的文字方面還有待提升。

      不僅如此,SkyReels-V4 甚至還能編輯視頻,比如我們可以輸入一張圖像、一段視頻和一段簡(jiǎn)單指令,讓北極狼跳起邁克爾?杰克遜標(biāo)志性的捂襠動(dòng)作。



      視頻編輯,提示詞:Replace the dancer in the middle of the stage in @video_1 with the wolf from @image_1, ensuring consistent movements.

      目測(cè),要火。

      從上面幾個(gè) demo 可以看到,SkyReels-V4 支持文本、圖像、視頻等多種模態(tài)的輸入。要知道,在當(dāng)前的視頻生成生態(tài)中,主流系統(tǒng)普遍存在模態(tài)割裂與功能分散的痛點(diǎn)。SkyReels-V4 成功實(shí)現(xiàn)了突圍,成為了全球首個(gè)同時(shí)支持多模態(tài)輸入、聯(lián)合音視頻生成以及統(tǒng)一生成與編輯任務(wù)的視頻基礎(chǔ)模型

      該模型主打「全模態(tài)參考」的核心優(yōu)勢(shì),能夠無(wú)縫接收文本、圖像、視頻片段、掩碼以及音頻參考等豐富指令。

      這意味著,創(chuàng)作者無(wú)需在多個(gè)工具間繁瑣切換,即可在單一網(wǎng)絡(luò)內(nèi)完成從創(chuàng)意構(gòu)思到專(zhuān)業(yè)級(jí)音視頻同步輸出的端到端創(chuàng)作。



      • 技術(shù)報(bào)告:SkyReels-V4: Multi-modal Video-Audio Generation, Inpainting and Editing model
      • 報(bào)告地址:https://arxiv.org/abs/2602.21818

      三大核心突破,讓 AI 能畫(huà)也能說(shuō)

      現(xiàn)階段的 AI 視頻大模型往往像是一個(gè)偏科的優(yōu)等生。它們大多擅長(zhǎng)畫(huà)面生成,但如果在生成畫(huà)面的同時(shí)還要配上同步的聲音,往往就會(huì)顯得力不從心。這種淺層的技術(shù)縫合往往會(huì)導(dǎo)致畫(huà)面里的人口型對(duì)不上,或者音效比動(dòng)作慢半拍。

      針對(duì)這個(gè)行業(yè)通病,昆侖天工團(tuán)隊(duì)在底層架構(gòu)上進(jìn)行了大刀闊斧的改進(jìn)。



      新提出的方法概覽

      讓音視頻成為「雙胞胎」:雙流 MMDiT 架構(gòu)與混合注意力

      SkyReels-V4 采用了一種對(duì)稱(chēng)的雙流架構(gòu),如上圖左側(cè)所示。

      你可以把它想象成一對(duì)雙胞胎,視頻分支和音頻分支擁有各自的獨(dú)立通道,但共享著同一個(gè)基于 MMLM 的「大腦」來(lái)處理文本輸入。

      為了平衡模態(tài)對(duì)齊與參數(shù)效率,這套架構(gòu)包含了混合的雙流與單流處理模塊。在前 M 層中,視頻和音頻保留各自獨(dú)立的參數(shù)空間(如層歸一化和 MLP 等),但通過(guò)聯(lián)合自注意力機(jī)制進(jìn)行交互 ;而在隨后的 N 層里,模型會(huì)切換到單流架構(gòu),使用共享參數(shù)以提高計(jì)算效率。

      在整個(gè)生成過(guò)程中,這兩個(gè)分支還會(huì)通過(guò)雙向跨注意力機(jī)制不斷地「交換眼神」。音頻流會(huì)關(guān)注視頻特征,視頻流也會(huì)反向關(guān)注音頻特征,從而在特征層面上實(shí)現(xiàn)了真正的咬合與同步。

      現(xiàn)在,雖然架構(gòu)對(duì)稱(chēng)了,但還有一個(gè)問(wèn)題:音視頻天生的時(shí)間流速也完全不同。打個(gè)比方,同樣生成 5 秒的內(nèi)容,視頻潛變量跨越 21 幀,但音頻潛變量卻包含著高達(dá) 218 個(gè)特征 token (相當(dāng)于 44.1 kHz )。

      為了解決這種時(shí)間尺度的錯(cuò)位,昆侖天工團(tuán)隊(duì)引入了RoPE 旋轉(zhuǎn)位置編碼頻率縮放技術(shù)

      他們將音頻的 RoPE 頻率按照 21 與 218 的比值(約等于 0.09633 )進(jìn)行了專(zhuān)門(mén)調(diào)整,使其與視頻較粗的時(shí)間分辨率相匹配。此外,為了區(qū)分輸入條件和生成目標(biāo),模型還采用了帶偏移的 3D RoPE ,為條件潛變量賦予負(fù)數(shù)的時(shí)間索引。

      這種底層的數(shù)學(xué)對(duì)齊可確保兩個(gè)模態(tài)能夠按照相同的時(shí)間節(jié)奏去相互關(guān)注,徹底治好了 AI 視頻長(zhǎng)期以來(lái)的音畫(huà)不同步頑疾。

      把所有復(fù)雜編輯變成一道「填空題」:通道拼接統(tǒng)一框架

      為了處理繁雜的編輯操作,系統(tǒng)將帶有噪聲的視頻潛變量、VAE 編碼的條件幀以及二進(jìn)制掩碼在通道維度上直接拼接起來(lái)。

      于是,一切都被簡(jiǎn)化為特定掩碼配置下的修復(fù)問(wèn)題。

      例如,如果掩碼全為 0 ,意味著讓模型從頭生成視頻,即文本到視頻(T2V)任務(wù) ;如果僅第一幀的掩碼為 1 ,那就是讓模型依據(jù)首幀向下續(xù)寫(xiě),即圖像到視頻(I2V)任務(wù)。當(dāng)然,也可以通過(guò)讓前 k 幀的掩碼為 1 來(lái)實(shí)現(xiàn)視頻擴(kuò)展,或讓需要編輯的區(qū)域的掩碼為 0 來(lái)實(shí)現(xiàn)視頻編輯。



      據(jù)介紹,通過(guò)調(diào)整時(shí)空掩碼的參數(shù),局部重繪、主體替換甚至是復(fù)雜的元素消除都可以被無(wú)縫覆蓋。

      比如在下面的例子中,一段簡(jiǎn)單指令就移除了畫(huà)面中兩位指定的角色:



      原視頻



      移除了其中兩位角色后的視頻,提示詞:Remove the young man with short blond hair holding a flashlight on the far right and the woman with long, wavy blonde hair in a dark purple top in @video_1.

      憑此能力,SkyReels-V4 也可成為一個(gè)去水印或字幕的利器:



      視頻去字幕演示,左為原視頻,右為處理后的視頻,提示詞:Remove the subtitles in @video_1.

      更巧妙的是,在處理這類(lèi)視覺(jué)修復(fù)任務(wù)時(shí),音頻分支還可以根據(jù)修改后的視頻內(nèi)容從零開(kāi)始生成聲音,確保修改后的視覺(jué)和聽(tīng)覺(jué)始終保持邏輯一致。

      先起草再精修:引入 VSA 稀疏注意力的超分降本策略

      生成 1080p 分辨率、 32 FPS 幀率以及 15 秒時(shí)長(zhǎng)的視頻對(duì)算力的消耗是驚人的。

      昆侖天工團(tuán)隊(duì)設(shè)計(jì)了聯(lián)合生成低分辨率全序列與高分辨率關(guān)鍵幀的高效機(jī)制:系統(tǒng)先快速打好草稿,隨后再交由專(zhuān)用的超分辨率和幀插值模塊來(lái)補(bǔ)充細(xì)節(jié)。



      視頻超分辨率與幀插值方法的流程。F 表示基礎(chǔ)模型的輸出隱含表示,KF 表示基礎(chǔ)模型的關(guān)鍵幀隱含表示。

      這中間最硬核的提效手段是引入了可訓(xùn)練的視頻稀疏注意力機(jī)制(VSA)



      VSA 架構(gòu)概覽,來(lái)自 arXiv:2505.13389

      VSA 通過(guò)兩階段分層處理,先粗略聚合時(shí)空塊找到關(guān)鍵區(qū)域,然后再對(duì)這些 top-K 的關(guān)鍵塊進(jìn)行密集的注意力計(jì)算。這套方案能在保證畫(huà)質(zhì)不降低的前提下,將注意力計(jì)算成本降低約 3 倍!

      當(dāng)然,龐大的視頻基礎(chǔ)模型需要一套嚴(yán)謹(jǐn)?shù)膶W(xué)習(xí)路徑,昆侖天工團(tuán)隊(duì)為此采用了一種多階段的漸進(jìn)式訓(xùn)練范式

      為了讓模型穩(wěn)步掌握空間概念與時(shí)間動(dòng)態(tài),整個(gè)訓(xùn)練過(guò)程被拆解為多個(gè)明確的階段。

      在最初的階段,模型先從基礎(chǔ)的 256px 文本到圖像預(yù)訓(xùn)練開(kāi)始,這一階段使用了 30 億張圖像,專(zhuān)門(mén)用于打好空間構(gòu)圖和語(yǔ)義理解的底子。隨后模型開(kāi)始引入基礎(chǔ)的視頻片段,并在后續(xù)的訓(xùn)練中逐步擴(kuò)展到 480px、720px 以及 1080px 的多分辨率混合訓(xùn)練。在最后的有監(jiān)督微調(diào)階段,該團(tuán)隊(duì)使用了 500 萬(wàn)條多模態(tài)視頻數(shù)據(jù),并疊加了 100 萬(wàn)條經(jīng)過(guò)人工精選的高質(zhì)量視頻進(jìn)行最終打磨。



      所有階段的完整訓(xùn)練規(guī)劃。這種漸進(jìn)策略會(huì)逐步提高分辨率、時(shí)間長(zhǎng)度和任務(wù)復(fù)雜度。

      正是這種精細(xì)的策略,最終促成了模型在視覺(jué)質(zhì)量、運(yùn)動(dòng)流暢度以及聲音自然度上的全面飛躍。

      全場(chǎng)景?全流程?全模態(tài)

      過(guò)去的視頻模型更偏向「單點(diǎn)生成」。

      這是比較好理解的。輸入一句提示詞,輸出一段畫(huà)面?;蛘呋谝粡垐D就能夠延展出幾秒視頻。生成、編輯、修復(fù)、配音往往分散在不同工具中,音頻多為后期疊加,創(chuàng)作流程也被拆分成多個(gè)階段。

      雖然說(shuō)模型能力在不斷提升,也能生成一些讓人眼前一亮的效果,但這距離 AI 視頻生成向真正能用好用的內(nèi)容創(chuàng)作工具的轉(zhuǎn)變?nèi)匀挥幸欢尉嚯x。

      真正讓人震撼的是「整合」,是把文本、圖像、視頻片段、音頻參考整合進(jìn)同一生成體系的能力。也就是 SkyReels-V4 所強(qiáng)調(diào)的「全模態(tài)參考」,是多模態(tài)信息在底層架構(gòu)中的協(xié)同。

      柴可夫斯基和《魔獸世界》吉安娜共跳愛(ài)樂(lè)之城,基于兩張圖像和一段視頻的視頻編輯,提示詞:Replace the skirt-wearing woman on the left in @video_1 with the man from @image_1, and replace the white-shirt-wearing man on the right in @video_1 with the woman from @image_2, ensuring consistent movements.

      音頻與視頻在擴(kuò)散過(guò)程中同步生成,多種參考條件在同一時(shí)空框架內(nèi)共同作用,各種生成任務(wù)被統(tǒng)一進(jìn)一套計(jì)算邏輯中

      創(chuàng)作者因此擁有更高的控制精度。人物形象可以保持,動(dòng)作可以遷移,音色能夠復(fù)刻,局部區(qū)域可定向修改,整體風(fēng)格可以調(diào)整,這些控制條件可以在一次生成過(guò)程中同時(shí)發(fā)揮作用。視頻生產(chǎn)從一次性輸出,轉(zhuǎn)向可控、可迭代的創(chuàng)作流程。

      這種架構(gòu)帶來(lái)的直接結(jié)果,是創(chuàng)作過(guò)程的連續(xù)性提升。創(chuàng)作者可以基于參考圖像鎖定人物外觀,利用參考視頻遷移動(dòng)作,通過(guò)音頻樣本保持音色與情緒表達(dá),同時(shí)對(duì)局部區(qū)域進(jìn)行精細(xì)修改。1080p、32FPS、15 秒輸出規(guī)格,使這些控制能力具備實(shí)際生產(chǎn)價(jià)值。音視頻在生成階段深度協(xié)同,減少后期補(bǔ)償環(huán)節(jié),提升整體一致性。

      SkyReels-V4 就像一把瑞士軍刀,真正打造了一個(gè)能夠覆蓋全場(chǎng)景,全流程,全模態(tài)的生成工具。

      還記得 Seedance 2.0 發(fā)布,初步讓創(chuàng)作者感受到了全模態(tài)「整合」的意義。影視颶風(fēng) Tim 在視頻里對(duì)全模態(tài)整合的生成模型這樣評(píng)價(jià):

      「這不是一個(gè)小的技術(shù)革新,這是一個(gè)會(huì)推走行業(yè)所有過(guò)去流程和沉淀的一個(gè)海嘯,我就會(huì)這么形容它。」

      而 SkyReels-V4 的發(fā)布,標(biāo)志著 AI 視頻生成技術(shù)從 「單一功能合成」 進(jìn)入 「全流程一體化創(chuàng)作」 的新階段

      開(kāi)啟創(chuàng)作「全棧時(shí)代」

      以 Tim 為代表的創(chuàng)作者們很焦慮,似乎「越努力做越比不過(guò) AI 的進(jìn)步速度,以前學(xué)的東西越?jīng)]有價(jià)值」。

      這種焦慮其實(shí)并不必要。過(guò)去我們圍繞「素材」進(jìn)行剪輯,如今開(kāi)始圍繞「語(yǔ)義」和「意圖」進(jìn)行調(diào)度與生成。模型不再只是執(zhí)行指令的工具,而逐漸成為理解創(chuàng)作結(jié)構(gòu)、參與創(chuàng)作決策的系統(tǒng)。

      AI 生成模型愈發(fā)整合,正是行業(yè)擴(kuò)展的強(qiáng)大工具箱,形成覆蓋創(chuàng)意輸入到成片輸出的完整鏈路,而創(chuàng)作者永遠(yuǎn)是調(diào)用工具的舵手。

      在 Seedance 2.0 給行業(yè)展示了多模態(tài)整合生成的潛力后,產(chǎn)品進(jìn)入了一個(gè)風(fēng)控收緊的階段。SkyReels-V4 正是在這個(gè)時(shí)間節(jié)點(diǎn)推出,憑借多模態(tài)理解和視聽(tīng)同步生成的底層突破,深刻重塑了內(nèi)容生產(chǎn)的工作流,為尋求替代方案的專(zhuān)業(yè)用戶(hù)提供了極具競(jìng)爭(zhēng)力的選擇。

      放眼整個(gè)昆侖天工 AI 生態(tài),底層大模型與前端產(chǎn)品正在形成緊密的雙向驅(qū)動(dòng),構(gòu)建起一個(gè)相輔相成的繁榮生態(tài)。目前,昆侖天工已確立了四大模型家族:Skywork 系列大模型、Mureka 音樂(lè)音頻模型、SkyReels 視頻大模型和 Matrix Game 游戲世界模型。

      在這個(gè)矩陣之中,技術(shù)基座與應(yīng)用場(chǎng)景已經(jīng)實(shí)現(xiàn)了深度融合。一方面,Skywork 系列文本大模型與多模態(tài) Skywork R1V 系列等、音樂(lè)生成模型 Mureka V8 等前沿基座,為天工超級(jí)智能體(Skywork Super Agents)、AI 音樂(lè)創(chuàng)作平臺(tái) Mureka、AI 社交 Linky 和 AI 游戲「貓森學(xué)園」等業(yè)務(wù)提供了強(qiáng)大的底層引擎;另一方面,這些高頻活躍的前端產(chǎn)品也在不斷拓展技術(shù)的落地邊界,以真實(shí)的交互需求反哺大模型的持續(xù)進(jìn)化。

      新發(fā)布的 SkyReels-V4 填補(bǔ)了這一生態(tài)在全模態(tài)視聽(tīng)內(nèi)容生產(chǎn)上的關(guān)鍵拼圖。這種模型賦能產(chǎn)品、產(chǎn)品滋養(yǎng)模型的生態(tài)閉環(huán),將實(shí)質(zhì)性地打通廣告與影視等產(chǎn)業(yè)的商業(yè)鏈路,把內(nèi)容創(chuàng)作的廣闊想象落到實(shí)處。

      未來(lái),SkyReels-V4 將支持 60 秒以上的視頻生成、實(shí)時(shí)交互編輯,并開(kāi)放 API 與全系產(chǎn)品協(xié)同。隨著這一模型工具的迭代進(jìn)化,內(nèi)容生產(chǎn)也將進(jìn)入一個(gè)全新的工業(yè)化的「全棧時(shí)代」

      文中視頻鏈接:https://mp.weixin.qq.com/s/bEi9bIHN0z8ebB89Pei5eQ

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      曝伊朗已悄悄聯(lián)系美國(guó),希望進(jìn)行談判以結(jié)束戰(zhàn)爭(zhēng),特朗普:太晚了

      曝伊朗已悄悄聯(lián)系美國(guó),希望進(jìn)行談判以結(jié)束戰(zhàn)爭(zhēng),特朗普:太晚了

      爆角追蹤
      2026-03-04 21:23:12
      彈藥告急?美對(duì)伊空襲能撐多久

      彈藥告急?美對(duì)伊空襲能撐多久

      環(huán)球時(shí)報(bào)國(guó)際
      2026-03-05 14:00:59
      被記者圍堵引怒贊的霍啟剛,徹底顛覆了大眾對(duì)豪門(mén)二代的固有認(rèn)知

      被記者圍堵引怒贊的霍啟剛,徹底顛覆了大眾對(duì)豪門(mén)二代的固有認(rèn)知

      以茶帶書(shū)
      2026-03-05 15:45:45
      山姆1.38公斤冰塊賣(mài)37.9元,消費(fèi)者稱(chēng)比冰塊融化速度慢,而且顏值高,門(mén)店工作人員:銷(xiāo)量不錯(cuò),現(xiàn)貨極少

      山姆1.38公斤冰塊賣(mài)37.9元,消費(fèi)者稱(chēng)比冰塊融化速度慢,而且顏值高,門(mén)店工作人員:銷(xiāo)量不錯(cuò),現(xiàn)貨極少

      觀威海
      2026-03-04 10:39:05
      百名美軍陣亡,美防長(zhǎng)高興早了:二炸卡塔爾雷達(dá),伊朗亮劍殺手锏

      百名美軍陣亡,美防長(zhǎng)高興早了:二炸卡塔爾雷達(dá),伊朗亮劍殺手锏

      頭條爆料007
      2026-03-05 10:59:38
      爭(zhēng)奪霍爾木茲海峽,都拼了,但……

      爭(zhēng)奪霍爾木茲海峽,都拼了,但……

      新民周刊
      2026-03-05 09:10:56
      從三冠王看奧迪 E5 Sportback:一場(chǎng)設(shè)計(jì)、智能與駕控的全面進(jìn)階

      從三冠王看奧迪 E5 Sportback:一場(chǎng)設(shè)計(jì)、智能與駕控的全面進(jìn)階

      汽車(chē)維基
      2026-02-27 21:54:24
      告訴大家一個(gè)壞消息:深圳、杭州已出現(xiàn)4大怪象,值得每個(gè)人深思

      告訴大家一個(gè)壞消息:深圳、杭州已出現(xiàn)4大怪象,值得每個(gè)人深思

      北緯的咖啡豆
      2026-03-05 15:33:27
      民用北斗被干擾了?中國(guó)船員稱(chēng)所有系統(tǒng)全都失效,只能用傳統(tǒng)手段

      民用北斗被干擾了?中國(guó)船員稱(chēng)所有系統(tǒng)全都失效,只能用傳統(tǒng)手段

      南權(quán)先生
      2026-03-05 15:22:09
      網(wǎng)傳以色列F-15斬首哈梅內(nèi)伊細(xì)節(jié)曝光:導(dǎo)彈先出大氣層,以5倍音速垂直打擊

      網(wǎng)傳以色列F-15斬首哈梅內(nèi)伊細(xì)節(jié)曝光:導(dǎo)彈先出大氣層,以5倍音速垂直打擊

      回旋鏢
      2026-03-04 21:36:17
      又一閆學(xué)晶浮現(xiàn)!過(guò)氣女星直播哭窮,每月開(kāi)銷(xiāo)6位數(shù),仍然不滿(mǎn)足

      又一閆學(xué)晶浮現(xiàn)!過(guò)氣女星直播哭窮,每月開(kāi)銷(xiāo)6位數(shù),仍然不滿(mǎn)足

      潮鹿逐夢(mèng)
      2026-03-05 15:23:41
      代表建議:70歲以上農(nóng)民基礎(chǔ)養(yǎng)老金提高到500元

      代表建議:70歲以上農(nóng)民基礎(chǔ)養(yǎng)老金提高到500元

      看看新聞Knews
      2026-03-05 11:06:08
      伊朗官員:美國(guó)媒體在撒謊!伊朗沒(méi)有向美國(guó)發(fā)送任何信息

      伊朗官員:美國(guó)媒體在撒謊!伊朗沒(méi)有向美國(guó)發(fā)送任何信息

      西游日記
      2026-03-05 14:03:18
      日本政府緊張研判:派自衛(wèi)隊(duì)去霍爾木茲海峽

      日本政府緊張研判:派自衛(wèi)隊(duì)去霍爾木茲海峽

      都市快報(bào)橙柿互動(dòng)
      2026-03-05 13:57:55
      伊朗戰(zhàn)事最新發(fā)展及后續(xù)發(fā)展預(yù)測(cè)

      伊朗戰(zhàn)事最新發(fā)展及后續(xù)發(fā)展預(yù)測(cè)

      劉耘博士
      2026-03-05 08:49:29
      47票贊成53票反對(duì)!美國(guó)投票結(jié)果公布,特朗普有3個(gè)沒(méi)想到

      47票贊成53票反對(duì)!美國(guó)投票結(jié)果公布,特朗普有3個(gè)沒(méi)想到

      東極妙嚴(yán)
      2026-03-05 13:01:01
      亂攔亂罰終結(jié)了!國(guó)務(wù)院825號(hào)令生效,除4種情況外交警不得攔車(chē)!

      亂攔亂罰終結(jié)了!國(guó)務(wù)院825號(hào)令生效,除4種情況外交警不得攔車(chē)!

      今朝牛馬
      2026-03-04 22:19:49
      伊朗反擊美國(guó),國(guó)際局勢(shì)大亂,中國(guó)收復(fù)臺(tái)灣的時(shí)機(jī)到了嗎?

      伊朗反擊美國(guó),國(guó)際局勢(shì)大亂,中國(guó)收復(fù)臺(tái)灣的時(shí)機(jī)到了嗎?

      心靈短笛
      2026-03-05 14:16:51
      中央宣傳部命名第十一批全國(guó)崗位學(xué)雷鋒標(biāo)兵

      中央宣傳部命名第十一批全國(guó)崗位學(xué)雷鋒標(biāo)兵

      環(huán)球網(wǎng)資訊
      2026-03-05 11:01:42
      悲壯:伊朗兩架自殺式SU-24轟炸機(jī)在抵達(dá)目標(biāo)2分鐘前被擊落!

      悲壯:伊朗兩架自殺式SU-24轟炸機(jī)在抵達(dá)目標(biāo)2分鐘前被擊落!

      勝研集
      2026-03-05 09:56:41
      2026-03-05 18:56:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專(zhuān)業(yè)的人工智能媒體
      12418文章數(shù) 142578關(guān)注度
      往期回顧 全部

      娛樂(lè)要聞

      謝娜下場(chǎng)撕薛之謙,張杰前女友爆猛料

      頭條要聞

      俄外長(zhǎng):美以意圖將海灣國(guó)家拖入對(duì)伊朗戰(zhàn)爭(zhēng)

      頭條要聞

      俄外長(zhǎng):美以意圖將海灣國(guó)家拖入對(duì)伊朗戰(zhàn)爭(zhēng)

      體育要聞

      不開(kāi)玩笑,沒(méi)人想在季后賽碰上黃蜂

      財(cái)經(jīng)要聞

      “十五五”開(kāi)局之年,這么干!

      科技要聞

      阿里內(nèi)部郵件回應(yīng):批準(zhǔn)林俊旸辭職

      汽車(chē)要聞

      小鵬第二代VLA如何破解智駕不敢用的技術(shù)困局?

      態(tài)度原創(chuàng)

      教育
      旅游
      時(shí)尚
      數(shù)碼
      親子

      教育要聞

      青島長(zhǎng)沙路小學(xué):以“馬”為序,策馬奔赴新學(xué)期

      旅游要聞

      即日起,王城公園、隋唐城遺址植物園恢復(fù)免費(fèi)開(kāi)放

      打底衫,條紋的最適合春天!

      數(shù)碼要聞

      海信UX 2026款RGB-Mini LED旗艦電視發(fā)布,頂配價(jià)格超十萬(wàn)元

      親子要聞

      深度長(zhǎng)文:嬰兒哭聲可能招來(lái)野獸,原始人是如何生存下來(lái)的?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版