網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

又一國(guó)產(chǎn)全模態(tài)視頻大模型殺入Artificial Analysis榜單Top 2

2026-02-27 14:42:39　來(lái)源: 機(jī)器之心Pro

北京舉報(bào)

分享至

編輯｜Panda、冷貓

1895 年，盧米埃爾兄弟的無(wú)聲電影《火車(chē)進(jìn)站》曾讓觀眾驚嘆甚至驚慌失措；而直到 1927 年，當(dāng)電影《爵士歌手》讓演員的聲音與嘴唇動(dòng)作同步時(shí)，電影這項(xiàng)藝術(shù)才算真正「活」了過(guò)來(lái) 。

爵士歌手片段，1927 年

在人類(lèi)的感知中，視覺(jué)提供空間結(jié)構(gòu)與構(gòu)圖語(yǔ)境，聽(tīng)覺(jué)則傳遞著時(shí)間節(jié)奏、情感紋理與敘事的連貫性。如今的 AI 視頻大模型領(lǐng)域，也正在經(jīng)歷一場(chǎng)從單模態(tài)視覺(jué)合成向音視頻聯(lián)合生成的決定性范式轉(zhuǎn)變。

2026 年 2 月 27 日，昆侖天工正式發(fā)布多模態(tài)視頻基礎(chǔ)模型SkyReels-V4。該模型支持最高 1080p 分辨率、32 FPS 幀率、最長(zhǎng) 15 秒的電影級(jí)畫(huà)質(zhì)輸出，實(shí)現(xiàn)了音頻與畫(huà)面精準(zhǔn)同步，并可全面覆蓋從創(chuàng)意構(gòu)思到精細(xì)修輯的一站式視頻創(chuàng)作工作流。

根據(jù)獨(dú)立分析機(jī)構(gòu) Artificial Analysis 最新公布的標(biāo)準(zhǔn)化測(cè)試結(jié)果，SkyReels-V4 在文本生成視頻 T2V（含音頻）的現(xiàn)役模型榜單中取得全球第 2的成績(jī)，并在全球歷史所有 T2V 模型總榜中位列第 4。成績(jī)超過(guò)了 Veo 3.1、Sora 2、Vidu Q3 以及 Wan 2.6 等當(dāng)前主流模型。

榜單地址：https://artificialanalysis.ai/video/leaderboard/text-to-video?audio-output=true&include-non-current=true

空口無(wú)憑，我們不妨直接看效果。以冬奧會(huì)為契機(jī)的冰雪運(yùn)動(dòng)依然熱度不減，下面這段由 SkyReels-V4 生成的滑雪視頻，直觀展示了其在復(fù)雜場(chǎng)景下的生成實(shí)力：

文本生成視頻（T2V），簡(jiǎn)版提示詞：電影級(jí)質(zhì)感開(kāi)場(chǎng)：中遠(yuǎn)景中，@Actor-1 身穿亮橙色滑雪服、黑色頭盔與橙黃雪鏡，在雪脊上騰躍，遠(yuǎn)處雪峰與藍(lán)天鋪陳背景。鏡頭切至低角度跟拍：他在陡坡深雪中 carving，雪霧翻飛；中景展現(xiàn)壓低姿態(tài)控板，遠(yuǎn)景鋪開(kāi)遼闊山谷?？焖偌糨嫶┎逄貙?xiě)與廣角：急轉(zhuǎn)彎時(shí)雪粒飛濺，側(cè)向橫切雪坡掠過(guò)松林，騰空跳躍與層疊山脊形成戲劇構(gòu)圖。最后側(cè)后跟拍特寫(xiě)，毛皮飾邊隨風(fēng)揚(yáng)起，手套緊握雪杖，雪沫炸裂。畫(huà)面定格在夕陽(yáng)下，@Actor-1 滑向坡底。

這個(gè)視頻是 SkyReels-V4 基于純文本提示詞生成的，其中展現(xiàn)出了模型對(duì)高度復(fù)雜的多鏡頭敘事指令的驚人理解力。從低角度跟拍到遠(yuǎn)景橫切，再到雪沫飛濺的動(dòng)態(tài)特寫(xiě)，SkyReels-V4 完美扛住了極高頻的鏡頭調(diào)度。它不僅保持了人物主體和場(chǎng)景在多重機(jī)位切換下的高度一致性，更將提示詞中要求的「電影級(jí)質(zhì)感」與物理運(yùn)動(dòng)學(xué)特征呈現(xiàn)得淋漓盡致。

如果說(shuō)復(fù)雜的鏡頭調(diào)度是對(duì)視覺(jué)能力的考驗(yàn)，那么下面這個(gè)「關(guān)公戰(zhàn)秦瓊」視頻，則直觀展示了其原生音視頻同步生成的硬實(shí)力：

圖像生成視頻（I2V），提示詞：史詩(shī)級(jí)電影鏡頭，@Actor-0 與 @Actor-1 在一片雷鳴交加的荒蕪之地中對(duì)峙。@Actor-0 橫刀向前，怒喝道：「來(lái)者何人，竟敢擋我去路？！」@Actor-1 高舉雙锏，厲聲回吼：「大唐秦叔寶，看锏！」吼聲在荒野中回蕩。瞬間兩人沖鋒，刀锏相撞，火星四濺。動(dòng)態(tài)動(dòng)作，激烈的決斗，周?chē)鸁焿m旋繞，高對(duì)比度光線，慢動(dòng)作，體積光，史詩(shī)氛圍，特寫(xiě)他們嘴唇翕動(dòng)和兇狠表情。

這段視頻的初始提示包括兩張人物圖像和一段文本?？梢钥吹?，在這個(gè)充滿(mǎn)張力的橋段里，模型做到了音畫(huà)維度的深度咬合。兵器相撞的清脆音效與火星四濺的視覺(jué)反饋嚴(yán)絲合縫；更難得的是，在特寫(xiě)鏡頭下，人物高亢激烈的臺(tái)詞發(fā)音與嘴唇肌肉的翕動(dòng)完美對(duì)齊。這種原生的視聽(tīng)耦合能力，讓數(shù)字生成的角色具備了真實(shí)的生命力。

SkyReels-V4 也能生成高質(zhì)量的豎屏短視頻：

I2V，同樣使用了兩張人物圖像和一段文本，簡(jiǎn)版提示詞：短劇風(fēng)格，奢華室內(nèi)場(chǎng)景。#Role_1 近景，神情隱憂。切至 #Role_2 接電話，語(yǔ)氣堅(jiān)定：「我說(shuō)我現(xiàn)在回來(lái)。好?！勾髲d遠(yuǎn)景，兩人對(duì)立而站。#Role_2 放下手機(jī)，中近景說(shuō)道：「那我讓二妹過(guò)來(lái)，讓她送你回去?！狗创?#Role_1，輕搖頭回應(yīng)：「不用，不用這么麻煩?！够氐?#Role_2，伸手欲觸她肩，語(yǔ)氣堅(jiān)決，背景響起低沉緊張氛圍音樂(lè)：「不行?！?/p>

在這段主打微表情與對(duì)白交互的文戲片段中，模型展現(xiàn)了對(duì)內(nèi)斂情感與視聽(tīng)同步的精準(zhǔn)控制力。從廣角全景的空間調(diào)度到逆向機(jī)位的特寫(xiě)反打，鏡頭的連貫性得到了極好維持。更值得探究的是其在中文語(yǔ)境下的聲畫(huà)耦合表現(xiàn)，當(dāng)角色講出「那我讓二妹過(guò)來(lái)，讓她送你回去」與輕聲婉拒的「不用，不用這么麻煩」時(shí)，不僅中文口型咬字準(zhǔn)確無(wú)誤，連同眉頭微蹙、眼神錯(cuò)愕等細(xì)微的面部肌肉調(diào)度，也與臺(tái)詞的重音及情緒起伏高度對(duì)齊。伴隨著底層富有律動(dòng)感的低音懸疑配樂(lè)適時(shí)切入，系統(tǒng)將一段日常的對(duì)話拉扯，渲染出了極具沉浸感的戲劇張力?？雌饋?lái)，SkyReels-V4 有望成為短劇制作者們的得力工具。當(dāng)然，看得出來(lái)，SkyReels-V4 在生成畫(huà)面中的文字方面還有待提升。

不僅如此，SkyReels-V4 甚至還能編輯視頻，比如我們可以輸入一張圖像、一段視頻和一段簡(jiǎn)單指令，讓北極狼跳起邁克爾?杰克遜標(biāo)志性的捂襠動(dòng)作。

視頻編輯，提示詞：Replace the dancer in the middle of the stage in @video_1 with the wolf from @image_1, ensuring consistent movements.

目測(cè)，要火。

從上面幾個(gè) demo 可以看到，SkyReels-V4 支持文本、圖像、視頻等多種模態(tài)的輸入。要知道，在當(dāng)前的視頻生成生態(tài)中，主流系統(tǒng)普遍存在模態(tài)割裂與功能分散的痛點(diǎn)。SkyReels-V4 成功實(shí)現(xiàn)了突圍，成為了全球首個(gè)同時(shí)支持多模態(tài)輸入、聯(lián)合音視頻生成以及統(tǒng)一生成與編輯任務(wù)的視頻基礎(chǔ)模型

該模型主打「全模態(tài)參考」的核心優(yōu)勢(shì)，能夠無(wú)縫接收文本、圖像、視頻片段、掩碼以及音頻參考等豐富指令。

這意味著，創(chuàng)作者無(wú)需在多個(gè)工具間繁瑣切換，即可在單一網(wǎng)絡(luò)內(nèi)完成從創(chuàng)意構(gòu)思到專(zhuān)業(yè)級(jí)音視頻同步輸出的端到端創(chuàng)作。

技術(shù)報(bào)告：SkyReels-V4: Multi-modal Video-Audio Generation, Inpainting and Editing model
報(bào)告地址：https://arxiv.org/abs/2602.21818

三大核心突破，讓 AI 能畫(huà)也能說(shuō)

現(xiàn)階段的 AI 視頻大模型往往像是一個(gè)偏科的優(yōu)等生。它們大多擅長(zhǎng)畫(huà)面生成，但如果在生成畫(huà)面的同時(shí)還要配上同步的聲音，往往就會(huì)顯得力不從心。這種淺層的技術(shù)縫合往往會(huì)導(dǎo)致畫(huà)面里的人口型對(duì)不上，或者音效比動(dòng)作慢半拍。

針對(duì)這個(gè)行業(yè)通病，昆侖天工團(tuán)隊(duì)在底層架構(gòu)上進(jìn)行了大刀闊斧的改進(jìn)。

新提出的方法概覽

讓音視頻成為「雙胞胎」：雙流 MMDiT 架構(gòu)與混合注意力

SkyReels-V4 采用了一種對(duì)稱(chēng)的雙流架構(gòu)，如上圖左側(cè)所示。

你可以把它想象成一對(duì)雙胞胎，視頻分支和音頻分支擁有各自的獨(dú)立通道，但共享著同一個(gè)基于 MMLM 的「大腦」來(lái)處理文本輸入。

為了平衡模態(tài)對(duì)齊與參數(shù)效率，這套架構(gòu)包含了混合的雙流與單流處理模塊。在前 M 層中，視頻和音頻保留各自獨(dú)立的參數(shù)空間（如層歸一化和 MLP 等），但通過(guò)聯(lián)合自注意力機(jī)制進(jìn)行交互；而在隨后的 N 層里，模型會(huì)切換到單流架構(gòu)，使用共享參數(shù)以提高計(jì)算效率。

在整個(gè)生成過(guò)程中，這兩個(gè)分支還會(huì)通過(guò)雙向跨注意力機(jī)制不斷地「交換眼神」。音頻流會(huì)關(guān)注視頻特征，視頻流也會(huì)反向關(guān)注音頻特征，從而在特征層面上實(shí)現(xiàn)了真正的咬合與同步。

現(xiàn)在，雖然架構(gòu)對(duì)稱(chēng)了，但還有一個(gè)問(wèn)題：音視頻天生的時(shí)間流速也完全不同。打個(gè)比方，同樣生成 5 秒的內(nèi)容，視頻潛變量跨越 21 幀，但音頻潛變量卻包含著高達(dá) 218 個(gè)特征 token （相當(dāng)于 44.1 kHz ）。

為了解決這種時(shí)間尺度的錯(cuò)位，昆侖天工團(tuán)隊(duì)引入了RoPE 旋轉(zhuǎn)位置編碼頻率縮放技術(shù)

他們將音頻的 RoPE 頻率按照 21 與 218 的比值（約等于 0.09633 ）進(jìn)行了專(zhuān)門(mén)調(diào)整，使其與視頻較粗的時(shí)間分辨率相匹配。此外，為了區(qū)分輸入條件和生成目標(biāo)，模型還采用了帶偏移的 3D RoPE ，為條件潛變量賦予負(fù)數(shù)的時(shí)間索引。

這種底層的數(shù)學(xué)對(duì)齊可確保兩個(gè)模態(tài)能夠按照相同的時(shí)間節(jié)奏去相互關(guān)注，徹底治好了 AI 視頻長(zhǎng)期以來(lái)的音畫(huà)不同步頑疾。

把所有復(fù)雜編輯變成一道「填空題」：通道拼接統(tǒng)一框架

為了處理繁雜的編輯操作，系統(tǒng)將帶有噪聲的視頻潛變量、VAE 編碼的條件幀以及二進(jìn)制掩碼在通道維度上直接拼接起來(lái)。

于是，一切都被簡(jiǎn)化為特定掩碼配置下的修復(fù)問(wèn)題。

例如，如果掩碼全為 0 ，意味著讓模型從頭生成視頻，即文本到視頻（T2V）任務(wù) ；如果僅第一幀的掩碼為 1 ，那就是讓模型依據(jù)首幀向下續(xù)寫(xiě)，即圖像到視頻（I2V）任務(wù)。當(dāng)然，也可以通過(guò)讓前 k 幀的掩碼為 1 來(lái)實(shí)現(xiàn)視頻擴(kuò)展，或讓需要編輯的區(qū)域的掩碼為 0 來(lái)實(shí)現(xiàn)視頻編輯。

據(jù)介紹，通過(guò)調(diào)整時(shí)空掩碼的參數(shù)，局部重繪、主體替換甚至是復(fù)雜的元素消除都可以被無(wú)縫覆蓋。

比如在下面的例子中，一段簡(jiǎn)單指令就移除了畫(huà)面中兩位指定的角色：

原視頻

移除了其中兩位角色后的視頻，提示詞：Remove the young man with short blond hair holding a flashlight on the far right and the woman with long, wavy blonde hair in a dark purple top in @video_1.

憑此能力，SkyReels-V4 也可成為一個(gè)去水印或字幕的利器：

視頻去字幕演示，左為原視頻，右為處理后的視頻，提示詞：Remove the subtitles in @video_1.

更巧妙的是，在處理這類(lèi)視覺(jué)修復(fù)任務(wù)時(shí)，音頻分支還可以根據(jù)修改后的視頻內(nèi)容從零開(kāi)始生成聲音，確保修改后的視覺(jué)和聽(tīng)覺(jué)始終保持邏輯一致。

先起草再精修：引入 VSA 稀疏注意力的超分降本策略

生成 1080p 分辨率、 32 FPS 幀率以及 15 秒時(shí)長(zhǎng)的視頻對(duì)算力的消耗是驚人的。

昆侖天工團(tuán)隊(duì)設(shè)計(jì)了聯(lián)合生成低分辨率全序列與高分辨率關(guān)鍵幀的高效機(jī)制：系統(tǒng)先快速打好草稿，隨后再交由專(zhuān)用的超分辨率和幀插值模塊來(lái)補(bǔ)充細(xì)節(jié)。

視頻超分辨率與幀插值方法的流程。F 表示基礎(chǔ)模型的輸出隱含表示，KF 表示基礎(chǔ)模型的關(guān)鍵幀隱含表示。

這中間最硬核的提效手段是引入了可訓(xùn)練的視頻稀疏注意力機(jī)制（VSA）

VSA 架構(gòu)概覽，來(lái)自 arXiv:2505.13389

VSA 通過(guò)兩階段分層處理，先粗略聚合時(shí)空塊找到關(guān)鍵區(qū)域，然后再對(duì)這些 top-K 的關(guān)鍵塊進(jìn)行密集的注意力計(jì)算。這套方案能在保證畫(huà)質(zhì)不降低的前提下，將注意力計(jì)算成本降低約 3 倍！

當(dāng)然，龐大的視頻基礎(chǔ)模型需要一套嚴(yán)謹(jǐn)?shù)膶W(xué)習(xí)路徑，昆侖天工團(tuán)隊(duì)為此采用了一種多階段的漸進(jìn)式訓(xùn)練范式

為了讓模型穩(wěn)步掌握空間概念與時(shí)間動(dòng)態(tài)，整個(gè)訓(xùn)練過(guò)程被拆解為多個(gè)明確的階段。

在最初的階段，模型先從基礎(chǔ)的 256px 文本到圖像預(yù)訓(xùn)練開(kāi)始，這一階段使用了 30 億張圖像，專(zhuān)門(mén)用于打好空間構(gòu)圖和語(yǔ)義理解的底子。隨后模型開(kāi)始引入基礎(chǔ)的視頻片段，并在后續(xù)的訓(xùn)練中逐步擴(kuò)展到 480px、720px 以及 1080px 的多分辨率混合訓(xùn)練。在最后的有監(jiān)督微調(diào)階段，該團(tuán)隊(duì)使用了 500 萬(wàn)條多模態(tài)視頻數(shù)據(jù)，并疊加了 100 萬(wàn)條經(jīng)過(guò)人工精選的高質(zhì)量視頻進(jìn)行最終打磨。

所有階段的完整訓(xùn)練規(guī)劃。這種漸進(jìn)策略會(huì)逐步提高分辨率、時(shí)間長(zhǎng)度和任務(wù)復(fù)雜度。

正是這種精細(xì)的策略，最終促成了模型在視覺(jué)質(zhì)量、運(yùn)動(dòng)流暢度以及聲音自然度上的全面飛躍。

全場(chǎng)景?全流程?全模態(tài)

過(guò)去的視頻模型更偏向「單點(diǎn)生成」。

這是比較好理解的。輸入一句提示詞，輸出一段畫(huà)面?；蛘呋谝粡垐D就能夠延展出幾秒視頻。生成、編輯、修復(fù)、配音往往分散在不同工具中，音頻多為后期疊加，創(chuàng)作流程也被拆分成多個(gè)階段。

雖然說(shuō)模型能力在不斷提升，也能生成一些讓人眼前一亮的效果，但這距離 AI 視頻生成向真正能用好用的內(nèi)容創(chuàng)作工具的轉(zhuǎn)變?nèi)匀挥幸欢尉嚯x。

真正讓人震撼的是「整合」，是把文本、圖像、視頻片段、音頻參考整合進(jìn)同一生成體系的能力。也就是 SkyReels-V4 所強(qiáng)調(diào)的「全模態(tài)參考」，是多模態(tài)信息在底層架構(gòu)中的協(xié)同。

柴可夫斯基和《魔獸世界》吉安娜共跳愛(ài)樂(lè)之城，基于兩張圖像和一段視頻的視頻編輯，提示詞：Replace the skirt-wearing woman on the left in @video_1 with the man from @image_1, and replace the white-shirt-wearing man on the right in @video_1 with the woman from @image_2, ensuring consistent movements.

音頻與視頻在擴(kuò)散過(guò)程中同步生成，多種參考條件在同一時(shí)空框架內(nèi)共同作用，各種生成任務(wù)被統(tǒng)一進(jìn)一套計(jì)算邏輯中

創(chuàng)作者因此擁有更高的控制精度。人物形象可以保持，動(dòng)作可以遷移，音色能夠復(fù)刻，局部區(qū)域可定向修改，整體風(fēng)格可以調(diào)整，這些控制條件可以在一次生成過(guò)程中同時(shí)發(fā)揮作用。視頻生產(chǎn)從一次性輸出，轉(zhuǎn)向可控、可迭代的創(chuàng)作流程。

這種架構(gòu)帶來(lái)的直接結(jié)果，是創(chuàng)作過(guò)程的連續(xù)性提升。創(chuàng)作者可以基于參考圖像鎖定人物外觀，利用參考視頻遷移動(dòng)作，通過(guò)音頻樣本保持音色與情緒表達(dá)，同時(shí)對(duì)局部區(qū)域進(jìn)行精細(xì)修改。1080p、32FPS、15 秒輸出規(guī)格，使這些控制能力具備實(shí)際生產(chǎn)價(jià)值。音視頻在生成階段深度協(xié)同，減少后期補(bǔ)償環(huán)節(jié)，提升整體一致性。

SkyReels-V4 就像一把瑞士軍刀，真正打造了一個(gè)能夠覆蓋全場(chǎng)景，全流程，全模態(tài)的生成工具。

還記得 Seedance 2.0 發(fā)布，初步讓創(chuàng)作者感受到了全模態(tài)「整合」的意義。影視颶風(fēng) Tim 在視頻里對(duì)全模態(tài)整合的生成模型這樣評(píng)價(jià)：

「這不是一個(gè)小的技術(shù)革新，這是一個(gè)會(huì)推走行業(yè)所有過(guò)去流程和沉淀的一個(gè)海嘯，我就會(huì)這么形容它。」

而 SkyReels-V4 的發(fā)布，標(biāo)志著 AI 視頻生成技術(shù)從「單一功能合成」進(jìn)入「全流程一體化創(chuàng)作」的新階段

開(kāi)啟創(chuàng)作「全棧時(shí)代」

以 Tim 為代表的創(chuàng)作者們很焦慮，似乎「越努力做越比不過(guò) AI 的進(jìn)步速度，以前學(xué)的東西越?jīng)]有價(jià)值」。

這種焦慮其實(shí)并不必要。過(guò)去我們圍繞「素材」進(jìn)行剪輯，如今開(kāi)始圍繞「語(yǔ)義」和「意圖」進(jìn)行調(diào)度與生成。模型不再只是執(zhí)行指令的工具，而逐漸成為理解創(chuàng)作結(jié)構(gòu)、參與創(chuàng)作決策的系統(tǒng)。

AI 生成模型愈發(fā)整合，正是行業(yè)擴(kuò)展的強(qiáng)大工具箱，形成覆蓋創(chuàng)意輸入到成片輸出的完整鏈路，而創(chuàng)作者永遠(yuǎn)是調(diào)用工具的舵手。

在 Seedance 2.0 給行業(yè)展示了多模態(tài)整合生成的潛力后，產(chǎn)品進(jìn)入了一個(gè)風(fēng)控收緊的階段。SkyReels-V4 正是在這個(gè)時(shí)間節(jié)點(diǎn)推出，憑借多模態(tài)理解和視聽(tīng)同步生成的底層突破，深刻重塑了內(nèi)容生產(chǎn)的工作流，為尋求替代方案的專(zhuān)業(yè)用戶(hù)提供了極具競(jìng)爭(zhēng)力的選擇。

放眼整個(gè)昆侖天工 AI 生態(tài)，底層大模型與前端產(chǎn)品正在形成緊密的雙向驅(qū)動(dòng)，構(gòu)建起一個(gè)相輔相成的繁榮生態(tài)。目前，昆侖天工已確立了四大模型家族：Skywork 系列大模型、Mureka 音樂(lè)音頻模型、SkyReels 視頻大模型和 Matrix Game 游戲世界模型。

在這個(gè)矩陣之中，技術(shù)基座與應(yīng)用場(chǎng)景已經(jīng)實(shí)現(xiàn)了深度融合。一方面，Skywork 系列文本大模型與多模態(tài) Skywork R1V 系列等、音樂(lè)生成模型 Mureka V8 等前沿基座，為天工超級(jí)智能體（Skywork Super Agents）、AI 音樂(lè)創(chuàng)作平臺(tái) Mureka、AI 社交 Linky 和 AI 游戲「貓森學(xué)園」等業(yè)務(wù)提供了強(qiáng)大的底層引擎；另一方面，這些高頻活躍的前端產(chǎn)品也在不斷拓展技術(shù)的落地邊界，以真實(shí)的交互需求反哺大模型的持續(xù)進(jìn)化。

新發(fā)布的 SkyReels-V4 填補(bǔ)了這一生態(tài)在全模態(tài)視聽(tīng)內(nèi)容生產(chǎn)上的關(guān)鍵拼圖。這種模型賦能產(chǎn)品、產(chǎn)品滋養(yǎng)模型的生態(tài)閉環(huán)，將實(shí)質(zhì)性地打通廣告與影視等產(chǎn)業(yè)的商業(yè)鏈路，把內(nèi)容創(chuàng)作的廣闊想象落到實(shí)處。

未來(lái)，SkyReels-V4 將支持 60 秒以上的視頻生成、實(shí)時(shí)交互編輯，并開(kāi)放 API 與全系產(chǎn)品協(xié)同。隨著這一模型工具的迭代進(jìn)化，內(nèi)容生產(chǎn)也將進(jìn)入一個(gè)全新的工業(yè)化的「全棧時(shí)代」

文中視頻鏈接:https://mp.weixin.qq.com/s/bEi9bIHN0z8ebB89Pei5eQ

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.