![]()
機器之心編輯部
先給大家看個視頻,你能分辨出哪個是 AI 生成的嗎?
視頻來源:tiktok 博主 @tkp..1001
「真人拍攝還是 AI 生成」,如果擱一年前,這個問題還很容易回答,因為細節(jié)處總有一眼 AI 的破綻,但現(xiàn)在,真與假的界限已變得愈發(fā)模糊。
越來越多「真實」的視頻,評論區(qū)里都在爭論「這是 AI 吧?」而那些真正由 AI 生成的內容,反倒被當成真實拍攝。
![]()
AI 視頻生成技術的進化速度快到飛起,并正滲透進我們生活的方方面面。隨之而來的問題是:我們究竟要如何與這些技術共處?
破解這一難題的鑰匙或許就藏在人類的想象力中。技術的超越不該只在于對現(xiàn)實的復刻,更應在創(chuàng)新應用中想象更美好的未來。
站在這個視角,阿里云給出了一個頗具想象力的答案:2026 年米蘭冬奧會。
就在冬奧會倒計時 30 天之際,作為官方云服務合作伙伴的阿里云,拉著國際奧委會以及?蘭冬奧組委會搞了波大的,共同發(fā)起一場全球 AIGC ?賽
![]()
![]()
![]()
大賽 Slogan 為「YOUR EPIC VIBE」,正好與本屆冬奧口號「IT's Your Vibe」(意展你風采)遙相呼應。
大賽規(guī)則簡單粗暴:只需用阿里云的「萬相大模型」,在花樣滑冰、短道速滑、高山滑雪、單板滑雪經典項目中選一個,生成一段冬奧視頻,就能參賽。
除了萬相大模型本身,阿里巴巴的 AI 產品生態(tài)同樣為本次大賽提供了全棧式支持,包括開源開放的開發(fā)者社區(qū) Modelscope、AI 創(chuàng)作工具通義萬相、堆友,為不同類型、不同渠道的參賽者「保駕護航」。
國際奧委會還直接放話,他們將從這四個項目中各選 25 個最佳作品,納入奧林匹克博物館收藏,并組合成奧運史上首個 AIGC 數(shù)字藝術影像作品集《YOUR EPIC VIBE》。
這意味著,自 1896 年現(xiàn)代奧運首次舉辦以來,AI 第一次以這種方式被寫進奧運歷史。
更刺激的是,Top 100 中將評選出 10 位在敘事創(chuàng)意、情感深度和美學構圖上表現(xiàn)最好的獲獎者,他們還能直接拿到米蘭冬奧會現(xiàn)場門票。
大賽官網:https://summit.aliyun.com/aigcchampionship
AI 視頻生成技術卷到現(xiàn)在,終于不只是在社交媒體上刷存在感了。它正以一種誰也沒想到的方式,成為奧運歷史的一部分。
而要達成這一成就,萬相 Wan2.6 憑借其強悍的視頻生成能力,化作了參賽者手中最強的那把利器。
用 AI 創(chuàng)造冰雪世界,為何獨獨選擇了阿里云?
在去年 12 月 AI 視頻生成大模型又一波涌現(xiàn)的大潮中,阿里云的 Wan2.6 登場。
![]()
Wan2.6 面向專業(yè)級影視制作和圖像創(chuàng)作場景,進一步提升了畫質、音效、指令遵循能力,并新支持多鏡頭敘事及最長 15 秒生成。此外在國內首次支持角色扮演(Reference-to-video,R2V)功能,本人可以入鏡,并用自己的聲音出演 AI 視頻。
![]()
體驗地址:https://tongyi.aliyun.com/wan/
對于此次冬奧賽場上的四大經典冰雪項目,Wan2.6 表現(xiàn)出了極高的可玩性。
我們上手測試的結果說明了這一點。
只見一只可愛的雪人從高山之巔快速下滑,身后拉出一條清晰而綿長的雪線,紅色帽子在疾馳中隨風搖擺,看起來十分的童趣。如果我不告訴你這是 AI 生成的,可能你還以為這是哪部動畫片中的場景呢!
![]()
毛茸茸的怪獸在高山之巔飛速直下,雙腳踩著雪板完成流暢的滑雪動作,身體隨著地形起伏自然擺動。

小王子也來雪山之巔滑雪了,身披圍巾、腳踏雪板,仿佛開啟了一段屬于自己的冰雪冒險,純真而浪漫。

穿越千年的兵馬俑也獻上一段花滑表演:
![]()
除了文生視頻、圖生視頻,現(xiàn)在你也可以指定角色來生成了。Wan2.6 的角色扮演功能,可以將你輸入的參考視頻進行二次創(chuàng)作,甚至是你親自上場。
我們先來「呼叫奧特曼」上場速滑。只見他起滑、加速、入彎一氣呵成,動作那叫一個專業(yè),完全不像是第一次跨界。專業(yè)程度甚至讓人懷疑他是不是偷偷報過集訓班。
![]()
然后再讓馬斯克來段花樣滑冰,看起來也是有模有樣:

與此同時,Wan2.6 在動態(tài)表現(xiàn)和視覺沖擊力上同樣可圈可點。在這一示例中,鏡頭貼近雪面,緊跟雪板高速前行,低機位帶來的速度感與沖擊力被充分放大。
![]()
以前在滑雪場,常能看到有人踩著滑板、扛著相機一路跟拍,冒著不小的風險,才能換來幾個漂亮鏡頭。現(xiàn)在,這種高難度的跟拍視角已經不再依賴人工完成,Wan2.6 可以直接在生成過程中自動實現(xiàn)穩(wěn)定、貼近動作的動態(tài)運鏡:
![]()
慢鏡頭同樣穩(wěn)得住。高速下滑被自然放慢的那一刻,雪板切雪的力道、雪屑被甩起又在空中翻滾的軌跡一一展開,原本一閃而過的速度感被拆解成清晰可見的細節(jié)。這感覺就像在滑雪場里按下了電影級慢放鍵。
![]()
就算是高難度的多人場面,Wan2.6 依然能夠穩(wěn)穩(wěn)駕馭。多名滑雪者同時出現(xiàn)在畫面中,彼此之間的相對位置、運動方向與節(jié)奏保持清晰,沒有出現(xiàn)人物混疊或動作錯亂。
![]()
通過上述示例可以看出,Wan2.6 的優(yōu)勢并不在于某一個「炸點」,而是在冰雪運動中「力與美」的呈現(xiàn)上已經達到了相對成熟的水準。
在高速運動、多人互動以及音畫同步等關鍵場景下,Wan2.6 展現(xiàn)出超高的性能。無論是虛構角色還是真人形象,都能夠被自然地融入運動場景之中,完成連貫而完整的表演,體現(xiàn)出對運動節(jié)奏與視覺敘事的成熟把控。
進一步看,這種穩(wěn)定性也體現(xiàn)在鏡頭層面:生成過程中,鏡頭并非被動記錄動作,而是會隨著運動推進自動調整視角,在關鍵節(jié)點完成切換,使畫面具備基本的分鏡邏輯與節(jié)奏變化,可以說是深諳運動力學與視覺美學的「數(shù)字導演」。
視頻生成的多面手,Wan2.6 背后藏著這些「殺手锏」
長期以來,視頻生成被認為是 AI 領域最難攻克的堡壘之一。不過從 OpenAI Sora 開啟視頻「暴力美學」開始,這個領域在各個環(huán)節(jié)進入到了進化的快車道。
一開始大家追求的目標很簡單,讓畫面動起來;后來一步步加碼,提出了更多更高的要求,比如對復雜物理規(guī)律的極致模擬、影視級高清畫質、原生音畫同步、畫面連貫與邏輯統(tǒng)一,最終目標是無限接近真實視頻。
如今,升級到 2.6 版本的萬相大模型已修煉得「爐火純青」。
首先做到了超真實還原。實現(xiàn)這一點需要解決幾個深層次的技術挑戰(zhàn),包括物理規(guī)律的準確模擬、時序一致性、細節(jié)高度還原、原生音視頻的邏輯一致等。
Wan2.6 提供了音畫?體的多模態(tài)參考?成能?,通過對輸?參考視頻進?多模態(tài)聯(lián)合建模與學習,最終實現(xiàn)從畫面到聲音的全感官一致性保持與遷移。這種「鏡像級人物重建」可以精準捕捉并重建你的形象,就連每個微表情都生動至極。
其次能輸出銜接連貫的多鏡頭。視頻生成中精準的分鏡控制,要求 AI 不僅要生成連貫的畫面,還要像人類導演一樣理解空間調度、鏡頭切換和敘事連續(xù)性。
Wan2.6 可以一鍵完成單人、多人、人與物合拍的視頻,還能自動實現(xiàn)多鏡頭切換。這意味著,視頻生成不再是碎片拼湊,并且不管怎么切鏡頭,視頻里的主體都能保持像素級的統(tǒng)一,幾乎不會出現(xiàn)鏡頭一換、主角換臉的尷尬情況。
最后保證敘事完整不偏離主題。生成一段完整的敘事視頻,遠比幾個孤立的炫酷鏡頭困難得多,其核心挑戰(zhàn)在于如何讓 AI 具備時間記憶和邏輯常識。
Wan2.6 很好地解決了這些挑戰(zhàn),最長支持 15 秒 1080P 視頻生成,并能輕松搞定完整敘事的 Vlog 視頻。這使得該模型在短劇制作等專業(yè)場景具有廣闊的應用前景,只要提示詞寫得好,輸出的視頻可直接拿來用,省力又省錢。
一系列底層能力的突破,讓 Wan2.6 打破視覺、聽覺與物理規(guī)律之間的藩籬,為創(chuàng)作者提供了一個生產力級別的視覺生成引擎。
AI for all,在奧運這塊陣地「登陸」
去年 7 月,即將成為 OpenAI 史上首位應用 CEO 的 Fidji Simo 發(fā)表了一篇文章,主題為《AI:賦能所有人的終極源泉》(AI as the greatest source of empowerment for all)。這篇刷屏的就職檄文再一次讓「AI 全民可用」成為熱議的焦點。
![]()
文中寫到,「我相信 AI 將為更多人帶來比歷史上任何其他技術都多的機遇。如果我們能做好這一點,AI 將給予每個人前所未有的力量。」但同時,這些機遇并不會憑空出現(xiàn),不僅要求 AI 達到較高的水準,還要有像阿里云這樣勇于創(chuàng)新的 AI 玩家。
現(xiàn)在看來,這場全球 AIGC 大賽成為了「AI for all」的實踐陣地。
以往,參與奧運的方式要么花很多錢去現(xiàn)場觀賽吶喊,要么在電視機或電腦前守候。如今,AI 終于賦予了每一個普通人更沉浸的奧運體驗。
在高山滑道、花滑冰場或單板 U 型場,你我同樣可以成為萬眾矚目的主角。這正是奧運級 AI 科技首次大規(guī)模應用于粉絲互動所產生的魅力。
正如 Fidji Simo 所強調的,「如果我們能夠讓智能技術無處不在、人人可及,就能驅動人類歷史上最大的機遇引擎,并幫助更多人過讓更好的生活」。阿里云掀起的這場以萬相大模型為主導的交互范式變革,正以自己的方式一步步將這樣的愿景落地。
文中視頻鏈接:https://mp.weixin.qq.com/s/_iaiwdraikWZGd49O4zocQ
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.