鷺羽 發自 凹非寺
量子位 | 公眾號 QbitAI
一個APP就能搞定爆款視頻!這屆AI玩家也太猛了。
能捏臉、能控色、會排版、全模態、戲感強還保真……
劃重點,幾乎只有你想不到的,就沒有它做不到的。
不賣關子了——
這款全能創作搭子就是阿里最新上線千問APP的Wan2.7,好玩程度直接硬控我一整天。
不妨先來段視頻感受一下,be like:
Prompt:生成一段視頻,一個男人非常吃驚地看向鏡頭,鏡頭拉遠,一群人都很吃驚,鏡頭翻轉,原來是他們看到了Wan2.7的廣告牌。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
人物表情生動自然,鏡頭銜接流暢,都相當符合Prompt要求,尤其是群像塑造上,真正做到了“千人千面”
同時還自動生成了匹配的人聲音效,就這成片給到一個夯!
難度升級,再來一個圖生視頻試試,比如喂給AI一張圖片:
![]()
以及一段音頻:
![]()
音頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
- Prompt:根據圖片和音頻生成一段薩克斯表演。
nice!光影變幻間,即刻上演一場精彩的單人薩克斯演出:
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
再加點料,在原視頻基礎上補充一張尾幀圖,讓演奏者絲滑切換:
Prompt:根據圖片續寫該視頻,讓女性演奏家加入表演。
![]()
效果是醬紫的:
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
而這些通通都是我在千問APP上完成的,操作非常簡單,只需在“AI視頻”中上傳剛剛生成的第一段視頻,以及尾幀圖片即可。
![]()
這一次,不止視頻生成得到史詩級增強,圖片能力也直接next level。
無論是8色HEX精準控制還是3K tokens超長文本支持,AI創作這件事都在千問APP中變得so easy~
話不多說,直接深度開測。
這屆AI來了位實力演技派
交互頁面倒是沒有比較大的改動,要么創作面板,要么chat對話。
總之,以前千問APP怎么用的,現在就還怎么用。
![]()
主要是新增了視頻編輯、視頻續寫、動作模仿能力,加上模型能力Pro,下面我們以具體的創作過程一一道來。
先看圖像生成。
這次Wan2.7-Image的亮點是“千人千面”,比如在人物臉部上,用戶可以自定義五官細節,包括骨相、眼神、皮膚紋理等。
這里我們嘗試用Wan2.7-Image復刻《哈利波特》原著中的斯內普教授形象:
一個大約35歲的男人,面色蠟黃,油膩的及肩黑發,顯眼的鷹鉤鼻,冷漠空洞、像黑色隧道一樣的雙眼。身穿一件高領黑色長袍,背景為霍格沃茨昏暗潮濕的地窖。
![]()
u1s1,說這是真人定妝照也不為過。眼神復雜幽深,連毛孔皺紋都清晰可見。
同樣的,我們把提示詞交給Gemini和ChatGPT。
![]()
左:Gemini;右:ChatGPT。
顯而易見,Gemini直接照搬電影版選角,ChatGPT在鷹鉤鼻的塑造上并不貼合。但都比電視劇版好太多……(doge)
Wan2.7-Image還具有調色盤能力,比如這個實用性的場景設計:
一張賽博朋克風格的深夜街道照片,細雨蒙蒙,畫面主色調選擇藍色RGB(0,70,255)。鏡頭焦點是一個發光的霓虹燈招牌,上方寫著大而清晰的漢字“未來之城”,下方寫著手寫體英文“Neo Metropolis”。
![]()
將圖片導入PS,可以直觀看到,畫面主色調精準落在藍色系中,色差控制在合理的誤差范圍之內。
![]()
另外,中英雙語的文字渲染也沒有出現亂碼的情況。據官方介紹,Wan2.7-Image還能支持最高3K token的超長文字輸入,可以寫滿足足一整頁A4紙。
這次Wan2.7的視頻生成能力,也有驚喜。
比如讓千問APP幫忙手搓一個旅游Vlog,咱也來趕趕時髦。
根據六宮格參考圖生成一個巴西旅游Vlog。
![]()
好好好!也是在地球另一端感受到了桑巴熱情。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
要是對視頻細節不滿意,還可以進行局部編輯,比如原視頻是這樣的:
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
只需輸入提示詞+上傳參考圖,就能將膠片一鍵替換成盤子。
將視頻中的膠片替換為圖片中的盤子。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
且看盤子上的反光,細節好評!
修改靜態主體還不夠,我還能直接用千問APP的視頻模仿功能,無痛學習新動作~
比如我覺得這個小哥的動作很豐富:
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
嘗試套到另一個角色身上:
讓圖片中的人物模仿視頻中的人的手勢動作,保持雙手配合和手勢變化過程清晰可見。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
最后來玩個有意思的:拍好萊塢大片!
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
看不夠,那就用視頻續寫延長戰斗:
![]()
視頻鏈接:https://mp.weixin.qq.com/s/hc0gyu23DeSn1EknMfhyHA
(無獎競猜:男人為何如此驚恐?)
總之實測下來,Wan2.7給我最大的感受是——妙!
不僅僅可玩性大大提升,而且用起來還特別方便。
以前要創作一個視頻,需要經過反復多次的修改剪輯,現在千問APP里就能一站式續寫和參考重塑,迅速提煉出爆款視頻的流量密碼。
而且不只是日常的創意表達,專業的平面設計或者影視制作也能大用特用,就比如最近大熱的AI演員、AI短劇,Wan2.7就能分得一杯羹。
而且演技還不輸專業演員,夠真實、夠好用。
口說無憑,例如在人類偏好盲測評分中,Wan2.7-Image就位列國內生成模型第一,超過GPT Image 1.5,逼近Nano Banana Pro。
![]()
實力能打+人人可用,那么這里就引出一個核心問題——
Wan2.7的發布,究竟代表著什么?
觸手可及的創作,讓人人都能生產爆款
顯然,這并非一句“千問團隊實現技術突破”就能簡單帶過的。
當我們將目光放大至整個行業,就會發現一個愈加明顯的趨勢清晰可見:
AI內容生成正在加速進入中國時間。
先看硅谷這邊,曾經的AI生成龍頭Sora悄然退場,以OpenAI為首的科技巨頭紛紛從全面開花,轉向Agent和底層推理的戰略性單點收縮。
而例如視頻生成這類高投入、慢回報的支線任務則被率先拋棄。
但與之形成對比的,是國內市場陸續迸發出多款高性能且全面的視頻/圖像生成模型。
歸根結底,一方面是因為國內擁有更完善的C端場景(如短視頻、電商),更適配AI內容生成的商業化落地。
另一方面,中國廠商也更注重培養模型的工程應用能力,嘗試以更行之有效的迭代速度和更低的成本,加快AI融入創作者的工作流。
那么如何更高效地打通AI到創作者的“最后一公里”呢?
依據多年深厚的用戶場景積累,阿里的答案簡單粗暴——直給。也就是直接將最強模型同步裝進APP。
![]()
這源于阿里對市場的精準洞察:技術領先只是大模型的入場券,技術普惠才是產品真正的護城河。
細數阿里千問最近的動作,無一不在印證這點——春節期間“千問辦事”的能力出圈,現在又將Wan2.7下放到移動端,就是為了讓更多人能夠第一時間享受到技術紅利。
只要用戶開始用了,就會發現AI創作這件事原來沒有想象中那么難,即使是對模型一竅不通,也能通過最基礎的功能按鍵和一句指令,穩定創造出高水準的視頻。
可以預見的是,未來制作爆款視頻和精美圖像就會變得像點外賣、刷視頻一樣簡單,到那一刻,才是真正打開了人人AI創作的大門。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.