視頻生成有個老難題:角色一致性
這個問題,之前一直沒被很好的解決,直到 Sora 2 推出了 Cameo,才算是有個被認可的東西
比如下面這個,Sam 禪位 CEO 給我
12月16日,阿里發布萬相 2.6,支持了角色扮演
從模型的角度,是目前最接近 Cameo 的
同一時間,千問集成了萬相
![]()
社區上,出現了很多「角色扮演」的成片 角色扮演
萬相2.6 把這個能力叫「角色扮演」
123
給模型一段參考視頻,它能提取里面的角色外觀、音色、動作特征,然后按照你的描述生成新視頻
角色在新視頻里保持一致
同時支持多人合拍:兩個角色在同一個視頻里互動,各自保持一致
還支持智能分鏡:輸入一段描述,自動拆成多個鏡頭,鏡頭之間角色、場景、氛圍保持統一
角色扮演:潮酷女在咖啡廳說「周末不用上班真舒服」
多鏡頭敘事:香水廣告,三個鏡頭切換,主體一致
基于這個,模型現在可以生成連貫的多鏡頭敘事,角色從頭到尾是同一個人。當然,除了視頻,萬相也能生圖:
![]()
萬相生圖:8-bit像素藝術風格,復古街機美學 , "通義萬相" 字體 ,游戲UI界面構圖 ,鮮艷RGB高亮色,CRT屏幕顆粒質感,80年代懷舊游戲場景
現在,萬相2.6 已上線萬相官網和阿里云百煉 API
千問 App 是 C 端首發
千問首發
萬相2.6同步上線了千問App,功能叫「AI小劇場」
把專業能力封裝成了產品:選模板、選角色、輸入描述,生成視頻
![]()
千問App界面,左下角是AI小劇場入口
支持和朋友合拍、和IP合拍、一鍵翻拍別人的視頻,這里放幾個我做的,給大家看看效果
林黛玉:葬不了花
陳浩南:出不了門
當然,你也可以搞個這個,hhhhh
免費,1080P,最長15秒,昨天上線
萬相和千問
萬相是阿里的視覺生成模型,來自通義實驗室
今年 9 月,萬相 2.5 發布
這是國內首個音畫同步的視頻生成模型
LMArena評測圖生視頻國內第一
![]()
萬相2.5,發布于云棲大會
千問 App 是阿里的 C 端 AI 助手
雖然叫千問,但背后調用的不只是千問模型
萬相、百聆(語音)都接進來了
![]()
千問App
阿里的模型,在在語言和視覺上都挺能打的。現在 APP 也開始大力搞了,模型+應用端其發力,未來可期
以及...千問、萬相、百聆...這些名字,很有節奏
體驗入口:千問App → 左下角「AI小劇場」
萬相官網:tongyi.aliyun.com/wan
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.