![]()
那個一度在 Artifical Analysis 的 AI 視頻競技場排行榜中登頂第一的視頻生成模型 HappyHorse 1.0,我們終于能用官方版了,現在打開千問 APP 和千問創作Web端( c.qianwen.com ),直接就能用,甚至還有免費體驗額度。
![]()
前段時間,一款名為 HappyHorse 1.0 的視頻生成模型,悄然登頂權威 AI 評測平臺 Artifical Analysis 的 AI 視頻競技場排行榜,引發社交媒體的紛紛議論。直到阿里正式認領 HappyHorse,謎團揭開,這匹快樂小馬出自自家新成立不到一個月的 ATH 事業群。
今天,阿里公布了 HappyHorse 1.0 的體驗渠道,千問官方首發灰測,千問 APP 和千問創作Web端都能直接使用。
![]()
移動端(千問 APP),我們只需將千問更新到最新版本,通過點擊首頁的「HappyHorse」膠囊,即可直接進入 HappyHorse 1.0 的生視頻創作面板,并且千問還贈送了免費體驗額度。
![]()
PC 網頁版(千問創作 Web 端),針對有更專業創作需求的用戶,可以通過瀏覽器打開 c.qianwen.com 登錄使用。網頁端每次生成消耗積分,綜合對比下來,還是比較具有性價比的。
無論是文生視頻還是圖生視頻,均支持最高 1080p 的視頻分辨率。我們可以自由選擇 16:9、9:16 或是 1:1 的視頻寬高比,生成時長可選 5 秒、10 秒或15 秒,并且支持原生生成音頻。
APPSO 第一時間拿到了體驗資格,評測榜單的排名能說明結果,但是 HappyHorse 1.0 生成的視頻,到底有什么優點,一起來看看我們的實測。
![]()
通過實測,能看到其實 HappyHorse 1.0 并沒有在復雜的全能參考選項上做文章,而是將核心發力點放在了動作、聲音、空間的自然度上,加上合理的鏡頭語言,和風格的準確還原,整體表現確實驚艷。
用一句指令,直接搞定運鏡和故事板
大部分的主流視頻模型,都會把鏡頭運動當做一個庫,給用戶來調用。所謂的鏡頭運動,更像是從這些庫里,推進、拉遠、旋轉,隨機挑一個運鏡方式,并沒有配合畫面里正在發生的事情。
而鏡頭感作為視頻最重要的一部分,往往一眼就能感受到明顯的差距,但它本身又很難用具體數值來量化。
![]()
HappyHorse 1.0 的處理方式也表現得可圈可點,切換鏡頭的時機必須是服務于作品。情緒需要收緊的地方,鏡頭近一點;需要交代環境的地方,給我們全景;背后是一套有敘事邏輯的調度。
同樣一個提示詞,丟給多個模型生成的視頻畫面,可能都會偏向「固定機位」,人物站在中間,缺乏鏡頭調度。因為這樣最不容易出錯,但是給視頻的觀感又大打折扣。
HappyHorse 1.0 在生成的視頻里,則是像一個懂行的攝影指導,各種大師級運鏡,從全景到近距離跟拍馬蹄的揚塵,再流暢切換到低角度仰拍拔槍的瞬間。
![]()
它打破了傳統的 AI 視頻生成模型「為了穩妥而選擇平庸」的安全構圖,用大量扎實的鏡頭調度,把這段追逐戲的動態張力,原原本本地拍了出來。
情緒和動作都有了層次感,微表情也能演戲
對于很多視頻模型,人物動作是最難解決的問題。即便使用詳細的參考生成,到了后半段還是容易出現變形,比如手指多一根、臉部模糊或者動作節奏突變。
但 HappyHorse 1.0 在這個硬指標上表現非常穩定,一段 5 秒的視頻,人物動作從頭到尾基本保持連貫,穿幫的頻率明顯更低。
![]()
舉個具體的例子,我們用的提示詞是一個穿著白色裙子的女生走在花海里,從畫面的左邊走到右邊,鏡頭跟隨,女生轉動裙子,捧起一朵花聞。
HappyHorse 1.0 給的動作過渡非常自然,女孩在花叢中走路完全沒有那些「太空步」的滑移,從她轉動裙擺,到捧起花朵湊近鼻子,整個動作流程行云流水。
![]()
動作有層次感,人物的表情同樣真實。我們生成了一個小朋友咬下酸檸檬的視頻,從咬下檸檬的瞬間,到強烈的酸味,開始帶來面部肌肉緊繃、五官皺起、緊閉雙眼,再到酸勁兒逐漸過去,面部肌肉慢慢放松,最后茫然地重新睜大眼睛。
通過動作和表情,讓人物的情緒更有層次感,HappyHorse 1.0 生成視頻也更不容易讓人出戲。
官方數據顯示,HappyHorse 1.0 的內部 GSB(Good-Significant-Bad 人類偏好評分)是 Wan2.7 的 3 倍,動作流暢性和清晰度都進步明顯。
對話聽起來更像真人,環境音也開始參與敘事
除了畫面表現,HappyHorse 在 AI 視頻配音上的表現也比其他模型更出色。
大部分的 AI 視頻配音,都有一個很難繞開的問題:聽上去像在「念」,不像在「說」。
語氣是平的,語調不跟著情緒走,兩個人對話的時候,一方說話,另一方就在那里等著,沒有反應,沒有表情變化,像兩個人在分別完成自己的任務。
![]()
HappyHorse 1.0 在這里的處理,是對白真的有情境感。語氣和語調貼著畫面里的情緒,驚訝的時候語調是對的,輕松的時候節奏是松的。多人對話的場景里,聽的那一方也是自然,會有表情,有細微的肌肉反應,不是在發呆等下一句。
環境音也是一樣的邏輯。書寫聲、翻頁聲、遠處的背景音,這些細節在大多數視頻模型里是缺席的,或者聽上去是從音效庫里隨機抓來的。
HappyHorse 1.0 里,這些聲音跟畫面里正在發生的事情是對得上的,而且能參與情緒。在安靜的場景里,出現一點紙張摩擦聲,或許比大多數配樂都更容易讓人有沉浸感。
![]()
還有一個比較小眾但實用的能力:多語言的唇形同步,覆蓋了普通話、粵語、英語、日語、韓語、德語、法語等語言。
輸入中文文本生成人物說話的視頻,嘴型就能跟上語音。這個能力的想象空間相當大,從短視頻配音到虛擬主播,未來都會用得上。
不需要復雜的風格提示詞,輕松拿捏經典影視劇風格
如果說前面關于鏡頭、動作和聲音幾點解決的是 AI 視頻的硬件問題,即 AI 視頻不能讓人出戲;風格的還原,則是讓最后的畫面更有戲。它會開始用色彩、光影和質感,去建立屬于創作者的美學氛圍。
風格的添加也很講究,不是套一層濾鏡,或者一個打包好的 LUT 包,它也需要視頻模型對不同美學風格的了解,以應用合適的風格化。
![]()
HappyHorse 1.0 在特定風格的還原上,細節非常扎實。各類經典影視劇的風格、老港片里膠片的顆粒感和偏冷的高光,我們在實測的生成結果里面都能看到。
![]()
無論是老水滸/三國畫風那種粗糲寫實的歷史厚重感、光影迷離的經典港風,還是強調高反差冷峻光影的美劇質感、主打細膩柔光的韓劇氛圍,它都能精準拿捏。
![]()
如果你是個對畫面質感有追求的創作者,非常推薦去千問里親自感受一下這種「導演級」的美學控制力。
AI 視頻賽道需要一匹黑馬
告別了動輒半天的視頻生成排隊,一個 Video Arena 榜單第一的模型,現在不僅直接放到了手機 App 里隨手可用,還給了免費體驗額度,千問這波實在是給力。
回頭看 HappyHorse 1.0的這幾個特點,動作不穿幫、鏡頭有語言感,解決了 AI 內容質量的可預期性,讓我們不用再抱著「抽卡」的心態,去體驗 AI 視頻生成。
對白自然、真實的環境音、還有精準的風格化還原,更是讓我們和創作者少了大量的后期修補成本,不需要在多個工具之間來回倒騰。
如果把這種極低門檻、高容錯率的生成能力放到具體的商業語境中,價值是顯而易見的。
對于新媒體運營、短劇導演或是電商營銷團隊而言,過去需要龐大后期團隊和高昂拍攝預算才能完成的分鏡預演、概念設計或視覺短片,現在只需在手機或電腦上輸入指令就能快速落地。在千問里,一個人就是一支高效的視聽制作團隊。
![]()
▲現在我們在千問里,就能得到一段真實的虛擬主播視頻
過去一段時間,視頻生成賽道的競爭邏輯是「誰的模型更強」——更高的分辨率、更長的時長、更復雜的物理模擬。
拼的是參數和算法的技術競賽,但我們真正卡住的地方很少是因為「模型做不到」,大多數時候是「做到了但用不起或用不到」,等待時間太長、聲畫要分開處理、動作穩不穩全靠運氣,每一個環節的摩擦都在把視頻生成擋在專業用戶和 AI 超級創作者之外。
而這一次,千問不僅省去了我們在不同工具之間切換的折騰,把最頂級的視頻生成能力直接放到了最熟悉的對話框里,更借助底層模型的實力,把這些創作摩擦一個個徹底抹平了。
![]()
▲千問現在是工作、學習、生活和創作中全能 AI 助手
HappyHorse 無疑是一匹強勁的黑馬,他是阿里新成立的 ATH 事業群,在模型能力、平臺分發、具體應用這條完整鏈條上的一塊關鍵拼圖;在千問首發灰測后,鏈條開始跑起來了。
從幫助用戶解決日常問題、提升工作學習效率的文本對話,到如今整合了極高水準的 AI 生圖與視頻能力,千問的進化路徑已經非常清晰:它正在打破「生活提效」與「專業創作」的壁壘。
通過一次次的功能迭代,千問正將頂級的算力平民化,真正從一個簡單的問答工具,蛻變為一個覆蓋用戶全場景的「全能型 AI 助手」。
作為普通人,我們或許不需要關心背后復雜的算法架構,因為最好的技術,已經通過千問以最順滑的方式裝進了你的手機里。
![]()
現在,輪到大家上場了。
如果你也想體驗 HappyHorse 1.0 強大的視頻生成能力,千問還同步開啟了「天馬行空」挑戰賽。一共四大 AIGC 視頻賽道,20 萬現金獎池等大家來拿。
直接前往千問 App 或千問創作 Web 端,用靈感在這個沒有門檻的新畫布上,真正「天馬行空」一次。
*文章內視頻播放可點擊該鏈接預覽*
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.