<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      實測可靈2.6:給AI視頻上了一堂聲音課

      0
      分享至


      中文視頻AI邁入“有聲之年”。

      作者|景行

      編輯|楊舟

      不得不感嘆AI大模型的進步速度。

      12月,可靈AI先是發布統一多模態視頻大模型可靈O1,緊接著閃電發布可靈2.6、數字人2.0。

      可靈2.6的發布,則讓困擾視頻工作者已久的聲畫不同步問題得到解決,其核心功能就是音畫同出,簡單理解,一次生成,能同時做出視頻和音頻,而且二者實時同步。

      其中,可選的音頻效果不僅涵蓋人聲對話、獨白,還提供環境音、效果音、樂器演奏乃至說唱等完整的音頻生態。

      在此之前,部分海外視頻模型已經在音畫同出領域做出探索,如Google Veo 3.1和OpenAI Sora 2,二者均能實現從口型到動作、聲音的同步生成,并與畫面完成匹配。

      但這些模型同樣存在弱點,如音頻控制力不足,同角色的不同片段聲音、語氣統一效果一般,對中文語音的理解不足導致腔調怪異,用戶調整困難等等。

      在可靈2.6發布后,「市象」也在第一時間試用了產品。在一系列測試后,可以確認的是,AI視頻模型,要對過去的創作流程徹底重構了。

      01從啞劇到聲臨其境

      AI視頻的音畫同出,并非最新功能,此前已有多模型能做到。

      “Sora 2是視頻生成領域的 GPT-3.5時刻。”

      這一表述來自今年9月,OpenAI的官方博客。伴隨新一代視頻生成模型Sora2發布,OpenAI公開表示,新模型的性能已經超越歷代模型,不僅在物理效果上更加精確,同時還配備了同步音頻功能。

      例如,在生成視頻時,能完成復雜的運動動作,或模擬真實運動場的物理表現,同時生成背景音、語音和音效,并將其融入到視頻當中。

      但面對Sora2、Veo3.1這樣的海外一線模型時,不少海外博主,表現出對可靈2.6的認可。

      “這比Veo3好多了!相比Veo3,它最大的優勢在于:原生支持1080p,這在畫質上帶來了巨大的提升。”

      這一表述來自海外視頻博主Simon Meyers,在分享中,他使用可靈2.6制作了一則預告片,并用各種復雜的提示詞來測試模型功能:

      “我嘗試了各種聲音和對話,沒有發現任何明顯的限制——音效、人聲,甚至歌聲都能完美呈現!當然,和所有視頻模型一樣,你仍然需要進行一些迭代,但這完全可以接受。語音聽起來很逼真,語調也十分精準,總的來說,這是一個巨大的飛躍。”


      在這段不到一分鐘時長的作品中,觀眾可以直觀感受到可靈2.6對音畫生成的理解:

      單人獨白、背景歌曲、視頻氛圍音效、吉他彈奏聲(甚至有遠景和近景下,兩種吉他音的不同表現)、歌唱聲、打擊樂器聲、氣球、攪拌器、電鉆、無人機、甚至結尾字幕配合的女聲吟唱,多種復雜音頻出現在同一作品中,互不干擾,并與畫面完美融合。

      另一視頻博主Curious Refuge選擇用新的方式測試可靈2.6——用四組畫面和生成詞,分別交給Veo3.1和可靈2.6,分別是俯拍鏡頭,兩位騎士騎馬穿越森林;推鏡頭,食客在面館吃拉面;特寫鏡頭,男子在帆船上獨白;固定中景鏡頭,男子吃掉餅干,并與寵物狗交流。

      結論是,可靈2.6的表現令人意外。


      在各項對比中,可靈2.6在多個測試成績上要超過Veo3.1,如場景生成、相機運動更符合生成詞等等。盡管在Veo 3.1的輸出結果中,也有部分表現出色,如音頻更為洪亮,但該博主的結論是,在這一輪測試中,可靈2.6略占上風。

      事實上,除音畫協同外,可靈2.6還重點強化了音頻質量和語義理解。前者會讓各類音效層次更豐富、接近真實世界的聲音效果;后者則讓AI對復雜劇情的理解能力更強,理解作者意圖。

      更多音頻元素的融入,則讓AI視頻效果直逼現實。除了單人講話外,可靈2.6支持多人多白、不同風格歌聲、環境音、物理音效,乃至多種音頻組合的混合音效。

      這意味著,創作者只需要通過文本描述,就能還原一個物理世界多重環境音的層次感與空間感,獲得一個無需后期修改的完整作品。

      02重構工作流

      過去的AI視頻模型,創作者的工序大概是這樣幾步:

      創作者思考創意,確定文字腳本、畫面分鏡等方向——由AI生成文、圖等素材——進一步通過素材生成視頻——后期生成配音和音效,并校對完成。

      其中,后期制作是最為耗時的環節之一。對剪輯從業者來說,無論是語音、效果音的制作和篩選,還是視頻的后期對軸,將音效與畫面逐幀對齊,這一工作對視頻質量的影響極大,不僅依賴經驗,且過程繁瑣,需要在視頻工具、音頻工具中反復切換,

      這讓可靈2.6的新功能重要性更為突出。在創作時,用戶只需輸入畫面、動作、聲音的三要素精確描述,就能獲得一段高質量的AI視頻。

      這意味著,無論用戶是否有AI視頻創作經驗,都能在可靈2.6模型中體驗無門檻的創作流程。

      具體方法十分簡單,在Web端可靈頁面中選擇視頻生成,文生視頻、圖生視頻均可選擇,在下方勾選“音畫同出”,并選擇品質模式、畫面比例和產出條數,輸入生成詞或參考圖即可。


      需要注意的是,要生成一條滿意的AI音畫直出視頻,用戶最好能對視頻畫面、動作、聲音三要素進行精確描述,如畫面細節,人物情緒、語速等。

      「市象」選擇文生視頻的方式,首先測試可靈2.6對歌曲、樂器的理解能力,生成詞如下:

      光線明亮的演播室,歌手正在一邊彈奏吉他,發出悠揚的吉他音樂聲,一邊用溫柔的聲音演唱中文歌曲。

      可以看到,視頻中歌手不僅通過自彈自唱方式演唱了一段原創歌曲,且口型、彈奏動作畫面與聲音形成契合。整個視頻不僅能實現畫面流暢、光影自然,在音頻層面則能做到旋律清晰,吉他演奏聲與人聲演唱層次分明,互不干擾。

      再如這段生成詞:中景,慢速推鏡頭,雨聲比較大的陰雨天,有短促的閃電,滿臉泥濘的消防員在雨中說,很高興,我們成功撲滅了大火。

      從視頻效果看,可靈按要求還原了雨天場景,同時表現出了雨水落在帽子上的物理效果,人物的獨白聲則與背景的雨聲獨立開來,形成有層次的混合音效體驗。

      03當AI學會說話

      在與羅永浩的播客對談中,影視颶風創始人TIM曾有這樣一番表述:在AI面前,創作者10年的努力都沒有價值。最多兩年,AI就能替換掉一個非常優秀的剪輯師。

      從產業場景來看,視頻AI正以閃電速度,從自媒體創意輔助者向全能的視頻生產力工具轉變。特別是可靈2.6將視頻模型音畫協同能力大幅提升后,一些過去依賴人工完成的創作工作,在AI面前將失去性價比優勢。

      例如在電商場景下,人工解說的效率將難以匹敵AI。

      未來的電商市場,一款產品的商品圖片,可以由商家自主拍攝上傳,商品賣點的口播,則可以由AI解說完成,具體到使用場景,AI可以幫助商家輕易搭建任何高成本、電影級質感的視頻背景,并清晰傳遞出產品優勢。如果憑借人力完成,其成本無疑將是天文數字。

      在廣告場景下,視頻AI則有更大的發揮空間。

      以可靈2.6的演示視頻為例,模型可高質量完成鏡頭調度、分鏡設計、音頻設計、配樂設計、動作設計、音畫結合等創作者近乎全方位的意圖。

      在過去,一條一分鐘左右的廣告宣傳片制作周期可能要花費數周,策劃、攝影、剪輯、配音、后期等工種則需要全程跟進,確保最終產出符合創意規劃。

      如今借助AI模型,創作者只需將創意交給AI來跑,借助文本生成、圖片生成等方式產出多個音畫協同的視頻作品并加以篩選,一些涉及到虛擬形象、特效等后期工作的效果,則能通過AI在幾分鐘內實現。

      比如文本描述“生成一些精靈,用手舉起目標產品”“讓商品跨出國門,飛向世界各地”等,這不僅效率大幅提高,更降去了大部分成本。

      可以說,只要一個行業存在視頻內容的產出需求,類似的改變就將持續發生。如自媒體創作、直播、播音傳媒、音樂MV、影視制作等等。

      一個肉眼可見的改變是,在短視頻平臺,部分經史人文類博主已經率先應用AI生成視頻素材,以節約創作時間。隨著可靈2.6發布,中文視頻模型音畫協同技術成熟,留給博主的創作空間還將進一步拓展。

      對所有相關從業者而言,這場聲音革命都迫使人思考,當長周期重投入的生產模式變成即時批量生產,當AI學會自己發聲,人應該掌握的,應當是把握創意和審美,教AI講好故事。

      本文為《市象》原創文章

      未經授權不得轉載或建立鏡像

      轉載、交流、合作請添加微信:MingFei_99

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      胖東來下架智利車厘子,工作人員:壞果太多、品質達不到要求,新上架了190元每斤的澳洲車厘子

      胖東來下架智利車厘子,工作人員:壞果太多、品質達不到要求,新上架了190元每斤的澳洲車厘子

      觀威海
      2026-02-13 09:34:10
      福建平潭發生火情,濃煙滾滾半邊天空都是火光;當地消防:林木和漁具等著火,無傷亡

      福建平潭發生火情,濃煙滾滾半邊天空都是火光;當地消防:林木和漁具等著火,無傷亡

      大風新聞
      2026-02-13 10:34:10
      當電車滲透率再度跌穿四成,證實日本車沒有反思是對的

      當電車滲透率再度跌穿四成,證實日本車沒有反思是對的

      柏銘銳談
      2026-02-13 17:29:03
      國外男子將普通家雞帶上萬米高空后隨即拋下,視頻引發網友憤怒!

      國外男子將普通家雞帶上萬米高空后隨即拋下,視頻引發網友憤怒!

      特約前排觀眾
      2026-02-13 00:15:05
      史詩級封殺!2000萬網紅“聽風的蠶”徹底涼了

      史詩級封殺!2000萬網紅“聽風的蠶”徹底涼了

      互聯網品牌官
      2026-02-12 01:17:23
      今年大批校長要落馬!

      今年大批校長要落馬!

      行者殷濤
      2026-02-13 16:21:19
      最新進展:日本放人

      最新進展:日本放人

      觀察者網
      2026-02-13 21:34:10
      應急管理部:加強煙花爆竹非法制售、儲存的排查打擊

      應急管理部:加強煙花爆竹非法制售、儲存的排查打擊

      環球網資訊
      2026-02-13 14:16:06
      浙江“一人公司”興起!前大廠程序員靠AI月入200萬元:“完全不需要員工”

      浙江“一人公司”興起!前大廠程序員靠AI月入200萬元:“完全不需要員工”

      環球網資訊
      2026-02-13 20:27:07
      國防部直接把話挑明了,家里有滿18歲男青年必須辦的就是兵役登記

      國防部直接把話挑明了,家里有滿18歲男青年必須辦的就是兵役登記

      南權先生
      2026-02-12 15:38:28
      張一鳴以一己之力單挑整個互聯網

      張一鳴以一己之力單挑整個互聯網

      磐石之心
      2026-02-12 12:01:31
      中國股市——2026年3月極具翻倍潛力的牛股名單!

      中國股市——2026年3月極具翻倍潛力的牛股名單!

      道說有財
      2026-02-13 13:58:28
      西方專家也很納悶:一年時間,全世界已經開始看不懂中國了!

      西方專家也很納悶:一年時間,全世界已經開始看不懂中國了!

      卷史
      2026-02-13 13:02:25
      日媒:高市早苗因手部病情惡化就醫檢查,在醫院停留約3小時45分鐘

      日媒:高市早苗因手部病情惡化就醫檢查,在醫院停留約3小時45分鐘

      環球網資訊
      2026-02-13 20:06:13
      蒸發8300億!原來是因為AI找到了500個連人類都找不到的致命漏洞

      蒸發8300億!原來是因為AI找到了500個連人類都找不到的致命漏洞

      李博世財經
      2026-02-13 14:26:29
      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      就一點
      2025-10-09 12:19:42
      “日掙千元”扛樓小伙回家陪爺爺過年:去年賺了約35萬,花20萬買了車,特意早點回家

      “日掙千元”扛樓小伙回家陪爺爺過年:去年賺了約35萬,花20萬買了車,特意早點回家

      大風新聞
      2026-02-13 10:55:04
      黑龍江一男子摔傷送醫急救直呼“餓了,要吃面包”,竟是全身血液已近流干,醫生質疑:不像摔得,有可能是車禍

      黑龍江一男子摔傷送醫急救直呼“餓了,要吃面包”,竟是全身血液已近流干,醫生質疑:不像摔得,有可能是車禍

      大象新聞
      2026-02-13 09:47:05
      李立群回河南祭祖,麥田跪拜落淚,一句以后可能不回了看哭全網

      李立群回河南祭祖,麥田跪拜落淚,一句以后可能不回了看哭全網

      一盅情懷
      2026-02-13 14:23:16
      7.6元網購2500克土豆,男子食用后連續兩年飽受折磨!醫生提醒

      7.6元網購2500克土豆,男子食用后連續兩年飽受折磨!醫生提醒

      新民晚報
      2026-02-13 15:07:33
      2026-02-14 02:04:49
      市象 incentive-icons
      市象
      研究真問題,書寫真洞察。
      400文章數 22關注度
      往期回顧 全部

      科技要聞

      獨家探訪蔡磊:答不完的卷子 死磕最后一程

      頭條要聞

      8千元的迷你小馬一夜爆火 馬主:1天排泄次數達十幾次

      頭條要聞

      8千元的迷你小馬一夜爆火 馬主:1天排泄次數達十幾次

      體育要聞

      這張照片背后,是米蘭冬奧最催淚的故事

      娛樂要聞

      大衣哥女兒風光出嫁,農村婚禮超樸素

      財經要聞

      華萊士母公司退市 瘋狂擴張下的食安隱憂

      汽車要聞

      探秘比亞迪巴西工廠 居然是這個畫風!

      態度原創

      本地
      房產
      家居
      數碼
      教育

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      房產要聞

      三亞新機場,又傳出新消息!

      家居要聞

      中古雅韻 樂韻伴日常

      數碼要聞

      閃極海外推出300W充電寶Shargeek 300:配DC接口+ 2C + 1A

      教育要聞

      專題歸納:高中地理人文地理知識點

      無障礙瀏覽 進入關懷版