網易首頁 > 網易號 > 正文申請入駐

AI視頻有了音畫同步后，我想看看語音合成能不能活下來

2026-02-18 20:03:18　來源: 卡爾的AI沃茨

北京舉報

分享至

最近的AI視頻模型，幾乎都能做音畫同步了。

給它一段臺詞，人物開口說話，嘴型能對上，背景里還有環境聲，連語氣都能帶點情緒。

以前的制作流程都是先把畫面生成出來，然后再用語音合成模型合成配音，做音樂，最后再對口型和剪輯成片。

AI視頻自己就能搞定聲音的話，語音合成是不是可以被優化了？問題是現在的AI視頻是片段式的生成，一次性支持生成 15 秒，在展現一段比較長的戲時，受到時長限制，整個表演的情緒是斷掉的，也比較容易銜接不上。

我做了一個年初二拜年被七大姑八大姨催婚的經典片段來對比看看，

這段視頻里，AI視頻是分段做出來的，有的片段要在十幾秒的內容里塞入大量的對話，這會導致AI說話語速超快，偶爾也會因為時長不夠，導致話沒說完就被切斷的情況。仔細聽AI出的音色，在不同的片段中，其實還是會有些不太一樣。

但如果我們轉個思路，用音頻來驅動畫面生成的話，就不會出現這種情況了。

在成熟的AI視頻短片的制作角度上來看，對于對話片段或者是以語言表達為主的畫面，可以先生成音頻，直到產出比較滿意的情緒，然后再使用這段音頻去驅動同等時長的人物說話鏡頭。

像Minimax最近推出了新版本Speech-2.8。

minimaxi.com/audio

這個版本跟之前不太一樣的地方就是，新增了在一整段音頻中添加不同的情緒、可以在句子中間，詞組之間增加停頓，可以直接在括號里面加入一些語氣詞（比如輕笑、吸鼻子、清嗓子等等）等功能。

就上面圖中這個提示語，我們先來聽聽效果，

從整個音頻的這一段話中，能夠感覺到情緒是從開心到難過，到有點釋然，再到有一點點難過的轉變過程。這個放到AI視頻里，可能就是需要抽卡了。

MiniMax Speech-2.8現在可以在句子中間加入吸氣、嘆氣等換氣方式。這種模擬真人說話的細節非常靈活，可以根據我們自己的需求，把這些語氣加入進去。

我又嘗試了一下更明顯的情緒轉變，像是講一個冷笑話的感覺，從原本恐懼的情緒突然轉變為開心的情緒，講述自己實際上看到的并不是恐怖的東西，這有一種突然放松的感覺。

我們能加入的這些非語言性的語氣詞，其實就是在輔助情緒的表達，讓整個 AI 生成的語音更加符合人受驚嚇時的本能，讓整段聲音表演的情緒轉化更自然。

或者我們在給一些影片進行風格化的旁白配音的時候，也可以使用 MiniMax。

以前用AI生成語音，其實很難做到自然的換氣。你會發現 AI 往往會一口氣說出很長的一段話，讓人有一種喘不上氣的感覺。但在 MiniMax Speech-2.8 里，是可以在一句話的中間加入「正常換氣」這個語氣詞。

甚至現在還有一些更有意思的東西。比如在語氣詞里加入哼唱，我們在制作一些比較調皮、可愛的角色時，可以在他說話的前面加上一段哼唱，這樣表現出來的效果就會更加生動。

而且我這里發現了一個小tips，如果你想要它連續哼唱出來一段旋律，可以連續多添加幾個「哼唱」的語氣詞，將這些語氣詞疊在一起，它就可以輸出一段用你選中的音色哼唱出來的旋律，聽起來更活潑。

或者，在表達某些感受的時候，其實也可以用上這些語氣詞。就比如說在表達很疼、很痛的時候，可以用這個「嘶嘶聲」。這能很好地表現出人物被碰到傷口時那種撕拉的疼痛感，非常有現場感。而且我發現只要你疊的語氣詞數量越多，它呈現的語氣程度就會越重，越明顯。

而且 MiniMax 已經內置了非常豐富的音色選擇，適配非常多的角色。但如果你覺得這些預設音色都不太適合自己的角色，還可以用提示語自己設計一個專屬音色。

然后返回語音合成頁面，寫好你在這個語音中需要的文本，以及上面我們介紹過的那些語氣詞和情緒。最后在右面選擇你剛剛生成的音色，就能得到一段完全自定義的音頻了。

后續你還可以一直使用這個音色進行持續不斷的生成，相當于自己創建了一個聲優角色。

而且現在還是進去就有10000積分可以直接用，已經夠生成很多很多音頻片段了。

這一圈體驗下來，我已經想好什么時候用音畫同步，什么時候用語音參考生成視頻了。

AI視頻模型的音畫同出，解決的是效率問題，它讓普通人也能快速產出基本完整的視聽內容。

但MiniMax Speech-2.8解決的是完成度的問題。

對于成熟的漫劇，短劇，甚至電影制作來說，

畫面和聲音，通常都需要被分開打磨。

你需要一個獨立的配音棚，去保證所有角色音色的統一，去補錄那些不夠完美的表演，去為一個關鍵鏡頭，反復調整演員說話的口氣和節奏。

這就是我們平時在看影視劇的時候會發現，

除了拍攝影視劇的總導演之外，

實際上經常會有一個聲效導演的職位，

他的職責就是去把控整部影片的聲音問題，

讓影片的聲效在配合高質量畫面的同時，也能夠給大家帶來聽覺上的沖擊。

所以即便是有了演員的現場錄音，但可能因為表演時的情緒或者是口音問題，還是會讓演員在后期對自己的表演進行重新配音。

MiniMax Audio讓我們也可以低成本即可實現專業配音效果，

按照我們的想法去調整音色，語速，語氣詞，

讓一句話中擁有不同的情感層次。

畢竟，讓畫面擁有生命力的，是表演。

而讓表演擁有靈魂的，

往往是聲音。

@ 作者 / 卡爾 & 阿湯

最后，感謝你看到這里如果喜歡這篇文章，不妨順手給我們點贊｜在看｜轉發｜評論

如果想要第一時間收到推送，不妨給我個星標

如果你有更有趣的玩法，歡迎在評論區聊聊

更多的內容正在不斷填坑中……

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

中國AI Agent產業化參考范本：斑馬口語攻克的四大技術難關

機器之心Pro 2025-11-18 14:12:50
0 跟貼 0
Rabbit又行了？油管大V改口，將發第二款AI硬件

鈦媒體APP 2026-03-21 15:54:59
0 跟貼 0

AI錄音卡也有“龍蝦能力”了！紀要報告PPT一體生成

智東西 2026-03-20 20:20:32
0 跟貼 0

別急著教AI開車，先讓它看懂世界

虎嗅APP 2026-03-21 17:36:05
0 跟貼 0
又一部值得熬夜狂追的諜戰劇，才播2集口碑直接炸了，全程高能

樂楓電影 2026-03-21 14:08:29
0 跟貼 0

【場面】中國最大球幕影院完成主體結構建設，今年三季度投用

上觀新聞 2026-03-20 20:16:19
1 跟貼 1

葉淺予的白描舞蹈人物

中國藝術家 2026-03-21 05:24:34
0 跟貼 0
觀文｜溫潤訴說直抵人心

齊魯壹點 2026-03-20 14:04:21
0 跟貼 0

原來青春從沒有走遠，它只是藏在每一句熟悉的歌詞里，等一個旋律

可愛的巴比龍 2026-03-18 02:06:49
1 跟貼 1
聽過這首歌的現在多大了，熟悉的旋律響起是否勾起對童年的懷

江峰聊情感 2026-03-21 13:53:04
0 跟貼 0
《人物》雜志與周深對談超精彩，采訪一針見血值得一看！

涼了時光人 2026-03-21 12:02:15
1 跟貼 1
八歲女孩跟著父親去吹嗩吶，技術嫻熟，主家給了她一聯AD鈣奶

看曉天下事 2026-03-20 10:34:01
0 跟貼 0
新手第一臺古箏怎么選？看完這篇沒人敢坑你

月灑半窗 2026-03-20 17:44:33
0 跟貼 0
盤點四款敦煌、月牙古箏四千到六千價位古箏

月灑半窗 2026-03-20 17:53:52
0 跟貼 0
浙西宋詞之河作曲征集優秀作品展播｜聽，毛滂《惜分飛·富陽僧舍代作別語》

IN衢州 2026-03-20 23:06:55
0 跟貼 0
復刻、長語音、對話、指令、音效全覆蓋！2

機器之心Pro 2026-02-11 17:01:24
0 跟貼 0
情歌對唱配音《你是我的全部》旋律優美動聽

美的浪漫56音樂 2026-03-20 17:07:17
0 跟貼 0
10萬字劇本一鍵成片，首個搭載Seedance2.0的短劇Agent有多強？

新劇觀察員 2026-03-20 19:45:31
0 跟貼 0
“媽，門口要錢，我們就不進去看你了”，游客在壺口瀑布外拍視頻被投訴侵權，山西壺口瀑布景區：事發地是陜西壺口瀑布，我們也是受害者

觀威海 2026-03-18 14:47:02
35938 跟貼 35938
杭州男子車庫停車被撞，女子下車連撞三次，電話錄音驚人曝光

嘻哈搞笑局 2026-03-19 00:00:00
0 跟貼 0
江蘇省省管領導干部任職前公示

江蘇新聞 2026-03-20 18:08:11
131 跟貼 131
在AWE現場和安克副總裁聊錄音豆是什么體驗？！

李大錘同學 2026-03-21 12:00:00
0 跟貼 0
柴桑大姐今天放了許敏當時在會議上的錄音，很是傷感

春風自如 2026-03-20 09:34:42
0 跟貼 0
上個月去了趟湖北隨州，我實話實說：當地人的素質讓我大開眼界

眼底星碎 2026-03-20 12:14:20
0 跟貼 0
古人真實口音根本不是中國話？音頻復原現場，歷史學家全沉默了！

爆笑星河 2026-03-21 01:27:31
0 跟貼 0
成品油價即將迎來“五連漲”，下周一加滿一箱油可能將多花80元，周末記得加滿油

揚子晚報 2026-03-21 07:37:10
15490 跟貼 15490
不完美那就自定義

奶油蜜桃 2026-03-18 14:08:00
203 跟貼 203
上海市中心知名醫院要“沒了”？網友感嘆曾經“早上5點去排隊搶號”；醫生發文“世上再無”，最新情況→

新民晚報 2026-03-20 19:27:19
1013 跟貼 1013
東北妹模仿多種音色太厲害了，京劇《沙家浜》選段

小七愛說唱 2026-03-20 19:31:41
4 跟貼 4
1101套房只有1人選房，深圳一安居房項目屢戰屢“冷”

南方都市報 2026-03-20 22:14:18
769 跟貼 769
音頻披露：穆杰塔巴因片刻之差幸免于難

參考消息 2026-03-21 12:45:04
1 跟貼 1
阿里、Kimi、螞蟻集體押注，混合注意力從可選項變必答題？

智東西 2026-03-20 19:27:31
0 跟貼 0
上海百年老店官宣閉店！曾經去吃頓飯可要一大早就排長隊，承載了幾代人的記憶，不少阿姨爺叔的“第一次”

上觀新聞 2026-03-18 17:41:49
963 跟貼 963
一曲經典的《北國之春》，DJ版薩克斯演奏，音色美妙娓娓動聽！

金薩克斯音樂 2026-03-18 10:00:22
4 跟貼 4
網傳新畫面，殲35艦載機也有外掛模式

三叔的裝備空間 2026-03-20 22:27:31
0 跟貼 0
情歌對唱配音《月夜相思情》旋律優美動聽

美的浪漫56音樂 2026-03-20 18:40:55
0 跟貼 0
匈牙利和斯洛伐克堅決反對，峰會氣氛冷淡尷尬，歐盟未通過900億歐元援烏貸款

環球網資訊 2026-03-21 07:07:24
78 跟貼 78
告別「叛逆期」！3199 元起的Nothing新手機來了，顏值在線

雷科技 2026-03-21 00:03:50
22 跟貼 22
打破華語樂壇紀錄，周杰倫新歌《太陽之子》MV制作費超2000萬

封面新聞 2026-03-21 16:44:04
0 跟貼 0
火爆楊曦我媽記性不好，總說我沒分寸

趕海父子海產品 2026-03-19 22:58:57
0 跟貼 0

卡爾的AI沃茨

前大廠算法工程師，3家科技公司技術總監｜致力打造最系統的Al學習體系，讓1萬人通過Al提高生產力

232文章數 117關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

教育

手機

本地

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
古代的馬真能日行八百里嗎
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

AI視頻有了音畫同步后，我想看看語音合成能不能活下來

宇樹招股書拆解，人形機器人出貨量第一！

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

誰在決定字母哥未來？

CMG盛典獲獎名單：章子怡高葉同獲影后

通脹警報拉響，加息潮要來了？

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

全城狂送1000杯咖啡！網易房產【早C計劃】，即刻啟動！

市委書記，任大學黨委副書記

OPPO新機、平板齊曝光，還有一加15T詳細參數

春色滿城關不住｜紹興春日頂流，這片櫻花海藏不住了

伊朗發射3800公里射程的導彈最令美軍戰栗的細節披露

伊朗發射3800公里射程的導彈最令美軍戰栗的細節披露

小鵬汽車2025年Q4盈利凈賺3.8億全年營收767億