新音樂產(chǎn)業(yè)觀察原創(chuàng)文章,未經(jīng)授權(quán)謝絕轉(zhuǎn)載
作者 | 朱力克
AI音樂的爆發(fā)式增長,讓不少人聞到了致富的味道。
一位程序員用AI作曲、編曲、演唱,最終得到了2025年火遍全網(wǎng)的爆款神曲《七天愛人》,輕松躺賺五位數(shù)的版稅收入。
似乎只要?jiǎng)觿?dòng)手指,人人都能輕松利用AI名利雙收。然而現(xiàn)實(shí)并沒有那么豐滿,試圖復(fù)刻《七天愛人》的人們最終發(fā)現(xiàn)自己并沒有起飛,連原作者本人的續(xù)作《八天愛人》也沒能再現(xiàn)前作的成功。
成千上萬跟風(fēng)創(chuàng)作的AI音樂作品,大多淹沒在平臺(tái)的信息洪流中,聽眾的新鮮感在快速消退。與此同時(shí),平臺(tái)開始對(duì)AI生成內(nèi)容進(jìn)行標(biāo)注與治理,版權(quán)爭議頻繁出現(xiàn),行業(yè)從鼓勵(lì)嘗試進(jìn)入優(yōu)勝劣汰的階段。
一個(gè)明顯的變化正在發(fā)生,AI音樂不再是誰都能靠噱頭輕松出圈的領(lǐng)域。在經(jīng)歷野蠻生長之后,這個(gè)賽道正在迎來真正意義上的下半場。
熱鬧之后,AI音樂迎來大分化
敏銳的人已經(jīng)意識(shí)到,AI音樂正在從娛樂型生成工具,進(jìn)化為專業(yè)級(jí)生產(chǎn)工具。
2026年伊始,很多人還沉迷于流量博弈時(shí),國際大廠牌華納音樂推出了AI武俠虛擬偶像吳愛花,MiniMax推出對(duì)標(biāo)格萊美標(biāo)準(zhǔn)音質(zhì)的音樂生成模型MiniMax Music 2.5。高階玩家和專業(yè)巨頭的入場,拉開了AI音樂下半場的序幕。
![]()
回顧過去一年AI音樂內(nèi)容的發(fā)展,新的轉(zhuǎn)折到來并非偶然。最早一批AI音樂創(chuàng)作者,幾乎走的是同一條路,低成本、低質(zhì)量批量生成歌曲,賭爆款。《七天愛人》據(jù)說制作時(shí)間只有2個(gè)小時(shí)。它提供了一個(gè)看似清晰的模板:旋律抓耳、情緒濃烈、適合短視頻傳播。
這構(gòu)成了AI音樂內(nèi)容的第一層分化。
在草莽時(shí)代,相比原創(chuàng),二創(chuàng)更是屢試不爽的流量密碼。孫悟空與搖滾的融合,讓《美猴亡》收割了上千萬點(diǎn)擊;網(wǎng)友自發(fā)的接力狂歡,把老歌《大東北我的家鄉(xiāng)》推成跨時(shí)代的標(biāo)桿;《技能五子棋》吸引了諸多明星競相翻唱,話題熱度高達(dá)十億。
這又帶來了AI音樂內(nèi)容的第二層分化。
二創(chuàng)容易火,卻容易遭遇版權(quán)風(fēng)險(xiǎn)與平臺(tái)整治。一部分創(chuàng)作者逐漸意識(shí)到,僅靠生成歌曲本身,很難形成持續(xù)影響力,于是開始從做歌轉(zhuǎn)向做人。打造數(shù)字人、虛擬歌手、虛擬IP,讓音樂成為IP內(nèi)容的一部分。
虛擬歌手@Yuri尤栗 的第一個(gè)MV《SURREAL》在全網(wǎng)收獲了超1200萬的播放量,連續(xù)4次登上B站熱門榜,成為2025年AIGC領(lǐng)域的現(xiàn)象級(jí)IP。
![]()
原創(chuàng)IP更有空間,但考驗(yàn)的是包括視覺制作、內(nèi)容運(yùn)營與持續(xù)創(chuàng)作在內(nèi)的綜合能力。因而,打造原創(chuàng)IP的音樂人需要的不止是一個(gè)AI音樂模型,更需要視覺能力。這與MiniMax多模態(tài)的路線也不謀而合,手握海螺AI,他們能出圖片、視頻、語音、音樂,成為不少數(shù)字人作者的創(chuàng)作平臺(tái)。
在分化背后,是創(chuàng)收路徑的進(jìn)一步分裂。一類創(chuàng)作者是靠音樂本身的版權(quán)收入,但極度依賴個(gè)人審美與市場運(yùn)氣;另一種則更偏互聯(lián)網(wǎng)邏輯,通過IP賬號(hào)接廣告、做品牌合作。
吳愛花與華納音樂的合作、MiniMax Music 2.5的出現(xiàn),則是更具行業(yè)意味的邁進(jìn)。AI虛擬偶像開始被傳統(tǒng)唱片公司納入體系,用藝人邏輯進(jìn)行打造。隨著專業(yè)玩家入場,越來越多創(chuàng)作者開始尋找更專業(yè)、更可控、更接近真實(shí)制作流程的工具,最新升級(jí)的MiniMax Music 2.5恰好踩在這一轉(zhuǎn)折期。
![]()
明顯的變化是,和一年多之前人們眼中的“內(nèi)容污染”不同,這一代AI內(nèi)容的質(zhì)量更高、傳播更廣,創(chuàng)作者也在AI領(lǐng)域有一定持續(xù)積累和嘗試,技術(shù)的推進(jìn)總會(huì)帶來對(duì)內(nèi)容和產(chǎn)品的更高需求。
AI音樂,必須跨過幾道門檻?
如果要找一個(gè)最直觀的行業(yè)轉(zhuǎn)折案例,最近在海外刷屏的“戲仿格萊美”視頻幾乎是最佳注腳。
這段在YouTube走紅的視頻,乍一看真以為是“格萊美頒獎(jiǎng)”,但仔細(xì)一看會(huì)發(fā)現(xiàn),這其實(shí)是Groovy 2026頒獎(jiǎng)。但獲獎(jiǎng)藝人ARIA GRANE、THA WKEND、BILLY ASH又都似曾相識(shí),每個(gè)人的MV、演唱也都惟妙惟肖。
![]()
這是海外創(chuàng)作者用 MiniMax Music 2.5生成的,并以戲仿格萊美頒獎(jiǎng)典禮的形式呈現(xiàn)。這類案例之所以引發(fā)討論,并不是因?yàn)锳I又能寫歌了,而是因?yàn)樗鼘?shí)現(xiàn)了三個(gè)核心維度的跨越,逼近“格萊美音樂標(biāo)準(zhǔn)”。
首先,打破“AI沒情感”的技術(shù)僵局。
AI音樂之所以長期被認(rèn)為“沒有情感”,在于算法難以理解音樂內(nèi)部的情緒起伏與結(jié)構(gòu)遞進(jìn),生成的往往只是情緒碎片的堆疊。在新一代作品中,前奏鋪墊、主歌推進(jìn)、副歌爆發(fā)、橋段轉(zhuǎn)折,都具備清晰結(jié)構(gòu)與情緒層次。
有音樂區(qū)UP主嘗試用MiniMax Music 2.5 模擬“A 妹”愛莉安娜·格蘭德(Ariana Grande)的音色生成中文歌曲,結(jié)果那標(biāo)志性的 5A 高音連擊穩(wěn)得讓人頭皮發(fā)麻。更難得的是,那些自然的轉(zhuǎn)音與顫音中,竟帶著一種極其抓人的破碎感與情緒張力。
![]()
其次,對(duì)齊行業(yè)制作標(biāo)準(zhǔn)。
過去AI音樂常見的問題包括人聲塑料感強(qiáng)、樂器層次模糊、頻段混疊嚴(yán)重,很難進(jìn)入商業(yè)使用場景。而在新模型中解決了困擾行業(yè)已久的聲音混疊問題,即使在樂器密集的編曲場景下,也能保持各聲部的清晰分離。不同曲風(fēng)會(huì)自動(dòng)匹配相應(yīng)的聲音設(shè)計(jì)方式,這讓AI音樂第一次具備了錄音室完成度。
“戲仿格萊美”視頻中復(fù)刻了多位格萊美入圍歌手的作品,從編曲到配器極度還原原歌手風(fēng)格,甚至演唱也能清晰捕捉到每一次吐字的口齒摩擦;另一位MiniMax Music 2.5 玩家模擬賈斯汀·廷伯萊克(Justin Timberlake)的音色創(chuàng)作了一首雷鬼歌曲,評(píng)論區(qū)有人驚嘆“氛圍感直接拉滿。”
![]()
最后一道門檻,也是最難的門檻,是AI對(duì)創(chuàng)作意圖的深度理解與交互能力。
在專業(yè)的音樂語境里,需求的表達(dá)往往并不那么精準(zhǔn)。當(dāng)一個(gè)音樂人說“這段貝斯要更有‘顆粒感’”或者“人聲要帶點(diǎn)‘深夜的冷清’”時(shí),傳統(tǒng)的AI只能通過關(guān)鍵詞檢索樂器或音色,結(jié)果往往驢唇不對(duì)馬嘴。
專業(yè)的AI模型能聽懂音樂人的語言,而不是在“模糊的感覺描述”下套模版。MiniMax Music 2.5 不僅可以用14種結(jié)構(gòu)標(biāo)簽來規(guī)劃樂句,還能根據(jù)創(chuàng)作者意圖實(shí)時(shí)優(yōu)化,你甚至可以在風(fēng)格提示詞中描述速度(Tempo)、調(diào)子(key)、情緒(mood)等具體要素。模型能夠根據(jù)你的實(shí)時(shí)意圖進(jìn)行語義級(jí)的優(yōu)化,而不僅僅是簡單的參數(shù)調(diào)整。
![]()
(圖出處:音樂博主 @呆若木一在此)
海外已有博主用MiniMax Music 2.5生成整首搖滾歌曲《Just Ash》,即便用耳機(jī)細(xì)聽,也會(huì)肯定這是一首可以直接進(jìn)入流媒體分發(fā)、可以作為成品交付的成熟創(chuàng)作。
當(dāng)AI開始具備結(jié)構(gòu)設(shè)計(jì)、情緒控制、工業(yè)級(jí)音質(zhì)與互動(dòng)調(diào)整能力,它才有可能真正進(jìn)入音樂產(chǎn)業(yè)體系。
下半場的真正贏家,會(huì)是誰?
如果從行業(yè)視角做一個(gè)相對(duì)冷靜的判斷,在這場殘酷的長跑中,最終的贏家絕非那些癡迷于“生成數(shù)量”的算力工廠,而是能夠真正理解音樂產(chǎn)業(yè)底層邏輯的技術(shù)力量。
更有機(jī)會(huì)脫穎而出的,是兩類能力疊加的結(jié)果:
一是能夠融入產(chǎn)業(yè)流程的系統(tǒng)型AI。
未來真正“上岸”的音樂AI,更像是基礎(chǔ)設(shè)施,而不是娛樂玩具。具備專業(yè)結(jié)構(gòu)控制、高保真人聲、風(fēng)格理解與混音能力的模型,更容易成為產(chǎn)業(yè)的一部分。
像在音樂市場上,一首歌想要達(dá)到格萊美級(jí)別的制作水平,通常需要調(diào)動(dòng)各種行業(yè)頂尖的資源才能完成,對(duì)于絕大多數(shù)人來說,這是極其昂貴的稀缺資源。
但新模型能將作曲、編曲、音色、混音等離散環(huán)節(jié),與內(nèi)容平臺(tái)及專業(yè)工作流深度整合的綜合體。它們將進(jìn)入影視配樂、游戲音樂、廣告制作、唱片制作等場景,提供穩(wěn)定質(zhì)量、可控輸出與高效率生產(chǎn)。
![]()
Music 2.5發(fā)布前夕,導(dǎo)演陸川宣布與MiniMax聯(lián)手,使用MiniMax旗下的AI視頻平臺(tái)海螺AI開發(fā)電影質(zhì)感級(jí)的AI漫劇和精品影視。這信號(hào)再明確不過了:AI正在從邊緣試探,正式涉入專業(yè)影視制作的深水區(qū)。
在這些場景中,創(chuàng)作的核心需求不是新奇,而是可靠。MiniMax Music 2.5 所呈現(xiàn)的方向,正貼近這一邏輯,不是比誰生成得更多,而是比誰更接近真實(shí)制作流程。
二是能為音樂市場創(chuàng)造增量的AI。
很多早期模型,本質(zhì)是在已有流行風(fēng)格中不斷復(fù)刻與拼接,爭奪的是存量審美空間。而真正具備長期價(jià)值的AI,必須具備強(qiáng)泛化能力,能夠跨語言、跨文化、跨風(fēng)格融合,帶來新的創(chuàng)作可能。
比如音樂人、UP主路哥嘗試用 MiniMax Music 2.5 做了一段“老外唱京劇”demo,把英文演唱方式與中國戲曲旋律自然融合。這既不是簡單模仿,也不是獵奇拼接,而是一種全新的音樂表達(dá)形態(tài)。
![]()
這種生產(chǎn)力普惠的受益者,遠(yuǎn)不止于音樂圈。一位從事教育行業(yè)的國外網(wǎng)友在看完 MiniMax Music 2.5 的演示后感嘆:“這簡直是福音!以后在教學(xué)視頻或游戲化學(xué)習(xí)項(xiàng)目中,可以直接加入格萊美級(jí)的背景音樂。”原本高不可攀的專業(yè)音質(zhì)變成了隨手可得的教學(xué)“插件”,真正實(shí)現(xiàn)了高質(zhì)量視聽語言對(duì)知識(shí)傳播的加持。
AI音樂真正的“上岸”,并不是某幾首爆款的出現(xiàn),而是技術(shù)能否被產(chǎn)業(yè)長期接納。上半場拼的是門檻降低與內(nèi)容規(guī)模;下半場拼的是專業(yè)深度與系統(tǒng)能力。那些停留在噱頭層面的產(chǎn)品,會(huì)逐漸被淘汰;留下來的,將是能夠進(jìn)入真實(shí)創(chuàng)作鏈條的技術(shù)力量。
人類創(chuàng)作者不會(huì)被取代,但角色正在發(fā)生變化。人類負(fù)責(zé)審美與創(chuàng)意方向,AI負(fù)責(zé)低成本、高效率的執(zhí)行與擴(kuò)展。這種協(xié)作邏輯將使得普通人只要擁有一個(gè)閃光的直覺,也能生產(chǎn)出專業(yè)級(jí)的內(nèi)容。讓創(chuàng)作回歸本質(zhì)、讓工業(yè)效率與個(gè)人意志達(dá)成和解,才是AI可能的終局。
-全文完-
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.