網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI 音樂(lè)都發(fā)展成這樣了？藏師教你一鍵生成爆款 AI 音樂(lè)

2025-10-16 22:01:02　來(lái)源: 歸藏的AI工具箱

北京舉報(bào)

分享至

三天前的夜里，我正在刷抖音，刷到一個(gè)用 R&B 風(fēng)格唱的《一路向北》當(dāng)時(shí)就給我聽(tīng)麻了。

我當(dāng)時(shí)就是“早知道，還是原道”那個(gè)圖片表情，太震撼了，而且音頻非常清晰我都沒(méi)想過(guò)是 AI 唱的。

然后我就去作者的主頁(yè)看，又看到了《青花瓷》沒(méi)想到下面寫(xiě)著 Suno 5 。

臥槽，我當(dāng)時(shí)就傻了，就想 Suno V5 生成的歌我也聽(tīng)過(guò)啊，咋突然這么牛批了。

然后就陸續(xù)刷到了其他類(lèi)似的賬號(hào)，發(fā)現(xiàn)這類(lèi)用 AI 生成的音樂(lè)這幾天已經(jīng)非常火爆了，幾十萬(wàn)贊的比比皆是。

甚至最近最火的《技能五子棋》也是 AI 搞得。

于是我就去研究了一下新更新的 Suno V5 模型。

發(fā)現(xiàn)這玩意已經(jīng)更我印象里面只能寫(xiě)非常簡(jiǎn)單提示詞的 Suno 完全不一樣了，現(xiàn)在所有你能想到的元素他都能控制。

除了風(fēng)格提示詞外，你還能自定義歌詞和每段 Verse 的具體提示詞，甚至可以上傳音頻在此基礎(chǔ)上修改，你完全可以把他當(dāng)做一個(gè) AI 修音和混音員工去用，不只是純粹的生成。

另外還有更加專(zhuān)業(yè)的 Studio 模式，類(lèi)似專(zhuān)業(yè)音頻軟件可以分音軌生成和控制，非常。

經(jīng)過(guò)一段時(shí)間吭哧癟肚研究之后終于整理出來(lái)了一套簡(jiǎn)單易懂的工作流，哪怕你對(duì)樂(lè)理一竅不通也可以生成非常好聽(tīng)的 Remix 和原創(chuàng) AI 音樂(lè)。

這套流程主要有兩部分，也是最近爆火的 Suno 生成音樂(lè)的兩種流派。

一種是需要墊原來(lái)的音樂(lè)的，他還是原來(lái)的曲調(diào)，支持會(huì)重新混音和編曲演繹，比如我這里用陶喆風(fēng)格做的《擱淺》。

另一種是不需要墊原始的音頻的純提示詞生成，這種就只用原始歌曲的歌詞的，曲調(diào)會(huì)完全根據(jù)提示詞生成，比如我生產(chǎn)的這個(gè)用賈斯丁·比伯風(fēng)格做的《蘭亭序》。

好了我們開(kāi)始我們的教程，先教第二種也就是不需要墊音頻的版本。

這兩部分提示詞和設(shè)置完全相同，只是墊不墊音頻的區(qū)別。

我們進(jìn)到 Suno 之后，需要先切換到“Custum”這個(gè) Tab 的部分，這邊和對(duì)生成歌曲做詳細(xì)的設(shè)置。

先介紹基礎(chǔ)需要關(guān)注的部分界面內(nèi)容：

Lyrics：很明顯這部分就是歌詞，但是不止可以寫(xiě)歌詞，你可以對(duì)每部分歌詞進(jìn)行標(biāo)注，放在放括號(hào)里面的提示詞 AI 是不會(huì)唱的，可以理解為控制每部分歌詞的提示詞。
Styles：這部分就是我們認(rèn)為的的傳統(tǒng)提示詞了，主要描述整個(gè)歌曲的風(fēng)格、唱法和樂(lè)器編排等。
Vocal Gender：這個(gè)正常就是你生成音樂(lè)的演唱是男聲還是女聲
Weirdnes：這個(gè)叫怪異值，如果你玩過(guò) MJ 應(yīng)該很熟悉，數(shù)值越高生成的音樂(lè)就會(huì)越怪，跟主流音樂(lè)不同，更加復(fù)雜。
Style Influence：風(fēng)格遵循，就是生成音樂(lè)需要多遵循你的風(fēng)格提示詞，數(shù)值越低，模型的自由度越高。

所以你發(fā)現(xiàn)了，我們需要寫(xiě)兩部分的提示詞，首先是風(fēng)格提示詞，另一部分是每段 Verse 的提示詞來(lái)控制每段提示詞的演唱風(fēng)格。

你知道藏師傅的風(fēng)格的，我向來(lái)喜歡一步到位。

所以我整了一套提示詞，你只要發(fā)給 LLM，把你想要模仿的歌手名字和歌曲的歌詞給他，他就可以給出這兩部分的完整提示詞了。

Suno 音樂(lè)生成寶藏提示詞：

你是一名專(zhuān)業(yè)的 AI 音樂(lè)提示詞工程師。你的任務(wù)是根據(jù)用戶(hù)提供的【歌手名稱(chēng)】和【歌詞內(nèi)容】，為 AI 音樂(lè)生成模型（如 Suno, Udio 等）創(chuàng)建一套完整、專(zhuān)業(yè)且結(jié)構(gòu)化的提示詞。

你的輸出必須嚴(yán)格遵循以下兩個(gè)部分的格式和要求：

第一部分：全局風(fēng)格提示詞 (Global Style Prompt)

這一部分用于定義歌手的整體音樂(lè)特征和核心風(fēng)格。

要求：

內(nèi)容詳盡：必須包含以下四個(gè)核心要素：

核心曲風(fēng) (Core Genre): 例如 "Neo-Soul R&B", "Mandopop fusion", "Alternative Rock" 等。

標(biāo)志性樂(lè)器編配 (Signature Instrumentation): 例如 "piano-driven", "slap bass", "atmospheric synths", "string arrangements" 等。

音色與演唱技巧 (Vocal Timbre & Technique): 例如 "breathy falsetto", "forceful shout-singing", "mumbled storytelling flow", "emotive vibrato" 等。

制作與節(jié)奏特點(diǎn) (Production & Rhythmic Feel): 例如 "cinematic production", "behind-the-beat groove", "minimalist and atmospheric" 等。

語(yǔ)言：必須使用英文。

客觀性：描述必須專(zhuān)注于具體的音樂(lè)特征，避免使用主觀贊美或總結(jié)性評(píng)論（例如，不要說(shuō)“他創(chuàng)造了一種偉大的聲音”）。

第二部分：分段指令 + 歌詞 (Lyrics with Sectional Prompts)

這一部分將用戶(hù)提供的歌詞與動(dòng)態(tài)的、針對(duì)每個(gè)段落的編曲指令相結(jié)合。

要求：

自動(dòng)分段：你必須首先分析用戶(hù)提供的完整【歌詞內(nèi)容】，并將其智能地劃分為符合歌曲結(jié)構(gòu)的邏輯段落（例如：[Verse 1], [Chorus], [Bridge], [Outro] 等）。

創(chuàng)建分段指令：

為每一個(gè)劃分出的歌詞段落，創(chuàng)建一個(gè)對(duì)應(yīng)的英文分段指令。

該指令必須用方括號(hào) [...] 包裹。

指令內(nèi)容需要具體描述該段落的編曲、演唱情緒或特殊效果。

體現(xiàn)歌曲進(jìn)程：指令的設(shè)計(jì)必須反映一首歌曲的自然發(fā)展邏輯。例如：

[Intro] 或 [Verse 1] 的指令應(yīng)該相對(duì)稀疏和簡(jiǎn)單（如：soft piano intro, intimate vocal）。

[Chorus] 的指令應(yīng)該體現(xiàn)情緒的提升和配器的豐富（如：full band enters, powerful layered vocals）。

[Bridge] 的指令應(yīng)該創(chuàng)造出對(duì)比和變化（如：instrumentation strips back, emotive falsetto）。

[Solo] 或 [Outro] 的指令應(yīng)該包含獨(dú)奏或收尾的元素。

最終格式：將分段標(biāo)題（如 [Verse 1]）、對(duì)應(yīng)的分段指令（如 [...]）和該段落的原始歌詞組合在一起。指令必須在歌詞的正上方。

最終輸出示例：

1.全局風(fēng)格提示詞 (Global Style Prompt)

JJ Lin-style Mandopop/C-Pop, blending Pop-Rock with R&B and Ballad influences. The sound is defined by a highly melodic, piano-driven foundation, often accompanied by lush string arrangements and modern synth pads. His vocal style is a clear, powerful high tenor, known for its exceptional control, wide range, and signature emotive vibrato. Focus on polished, cinematic production and delivering a soaring, emotionally charged vocal performance.

2.分段指令 + 歌詞 (Lyrics with Sectional Prompts)

[Verse 1][soft piano intro, clean and intimate vocal delivery, sparse instrumentation]

圈圈圓圓圈圈

天天年年天天的我

深深看你的臉

[Chorus][driving pop-rock drum beat enters, signature string section swells, powerful layered lead vocals, building emotional intensity]

不懂愛(ài)恨情愁煎熬的我們

都以為相愛(ài)就像風(fēng)云的善變

相信愛(ài)一天抵過(guò)永遠(yuǎn)

你的任務(wù)流程：

在開(kāi)始時(shí)，向用戶(hù)確認(rèn)你已準(zhǔn)備就緒。

要求用戶(hù)提供【歌手名稱(chēng)】和【歌詞內(nèi)容】。

嚴(yán)格按照上述所有規(guī)則和格式，生成并輸出完整的提示詞。

比如這里，我把上面的提示詞發(fā)給了 Gemini 2.5 Pro，然后他就會(huì)問(wèn)我要歌手名稱(chēng)和歌詞。

然后我就給他發(fā)了我想要模仿的歌手名稱(chēng)為李榮浩和黃軒，歌詞是《蘭亭序》的完整歌詞，這里你想讓他唱多少就寫(xiě)多少就行。

這個(gè)時(shí)候我們就可以把 LLM 給我們的風(fēng)格風(fēng)格提示詞和分段指令+歌詞傳給 Suno 了，分段指令+歌詞放在歌詞（Lyrics）部分。

然后怪異度和風(fēng)格遵循你可以自己選擇，我建議都試試體驗(yàn)一下他們的數(shù)值高低的區(qū)別。

這里歌詞可以用已經(jīng)發(fā)行歌曲的歌詞，也可以用你自己編的，當(dāng)然你用“哈基米南北綠豆”也是可以的。

然后我們?cè)賮?lái)看一下第二種，也就是需要上傳音頻保持原始曲調(diào)的音樂(lè)怎么做。

店面第一種可以說(shuō)是除了歌詞都是原創(chuàng)，第二種就把 AI 當(dāng)做一個(gè)修音師和混音師來(lái)用了，歌曲的編曲和歌詞都是不變的，只是音色和編排變了。

提示詞的部分跟第一部分是一致的，唯一的區(qū)別就是我們?cè)凇癈ustum”這邊點(diǎn)那個(gè)“+Audio”按鈕去上傳原始的音樂(lè)音頻，然后選擇 Cover 也就是覆蓋完全重新演繹，右邊的 Extend 是延長(zhǎng)的意思，有需要你也可以用。

如果你直接拿原始的音樂(lè)去上傳可能發(fā)現(xiàn)了 Suno 是有版權(quán)驗(yàn)證的，他不讓你混音原始的版權(quán)音樂(lè)，我們需要繞過(guò)去，這里有兩個(gè)辦法：

1.你自己唱一遍原始音樂(lè)，你的聲音唱他是不會(huì)限制你的，或者找別人翻唱的音頻，這個(gè)版權(quán)庫(kù)沒(méi)有。
2.然后就是對(duì)原始音頻進(jìn)行處理，比如用剪映之類(lèi)的分離配樂(lè)保留人聲后剪輯一下，這個(gè)不建議使用有風(fēng)險(xiǎn)。

然后就是繼續(xù)我們第一種方案的流程了，用 LLM 提示詞生成 Suno 提示詞填寫(xiě)到對(duì)應(yīng)的位置，這里就不重復(fù)了。

需要注意的是你上傳音樂(lè)之后，下面會(huì)多一個(gè)選項(xiàng)“Audio Influence”就是跟原始聲音的相似度，這里我建議調(diào)的低一點(diǎn)，我們只參考音頻曲調(diào)，不去復(fù)刻音色，不然會(huì)有風(fēng)險(xiǎn)。

當(dāng)然如果這個(gè)音頻是你唱的，你可以把這個(gè)調(diào)高點(diǎn)，把 Suno 當(dāng)你的調(diào)音師用，估計(jì)有這個(gè)功能之后，會(huì)唱歌的美女 UP 主會(huì)越來(lái)越多了。

好了以上就是這次 Suno 的完整教程了。

AI 音樂(lè)也跟圖片模型一樣從純生產(chǎn)邏輯變?yōu)榱司庉嫼蛣?chuàng)作邏輯，整個(gè)自由度和準(zhǔn)確性搞了很多。

Suno V5 可以說(shuō)是音樂(lè)模型中的 banana 了。

AI 音樂(lè)從 Suno V5 開(kāi)始已經(jīng)走到了臨界點(diǎn)，甚至可以說(shuō)音樂(lè)行業(yè)在這一刻走到了臨界點(diǎn)。

每個(gè)人都可以讓 AI 幫你修音，甚至讓 AI 幫你創(chuàng)作非常好聽(tīng)的音樂(lè)，每個(gè)經(jīng)典音樂(lè)都會(huì)被拿出來(lái)重新用各種風(fēng)格混音。

我自己的感受來(lái)看這可能對(duì)我們這個(gè)死水一潭的樂(lè)壇來(lái)說(shuō)未必是壞事。

可能很多人看到過(guò) UP 主阿張拷問(wèn)各大主流音樂(lè) APP 排行榜的視頻。

經(jīng)常是一個(gè)熱門(mén)的經(jīng)典音樂(lè)的各種垃圾 Remix 版本占據(jù)一整個(gè)排行榜，什么傷感版說(shuō)唱版啥的，質(zhì)量相當(dāng)拉跨，我覺(jué)得大部分都沒(méi)有 Suno Remix 的好聽(tīng)。

希望大家用這個(gè)教程多搞一些創(chuàng)作，少搞抄襲。

謝謝各位，如果覺(jué)得內(nèi)容對(duì)你有幫助，可以幫我點(diǎn)個(gè)贊或者喜歡，也可以收藏和轉(zhuǎn)發(fā)給你需要的朋友。

希望在評(píng)論區(qū)看到各位的大作。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.