三天前的夜里,我正在刷抖音,刷到一個(gè)用 R&B 風(fēng)格唱的《一路向北》當(dāng)時(shí)就給我聽(tīng)麻了。
我當(dāng)時(shí)就是“早知道,還是原道”那個(gè)圖片表情,太震撼了,而且音頻非常清晰我都沒(méi)想過(guò)是 AI 唱的。
![]()
然后我就去作者的主頁(yè)看,又看到了《青花瓷》沒(méi)想到下面寫(xiě)著 Suno 5 。
臥槽,我當(dāng)時(shí)就傻了,就想 Suno V5 生成的歌我也聽(tīng)過(guò)啊,咋突然這么牛批了。
然后就陸續(xù)刷到了其他類(lèi)似的賬號(hào),發(fā)現(xiàn)這類(lèi)用 AI 生成的音樂(lè)這幾天已經(jīng)非常火爆了,幾十萬(wàn)贊的比比皆是。
甚至最近最火的《技能五子棋》也是 AI 搞得。
![]()
于是我就去研究了一下新更新的 Suno V5 模型。
發(fā)現(xiàn)這玩意已經(jīng)更我印象里面只能寫(xiě)非常簡(jiǎn)單提示詞的 Suno 完全不一樣了,現(xiàn)在所有你能想到的元素他都能控制。
除了風(fēng)格提示詞外,你還能自定義歌詞和每段 Verse 的具體提示詞,甚至可以上傳音頻在此基礎(chǔ)上修改,你完全可以把他當(dāng)做一個(gè) AI 修音和混音員工去用,不只是純粹的生成。
另外還有更加專(zhuān)業(yè)的 Studio 模式,類(lèi)似專(zhuān)業(yè)音頻軟件可以分音軌生成和控制,非常。
![]()
經(jīng)過(guò)一段時(shí)間吭哧癟肚研究之后終于整理出來(lái)了一套簡(jiǎn)單易懂的工作流,哪怕你對(duì)樂(lè)理一竅不通也可以生成非常好聽(tīng)的 Remix 和原創(chuàng) AI 音樂(lè)。
這套流程主要有兩部分,也是最近爆火的 Suno 生成音樂(lè)的兩種流派。
一種是需要墊原來(lái)的音樂(lè)的,他還是原來(lái)的曲調(diào),支持會(huì)重新混音和編曲演繹,比如我這里用陶喆風(fēng)格做的《擱淺》。
另一種是不需要墊原始的音頻的純提示詞生成,這種就只用原始歌曲的歌詞的,曲調(diào)會(huì)完全根據(jù)提示詞生成,比如我生產(chǎn)的這個(gè)用賈斯丁·比伯風(fēng)格做的《蘭亭序》。
好了我們開(kāi)始我們的教程,先教第二種也就是不需要墊音頻的版本。
這兩部分提示詞和設(shè)置完全相同,只是墊不墊音頻的區(qū)別。
我們進(jìn)到 Suno 之后,需要先切換到“Custum”這個(gè) Tab 的部分,這邊和對(duì)生成歌曲做詳細(xì)的設(shè)置。
先介紹基礎(chǔ)需要關(guān)注的部分界面內(nèi)容:
- Lyrics:很明顯這部分就是歌詞,但是不止可以寫(xiě)歌詞,你可以對(duì)每部分歌詞進(jìn)行標(biāo)注,放在放括號(hào)里面的提示詞 AI 是不會(huì)唱的,可以理解為控制每部分歌詞的提示詞。
- Styles:這部分就是我們認(rèn)為的的傳統(tǒng)提示詞了,主要描述整個(gè)歌曲的風(fēng)格、唱法和樂(lè)器編排等。
- Vocal Gender:這個(gè)正常就是你生成音樂(lè)的演唱是男聲還是女聲
- Weirdnes:這個(gè)叫怪異值,如果你玩過(guò) MJ 應(yīng)該很熟悉,數(shù)值越高生成的音樂(lè)就會(huì)越怪,跟主流音樂(lè)不同,更加復(fù)雜。
- Style Influence:風(fēng)格遵循,就是生成音樂(lè)需要多遵循你的風(fēng)格提示詞,數(shù)值越低,模型的自由度越高。
![]()
所以你發(fā)現(xiàn)了,我們需要寫(xiě)兩部分的提示詞,首先是風(fēng)格提示詞,另一部分是每段 Verse 的提示詞來(lái)控制每段提示詞的演唱風(fēng)格。
你知道藏師傅的風(fēng)格的,我向來(lái)喜歡一步到位。
所以我整了一套提示詞,你只要發(fā)給 LLM,把你想要模仿的歌手名字和歌曲的歌詞給他,他就可以給出這兩部分的完整提示詞了。
Suno 音樂(lè)生成寶藏提示詞:
你是一名專(zhuān)業(yè)的 AI 音樂(lè)提示詞工程師。你的任務(wù)是根據(jù)用戶(hù)提供的【歌手名稱(chēng)】和【歌詞內(nèi)容】,為 AI 音樂(lè)生成模型(如 Suno, Udio 等)創(chuàng)建一套完整、專(zhuān)業(yè)且結(jié)構(gòu)化的提示詞。
你的輸出必須嚴(yán)格遵循以下兩個(gè)部分的格式和要求:
第一部分:全局風(fēng)格提示詞 (Global Style Prompt)
這一部分用于定義歌手的整體音樂(lè)特征和核心風(fēng)格。
要求:
內(nèi)容詳盡: 必須包含以下四個(gè)核心要素:
核心曲風(fēng) (Core Genre): 例如 "Neo-Soul R&B", "Mandopop fusion", "Alternative Rock" 等。
標(biāo)志性樂(lè)器編配 (Signature Instrumentation): 例如 "piano-driven", "slap bass", "atmospheric synths", "string arrangements" 等。
音色與演唱技巧 (Vocal Timbre & Technique): 例如 "breathy falsetto", "forceful shout-singing", "mumbled storytelling flow", "emotive vibrato" 等。
制作與節(jié)奏特點(diǎn) (Production & Rhythmic Feel): 例如 "cinematic production", "behind-the-beat groove", "minimalist and atmospheric" 等。
語(yǔ)言: 必須使用英文。
客觀性: 描述必須專(zhuān)注于具體的音樂(lè)特征,避免使用主觀贊美或總結(jié)性評(píng)論(例如,不要說(shuō)“他創(chuàng)造了一種偉大的聲音”)。
第二部分:分段指令 + 歌詞 (Lyrics with Sectional Prompts)
這一部分將用戶(hù)提供的歌詞與動(dòng)態(tài)的、針對(duì)每個(gè)段落的編曲指令相結(jié)合。
要求:
自動(dòng)分段: 你必須首先分析用戶(hù)提供的完整【歌詞內(nèi)容】,并將其智能地劃分為符合歌曲結(jié)構(gòu)的邏輯段落(例如:[Verse 1], [Chorus], [Bridge], [Outro] 等)。
創(chuàng)建分段指令:
為每一個(gè)劃分出的歌詞段落,創(chuàng)建一個(gè)對(duì)應(yīng)的英文分段指令。
該指令必須用方括號(hào) [...] 包裹。
指令內(nèi)容需要具體描述該段落的編曲、演唱情緒或特殊效果。
體現(xiàn)歌曲進(jìn)程: 指令的設(shè)計(jì)必須反映一首歌曲的自然發(fā)展邏輯。例如:
[Intro] 或 [Verse 1] 的指令應(yīng)該相對(duì)稀疏和簡(jiǎn)單(如:soft piano intro, intimate vocal)。
[Chorus] 的指令應(yīng)該體現(xiàn)情緒的提升和配器的豐富(如:full band enters, powerful layered vocals)。
[Bridge] 的指令應(yīng)該創(chuàng)造出對(duì)比和變化(如:instrumentation strips back, emotive falsetto)。
[Solo] 或 [Outro] 的指令應(yīng)該包含獨(dú)奏或收尾的元素。
最終格式: 將分段標(biāo)題(如 [Verse 1])、對(duì)應(yīng)的分段指令(如 [...])和該段落的原始歌詞組合在一起。指令必須在歌詞的正上方。
最終輸出示例:
- 1.全局風(fēng)格提示詞 (Global Style Prompt)
JJ Lin-style Mandopop/C-Pop, blending Pop-Rock with R&B and Ballad influences. The sound is defined by a highly melodic, piano-driven foundation, often accompanied by lush string arrangements and modern synth pads. His vocal style is a clear, powerful high tenor, known for its exceptional control, wide range, and signature emotive vibrato. Focus on polished, cinematic production and delivering a soaring, emotionally charged vocal performance.
- 2.分段指令 + 歌詞 (Lyrics with Sectional Prompts)
[Verse 1][soft piano intro, clean and intimate vocal delivery, sparse instrumentation]
圈圈圓圓圈圈
天天年年天天的我
深深看你的臉
[Chorus][driving pop-rock drum beat enters, signature string section swells, powerful layered lead vocals, building emotional intensity]
不懂愛(ài)恨情愁煎熬的我們
都以為相愛(ài)就像風(fēng)云的善變
相信愛(ài)一天 抵過(guò)永遠(yuǎn)
你的任務(wù)流程:
在開(kāi)始時(shí),向用戶(hù)確認(rèn)你已準(zhǔn)備就緒。
要求用戶(hù)提供 【歌手名稱(chēng)】 和 【歌詞內(nèi)容】。
嚴(yán)格按照上述所有規(guī)則和格式,生成并輸出完整的提示詞。
比如這里,我把上面的提示詞發(fā)給了 Gemini 2.5 Pro,然后他就會(huì)問(wèn)我要歌手名稱(chēng)和歌詞。
然后我就給他發(fā)了我想要模仿的歌手名稱(chēng)為李榮浩和黃軒,歌詞是《蘭亭序》的完整歌詞,這里你想讓他唱多少就寫(xiě)多少就行。
![]()
這個(gè)時(shí)候我們就可以把 LLM 給我們的風(fēng)格風(fēng)格提示詞和分段指令+歌詞傳給 Suno 了,分段指令+歌詞放在歌詞(Lyrics)部分。
然后怪異度和風(fēng)格遵循你可以自己選擇,我建議都試試體驗(yàn)一下他們的數(shù)值高低的區(qū)別。
這里歌詞可以用已經(jīng)發(fā)行歌曲的歌詞,也可以用你自己編的,當(dāng)然你用“哈基米南北綠豆”也是可以的。
![]()
然后我們?cè)賮?lái)看一下第二種,也就是需要上傳音頻保持原始曲調(diào)的音樂(lè)怎么做。
店面第一種可以說(shuō)是除了歌詞都是原創(chuàng),第二種就把 AI 當(dāng)做一個(gè)修音師和混音師來(lái)用了,歌曲的編曲和歌詞都是不變的,只是音色和編排變了。
提示詞的部分跟第一部分是一致的,唯一的區(qū)別就是我們?cè)凇癈ustum”這邊點(diǎn)那個(gè)“+Audio”按鈕去上傳原始的音樂(lè)音頻,然后選擇 Cover 也就是覆蓋完全重新演繹,右邊的 Extend 是延長(zhǎng)的意思,有需要你也可以用。
![]()
如果你直接拿原始的音樂(lè)去上傳可能發(fā)現(xiàn)了 Suno 是有版權(quán)驗(yàn)證的,他不讓你混音原始的版權(quán)音樂(lè),我們需要繞過(guò)去,這里有兩個(gè)辦法:
- 1.你自己唱一遍原始音樂(lè),你的聲音唱他是不會(huì)限制你的,或者找別人翻唱的音頻,這個(gè)版權(quán)庫(kù)沒(méi)有。
- 2.然后就是對(duì)原始音頻進(jìn)行處理,比如用剪映之類(lèi)的分離配樂(lè)保留人聲后剪輯一下,這個(gè)不建議使用有風(fēng)險(xiǎn)。
![]()
然后就是繼續(xù)我們第一種方案的流程了,用 LLM 提示詞生成 Suno 提示詞填寫(xiě)到對(duì)應(yīng)的位置,這里就不重復(fù)了。
需要注意的是你上傳音樂(lè)之后,下面會(huì)多一個(gè)選項(xiàng)“Audio Influence”就是跟原始聲音的相似度,這里我建議調(diào)的低一點(diǎn),我們只參考音頻曲調(diào),不去復(fù)刻音色,不然會(huì)有風(fēng)險(xiǎn)。
當(dāng)然如果這個(gè)音頻是你唱的,你可以把這個(gè)調(diào)高點(diǎn),把 Suno 當(dāng)你的調(diào)音師用,估計(jì)有這個(gè)功能之后,會(huì)唱歌的美女 UP 主會(huì)越來(lái)越多了。
![]()
好了以上就是這次 Suno 的完整教程了。
AI 音樂(lè)也跟圖片模型一樣從純生產(chǎn)邏輯變?yōu)榱司庉嫼蛣?chuàng)作邏輯,整個(gè)自由度和準(zhǔn)確性搞了很多。
Suno V5 可以說(shuō)是音樂(lè)模型中的 banana 了。
AI 音樂(lè)從 Suno V5 開(kāi)始已經(jīng)走到了臨界點(diǎn),甚至可以說(shuō)音樂(lè)行業(yè)在這一刻走到了臨界點(diǎn)。
每個(gè)人都可以讓 AI 幫你修音,甚至讓 AI 幫你創(chuàng)作非常好聽(tīng)的音樂(lè),每個(gè)經(jīng)典音樂(lè)都會(huì)被拿出來(lái)重新用各種風(fēng)格混音。
我自己的感受來(lái)看這可能對(duì)我們這個(gè)死水一潭的樂(lè)壇來(lái)說(shuō)未必是壞事。
可能很多人看到過(guò) UP 主阿張拷問(wèn)各大主流音樂(lè) APP 排行榜的視頻。
![]()
經(jīng)常是一個(gè)熱門(mén)的經(jīng)典音樂(lè)的各種垃圾 Remix 版本占據(jù)一整個(gè)排行榜,什么傷感版說(shuō)唱版啥的,質(zhì)量相當(dāng)拉跨,我覺(jué)得大部分都沒(méi)有 Suno Remix 的好聽(tīng)。
希望大家用這個(gè)教程多搞一些創(chuàng)作,少搞抄襲。
謝謝各位,如果覺(jué)得內(nèi)容對(duì)你有幫助,可以幫我點(diǎn)個(gè)贊或者喜歡,也可以收藏和轉(zhuǎn)發(fā)給你需要的朋友。
希望在評(píng)論區(qū)看到各位的大作。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.