三天前的夜里,我正在刷抖音,刷到一個用 R&B 風格唱的《一路向北》當時就給我聽麻了。
我當時就是“早知道,還是原道”那個圖片表情,太震撼了,而且音頻非常清晰我都沒想過是 AI 唱的。
![]()
然后我就去作者的主頁看,又看到了《青花瓷》沒想到下面寫著 Suno 5 。
臥槽,我當時就傻了,就想 Suno V5 生成的歌我也聽過啊,咋突然這么牛批了。
然后就陸續(xù)刷到了其他類似的賬號,發(fā)現(xiàn)這類用 AI 生成的音樂這幾天已經非常火爆了,幾十萬贊的比比皆是。
甚至最近最火的《技能五子棋》也是 AI 搞得。
![]()
于是我就去研究了一下新更新的 Suno V5 模型。
發(fā)現(xiàn)這玩意已經更我印象里面只能寫非常簡單提示詞的 Suno 完全不一樣了,現(xiàn)在所有你能想到的元素他都能控制。
除了風格提示詞外,你還能自定義歌詞和每段 Verse 的具體提示詞,甚至可以上傳音頻在此基礎上修改,你完全可以把他當做一個 AI 修音和混音員工去用,不只是純粹的生成。
另外還有更加專業(yè)的 Studio 模式,類似專業(yè)音頻軟件可以分音軌生成和控制,非常。
![]()
經過一段時間吭哧癟肚研究之后終于整理出來了一套簡單易懂的工作流,哪怕你對樂理一竅不通也可以生成非常好聽的 Remix 和原創(chuàng) AI 音樂。
這套流程主要有兩部分,也是最近爆火的 Suno 生成音樂的兩種流派。
一種是需要墊原來的音樂的,他還是原來的曲調,支持會重新混音和編曲演繹,比如我這里用陶喆風格做的《擱淺》。
另一種是不需要墊原始的音頻的純提示詞生成,這種就只用原始歌曲的歌詞的,曲調會完全根據提示詞生成,比如我生產的這個用賈斯丁·比伯風格做的《蘭亭序》。
好了我們開始我們的教程,先教第二種也就是不需要墊音頻的版本。
這兩部分提示詞和設置完全相同,只是墊不墊音頻的區(qū)別。
我們進到 Suno 之后,需要先切換到“Custum”這個 Tab 的部分,這邊和對生成歌曲做詳細的設置。
先介紹基礎需要關注的部分界面內容:
- Lyrics:很明顯這部分就是歌詞,但是不止可以寫歌詞,你可以對每部分歌詞進行標注,放在放括號里面的提示詞 AI 是不會唱的,可以理解為控制每部分歌詞的提示詞。
- Styles:這部分就是我們認為的的傳統(tǒng)提示詞了,主要描述整個歌曲的風格、唱法和樂器編排等。
- Vocal Gender:這個正常就是你生成音樂的演唱是男聲還是女聲
- Weirdnes:這個叫怪異值,如果你玩過 MJ 應該很熟悉,數值越高生成的音樂就會越怪,跟主流音樂不同,更加復雜。
- Style Influence:風格遵循,就是生成音樂需要多遵循你的風格提示詞,數值越低,模型的自由度越高。
![]()
所以你發(fā)現(xiàn)了,我們需要寫兩部分的提示詞,首先是風格提示詞,另一部分是每段 Verse 的提示詞來控制每段提示詞的演唱風格。
你知道藏師傅的風格的,我向來喜歡一步到位。
所以我整了一套提示詞,你只要發(fā)給 LLM,把你想要模仿的歌手名字和歌曲的歌詞給他,他就可以給出這兩部分的完整提示詞了。
Suno 音樂生成寶藏提示詞:
你是一名專業(yè)的 AI 音樂提示詞工程師。你的任務是根據用戶提供的【歌手名稱】和【歌詞內容】,為 AI 音樂生成模型(如 Suno, Udio 等)創(chuàng)建一套完整、專業(yè)且結構化的提示詞。
你的輸出必須嚴格遵循以下兩個部分的格式和要求:
第一部分:全局風格提示詞 (Global Style Prompt)
這一部分用于定義歌手的整體音樂特征和核心風格。
要求:
內容詳盡: 必須包含以下四個核心要素:
核心曲風 (Core Genre): 例如 "Neo-Soul R&B", "Mandopop fusion", "Alternative Rock" 等。
標志性樂器編配 (Signature Instrumentation): 例如 "piano-driven", "slap bass", "atmospheric synths", "string arrangements" 等。
音色與演唱技巧 (Vocal Timbre & Technique): 例如 "breathy falsetto", "forceful shout-singing", "mumbled storytelling flow", "emotive vibrato" 等。
制作與節(jié)奏特點 (Production & Rhythmic Feel): 例如 "cinematic production", "behind-the-beat groove", "minimalist and atmospheric" 等。
語言: 必須使用英文。
客觀性: 描述必須專注于具體的音樂特征,避免使用主觀贊美或總結性評論(例如,不要說“他創(chuàng)造了一種偉大的聲音”)。
第二部分:分段指令 + 歌詞 (Lyrics with Sectional Prompts)
這一部分將用戶提供的歌詞與動態(tài)的、針對每個段落的編曲指令相結合。
要求:
自動分段: 你必須首先分析用戶提供的完整【歌詞內容】,并將其智能地劃分為符合歌曲結構的邏輯段落(例如:[Verse 1], [Chorus], [Bridge], [Outro] 等)。
創(chuàng)建分段指令:
為每一個劃分出的歌詞段落,創(chuàng)建一個對應的英文分段指令。
該指令必須用方括號 [...] 包裹。
指令內容需要具體描述該段落的編曲、演唱情緒或特殊效果。
體現(xiàn)歌曲進程: 指令的設計必須反映一首歌曲的自然發(fā)展邏輯。例如:
[Intro] 或 [Verse 1] 的指令應該相對稀疏和簡單(如:soft piano intro, intimate vocal)。
[Chorus] 的指令應該體現(xiàn)情緒的提升和配器的豐富(如:full band enters, powerful layered vocals)。
[Bridge] 的指令應該創(chuàng)造出對比和變化(如:instrumentation strips back, emotive falsetto)。
[Solo] 或 [Outro] 的指令應該包含獨奏或收尾的元素。
最終格式: 將分段標題(如 [Verse 1])、對應的分段指令(如 [...])和該段落的原始歌詞組合在一起。指令必須在歌詞的正上方。
最終輸出示例:
- 1.全局風格提示詞 (Global Style Prompt)
JJ Lin-style Mandopop/C-Pop, blending Pop-Rock with R&B and Ballad influences. The sound is defined by a highly melodic, piano-driven foundation, often accompanied by lush string arrangements and modern synth pads. His vocal style is a clear, powerful high tenor, known for its exceptional control, wide range, and signature emotive vibrato. Focus on polished, cinematic production and delivering a soaring, emotionally charged vocal performance.
- 2.分段指令 + 歌詞 (Lyrics with Sectional Prompts)
[Verse 1][soft piano intro, clean and intimate vocal delivery, sparse instrumentation]
圈圈圓圓圈圈
天天年年天天的我
深深看你的臉
[Chorus][driving pop-rock drum beat enters, signature string section swells, powerful layered lead vocals, building emotional intensity]
不懂愛恨情愁煎熬的我們
都以為相愛就像風云的善變
相信愛一天 抵過永遠
你的任務流程:
在開始時,向用戶確認你已準備就緒。
要求用戶提供 【歌手名稱】 和 【歌詞內容】。
嚴格按照上述所有規(guī)則和格式,生成并輸出完整的提示詞。
比如這里,我把上面的提示詞發(fā)給了 Gemini 2.5 Pro,然后他就會問我要歌手名稱和歌詞。
然后我就給他發(fā)了我想要模仿的歌手名稱為李榮浩和黃軒,歌詞是《蘭亭序》的完整歌詞,這里你想讓他唱多少就寫多少就行。
![]()
這個時候我們就可以把 LLM 給我們的風格風格提示詞和分段指令+歌詞傳給 Suno 了,分段指令+歌詞放在歌詞(Lyrics)部分。
然后怪異度和風格遵循你可以自己選擇,我建議都試試體驗一下他們的數值高低的區(qū)別。
這里歌詞可以用已經發(fā)行歌曲的歌詞,也可以用你自己編的,當然你用“哈基米南北綠豆”也是可以的。
![]()
然后我們再來看一下第二種,也就是需要上傳音頻保持原始曲調的音樂怎么做。
店面第一種可以說是除了歌詞都是原創(chuàng),第二種就把 AI 當做一個修音師和混音師來用了,歌曲的編曲和歌詞都是不變的,只是音色和編排變了。
提示詞的部分跟第一部分是一致的,唯一的區(qū)別就是我們在“Custum”這邊點那個“+Audio”按鈕去上傳原始的音樂音頻,然后選擇 Cover 也就是覆蓋完全重新演繹,右邊的 Extend 是延長的意思,有需要你也可以用。
![]()
如果你直接拿原始的音樂去上傳可能發(fā)現(xiàn)了 Suno 是有版權驗證的,他不讓你混音原始的版權音樂,我們需要繞過去,這里有兩個辦法:
- 1.你自己唱一遍原始音樂,你的聲音唱他是不會限制你的,或者找別人翻唱的音頻,這個版權庫沒有。
- 2.然后就是對原始音頻進行處理,比如用剪映之類的分離配樂保留人聲后剪輯一下,這個不建議使用有風險。
![]()
然后就是繼續(xù)我們第一種方案的流程了,用 LLM 提示詞生成 Suno 提示詞填寫到對應的位置,這里就不重復了。
需要注意的是你上傳音樂之后,下面會多一個選項“Audio Influence”就是跟原始聲音的相似度,這里我建議調的低一點,我們只參考音頻曲調,不去復刻音色,不然會有風險。
當然如果這個音頻是你唱的,你可以把這個調高點,把 Suno 當你的調音師用,估計有這個功能之后,會唱歌的美女 UP 主會越來越多了。
![]()
好了以上就是這次 Suno 的完整教程了。
AI 音樂也跟圖片模型一樣從純生產邏輯變?yōu)榱司庉嫼蛣?chuàng)作邏輯,整個自由度和準確性搞了很多。
Suno V5 可以說是音樂模型中的 banana 了。
AI 音樂從 Suno V5 開始已經走到了臨界點,甚至可以說音樂行業(yè)在這一刻走到了臨界點。
每個人都可以讓 AI 幫你修音,甚至讓 AI 幫你創(chuàng)作非常好聽的音樂,每個經典音樂都會被拿出來重新用各種風格混音。
我自己的感受來看這可能對我們這個死水一潭的樂壇來說未必是壞事。
可能很多人看到過 UP 主阿張拷問各大主流音樂 APP 排行榜的視頻。
![]()
經常是一個熱門的經典音樂的各種垃圾 Remix 版本占據一整個排行榜,什么傷感版說唱版啥的,質量相當拉跨,我覺得大部分都沒有 Suno Remix 的好聽。
希望大家用這個教程多搞一些創(chuàng)作,少搞抄襲。
謝謝各位,如果覺得內容對你有幫助,可以幫我點個贊或者喜歡,也可以收藏和轉發(fā)給你需要的朋友。
希望在評論區(qū)看到各位的大作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.