2月12日,自由量級宣布正式發布音潮音樂大模型V3.0版本。據介紹,此次迭代并非簡單的參數優化,而是完成了從編碼到生成再到解碼的全鏈路技術重構,旨在實現音樂性與良品率的提升,并進一步推動“音樂平權”理念的落地。
![]()
據了解,音潮V3.0在“聲音審美”層面進行了多項技術升級。首先,在演唱質量方面,通過引入雙軌建模與多階段強化學習,模型在哼唱、轉音、氣聲等演唱技巧的處理上更加細膩,并能更好地根據歌詞意境調整情感表達。其次,新版本優化了旋律的悅耳度與記憶性,生成的旋律線條更加流暢,注重段落間的起承轉合與記憶點(Hook)的設計。此外,為了提升聲音的物理質感,音潮V3.0為相位和混響進行了獨立建模,以增強樂器音色和空間殘響的真實感。
在產品定位上,自由量級方面強調了音樂平權的理念。據自由量級CTO姜濤介紹,與市場上部分專注于輔助專業音樂人編曲的工具不同,音潮V3.0致力于降低普通人的創作門檻。該模型旨在讓用戶在僅輸入少量文字或念頭的情況下,通過簡化后期處理,獲得完整的音樂作品。
姜濤表示: “模型如果只是聚焦專業生產場景,在價值層面就會滑向冰冷的工具,很容易忽略了普通人情感表達的需求。所以,音潮模型迭代的出發點,始終關注用技術讓音樂創作的門檻大幅降低。每一項技術重構和突破,都最終指向讓‘音樂平權’從理念落地為現實。(袁寧)
