品玩12月11日訊,據(jù)面壁智能官方消息,VoxCPM 1.5 版本正式發(fā)布。該版本在音頻質(zhì)量、生成效率及系統(tǒng)穩(wěn)定性等方面實(shí)現(xiàn)顯著提升,為開發(fā)者提供更強(qiáng)大的語音生成支持。
核心升級包括四方面:? AudioVAE 采樣率由 16kHz 提升至 44.1kHz,實(shí)現(xiàn)高保真音頻克隆;生成效率提高一倍,每生成1秒音頻僅需6.25個token;新增 LoRA 及全量微調(diào)腳本,支持深度定制;同時優(yōu)化了長文本生成的穩(wěn)定性,減少音頻偽影。
目前,模型已在 GitHub 與 Hugging Face 平臺開源,開發(fā)者可前往下載體驗(yàn)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.