這是專門做音頻編輯的模型
核心能力:
迭代控制情緒、說話風格、副語言
情緒可選幾十種,說話風格包括撒嬌、老人、小孩、耳語
副語言支持 10 種標簽:呼吸、笑聲、驚訝、嘆氣等
支持中文、英文、四川話、粵語
https://huggingface.co/spaces/stepfun-ai/Step-Audio-EditX
https://github.com/stepfun-ai/Step-Audio-EditX
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.