北京商報訊(記者 陶鳳 王天逸)4月24日,小米技術發文,正式發布MiMo-V2.5-TTS Series與MiMo-V2.5-ASR—— 一套面向 Agent 時代的全鏈路語音模型系列,覆蓋識別與合成兩大核心能力,讓語音的輸入與輸出都可以被語言自由調度。
資料顯示,MiMo-V2.5-TTS Series 包含三款模型,現已登陸小米MiMo開放平臺,并且限時免費。三者共享統一的風格指令遵循、音頻標簽控制與文本理解能力,讓聲音表現可以被語言精細調度,覆蓋多種典型創作需求。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.