品玩12月11日訊,Google今日宣布推出Gemini 2.5 Flash與Pro Text-to-Speech(TTS)預覽模型的重大更新,替代今年5月發布的舊版。
新模型在表達力、語速控制及多說話人一致性方面顯著提升,支持更精準的風格指令響應、上下文感知的節奏調節,并可在24種語言中保持角色聲線穩定。
該技術已應用于Wondercraft等平臺,助力其多角色對話與導演模式功能,實現自然語音生成。用戶現可通過Google AI Studio和Playground體驗新版TTS能力,適用于有聲書、教學視頻、營銷內容等高保真語音場景。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.