前文:
文中我提到:“Qwen3.5-Omni有原生聯網搜索支持與工具調用能力,加上輸出音頻的音色支持,完全可以復刻出一個大模型加持的智能音箱了(Qwen 3.5-Omni 有實時版本,也支持聯網搜索)”
確實是可行的,我用實時版API結合本地跑的語音喚醒模型做了一個可以把藍牙音箱變智能的Demo,部署在我24小時開機的Mac mini上,外接麥克風做語音輸入,小千小千喚醒它就可以直接提問,涉及互聯網信息它會實時搜索后再回答!
我的視頻號大家順手關注?一下bei
可優化的地方還有很多,目前不確定是否網絡問題,延遲有點高。話說,這個模型可以開個10B以下的開源版本就徹底完美了,直接全部本地跑,沒有調Api的網絡延遲。
Vibe coding 的代碼,只能說能跑,再優化一下開源出來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.