AI 語音的發展,不僅正在改變很多行業,很可能會成為未來非常重要的一種新的交互界面。模型層面,Cartesia 前幾天宣布從 KP、Index、Lightspeed 和英偉達等完成了 1 億美金的融資,并推出了最先進的實時對話模型 Sonic-3。
Sonic-3 具有很好的自然感,模型延遲在 90ms,端到端 190ms,支持 42 種語言。而且它是基于狀態空間模型 (SSM) 而不是 Transformer 進行構建的。
Cartesia 說,都在用的 Transformers 就像在說每個新單詞之前,都要從頭開始重溫整個對話,每一個單詞都需要回顧所有內容。
而 SSM(Sonic-3 所使用的)就像人類一樣,能夠記住對話的主題和氛圍。有足夠的上下文信息,無需重放所有內容就能自然地進行交流。目前像 ServiceNow、Cresta 和 Decagon 等數千家企業每月使用 Sonic 進行數百萬次對話。
![]()
應用層面,大量 AI 客服以及各種 AI 筆記應用的快速滲透《》,已經能感受到市場的需求。
就連之前引發了巨大爭議的 ,前幾天也宣布轉型為了一個 AI 筆記應用,其創始人 Roy 因開發 AI 作弊工具被退學,后拿到 a16z 1500 萬美金融資和激進的營銷方式而走紅。
Cluely 聲稱與其他類似產品在會議結束后才發揮作用的常規 AI 會議記錄工具不同,Cluely在通話過程中提供實時會議智能。其他 AI 會議助手在會后生成會議總結,而 Cluely 則幫助你回答技術問題、處理異議,并在高風險對話中表現得更好。
a16z 和 Sequoia 重金押注的這個語音 AI《》,其長期愿景也是通過語音 AI 和硬件載體來打造新的交互界面。
而我之前介紹過的通過與 AI 聊天來進行招聘的這種新方式《》,也開始延伸到其他行業。
其中將這個方式應用到客戶研究的 AI 產品,已經連續完成了 3 輪近 1 億美金,其核心也是直接通過與 AI 的聊天對話來獲取信息。
它能讓企業在幾小時內完成數百甚至上千次深度用戶訪談。除此之外,它還將傳統需要大量人工處理的工作自動化了,比方說……
全 文 共2386字
后續內容為付費會員專屬,會員掃碼登錄直接閱讀
Memo: Signal, not noise!
訂閱 Memo Pro
Memo(vcsmemo.com)是一個基于付費訂閱模式的創投內容平臺,已得到大量 VC、企業 CEO 以及高管的支持,我們希望幫助你捕捉最具價值的行業信號、過濾噪音(Signal,Not Noise)。
訂閱 Memo Pro
你將獲得:
1.解鎖未來一年以及之前的所有會員專屬內容
2.郵件訂閱功能:付費內容+最新行業快訊+...
3.優先體驗 Memo 新產品和新功能
限時 799 元/年(原價 999 元/年),掃碼立即訂閱
1.
2.
3.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.