![]()
揚帆出海 作者丨子墨
美國當地時間1月13日,語音AI公司Deepgram宣布完成1.3億美元C輪融資,由AVP領投,Alkeon、In-Q-Tel、Madrona等老股東,以及新投資者Alumni Ventures、Princeville Capital、Citi Ventures跟投。此輪融資后,公司總融資額達到2.15億美元,估值13億美元,成為了這一賽道的新晉獨角獸。
據悉,Deepgram成立于2015年,由密歇根大學物理系研究員Noah Shutty(CTO)和其導師Scott Stephenson(CEO)二人共同創立。創立的初衷,是源于Shutty的一項學術研究,希望能夠找到更加便捷的方式,管理日常生活中碎片化的音視頻片段,并借助AI實現智能檢索。如今,公司主要面向B端,推出的語音轉文本、文本轉語音、語音識別等模型已服務于1300多家企業級用戶。
![]()
(Deepgram部分B端用戶,圖源:Deepgram官網)
據公開信息顯示,在Deepgram成立的近10年時間里,并不都是一帆風順的,而是經歷了融資、裁員、降本等曲折道路。
2016年,Deepgram成剛成立不久,就獲得了由Y Combinator、Metamorphic Ventures共同領投的180萬美元融資。2021-2022年間,又連續融資了8600萬美元,估值升至2.67億美元。
然而,高昂的研發成本也在持續地燒著錢,加之谷歌、微軟、亞馬遜等巨頭入場競爭,OpenAI推出開源語音識別模型Whisper,為企業提供低價的API服務,Deepgram的優勢已大不如前。
2023-2025年間,面對市場競爭加劇、高利率下融資壓力攀升,Deepgram不得不進行兩次大規模裁員來控制成本,每次裁員人數均在20%(20人左右)。
而此次在2026年開年的新一輪融資,公司不僅拿到了歷史最高的單筆融資,估值也是翻倍飆升。那么這筆融資究竟是助其脫困的“雪中送炭”,還是在市場洪流中的“錦上添花”呢?
語音文字互轉,不再只是記錄
在Deepgram平臺的體驗中,可以發現其設計并不是那種很生硬的語音和文字的相互轉錄,而是能夠看到一些有意思的小巧思。
比如在面向C端的語音轉文字時,可以像微信一樣,按住話筒標識說話,或直接上傳文件,轉成文字后的內容支持復制和下載。
![]()
相反,在文字轉語音的過程中,支持1000字的文本輸入,這里也提供了醫療、財務、銷售等工作場景的文字模板。同時還有海倫娜、露娜、奧德修斯等有不同口音(如英音、美音、澳大利亞音等)、性別的聲音模板,且模板前都有對應的角色形象。雖然這些角色所展現出來的是聲音,但實際上也內在嵌入了差異化的性格特點、年齡等擬人化特征,每個角色都有自身所對應的一套標簽。
比如奧德修斯就是冷靜、圓滑、舒適且專業的,阿瑪爾西亞就是自然、開朗的。基于角色的不同性格,可以匹配出合適的使用場景,如比較隨意地講故事、聊天,或是很專業的廣告、采訪、客戶服務等等。
![]()
這一過程,就會讓人感覺并不是在單純地做AI轉化,而是在創作,用自己喜歡的聲音配合文字,甚至可以用其來配音做一些帶有人物反差感、有趣的內容。
另外,Deepgram還推出了AI助手Deepgram Saga,接入了ChatGPT、Claude、Gemini等多款頂尖模型,支持文字和語音輸入,可以完成問題回答、信息檢索、頭腦風暴思考甚至能夠直接執行工行工作流操作。
![]()
塔可鐘“翻車”的AI點餐,迎來新的挑戰者
雖然Deepgram在近兩年的時間一度陷入資金困境,但經過對B端大客戶的積累和定制化服務,公司在2025年現金流已實現轉正,CEO Scott Stephenson更是表示,公司目前其實并不缺錢,此次融資也是跟隨市場趨勢,在市場需求的推動下進行的。
實際上,在2025年語音AI賽道的融資案例并不少見,比如ElevenLabs完成了1.8億美元的C輪融資,Seasame完成了2.5億美元的B輪融資,Gradium完成7000萬美元種子輪融資,還有云知聲也成功在港股IPO。足以見得,這一賽道的爆發增長態勢。
但與同類公司不同的是,Deepgram在應用場景方面走出了一條讓人意想不到的道路。在宣布此輪融資的同時,公司還公布了一則最新收購消息。
Deepgram收購了同為YC投資孵化的一個AI點餐項目OfOne,并成立Deepgram for Restaurants新業務,原OfOne CEO Will Edwards擔任此新業務的總經理。
![]()
(OfOne智能點餐)
據悉,OfOne曾開發過一套語音AI驅動的點餐系統,訂單準確率高達93%,能夠有效處理背景噪音、多元化口音、復雜的菜品定制需求等問題。基于業務的部分重合性,Deepgram也將其原有的業務加以利用,推出的Deepgram for Restaurants垂直于餐飲服務。通過專業訓練的語音模型,實現與真人用戶互動點餐,并能實時協助餐廳員工工作。
Stephenson認為,大眾的語音AI的首次互動往往都是在零售環境中發生的,但零售環境充滿了挑戰。甚至連麥當勞、塔可鐘等多個餐飲品牌都曾因語音AI試點未達預期,而收縮或暫停。甚至塔可鐘還曾出現過有人對著AI點了1.8萬個水杯的搞笑“名場面”,由此也可以看出AI在處理不同用戶表達、口音或復雜需求時,還是有很大的可提升空間的。此次收購OfOne深入餐飲場景,可以說是Deepgram迎難而上,直面挑戰的一次新嘗試。
餐飲之外,Deepgram還在醫療、客服、銷售、金融等多行業多場景下有著靈活的使用。特別是醫療場景,由于歐美國家去醫院看病一般都要提前很久預約,專業醫生人力資源短缺,醫生除了看病之外,還需處理記錄、整理等流程上的工作。
而使用語音AI后,AI就可以智能捕捉實時對話內容,并形成結構化記錄,語音輸入直接撰寫完整的處方,甚至提供7×24小時自助服務,處理患者咨詢、預約安排等。讓醫生能夠專注于看病,其余事項交給AI來處理提升效率。
![]()
相對于醫療場景下AI需要體現嚴謹、認證以及專業度,客服場景下就會稍顯靈活一些。如上文所說,B端用戶可以去定制化語音AI的角色形象,讓對面顯得不再是冷冰冰的機器,而是鮮活、有生命力的擬人形象,支持選擇不同模型來思考,設置第一句打招呼用語、結束語、提示詞、關鍵詞、專業術語等等。
此外,用戶還可以在0-1之間自定義LLM數值來控制AI的隨機反應,數值越低,模型則更加可以預測,也就是可控性越強,數值越高,則會增加AI的“不可控性”,AI輸出的內容更加隨機,也可能會變得“放飛自我”。
總的來說,Deepgram此輪融資一方面可以被視為公司現金流的補充,對前兩年裁員降本、市場壓力的緩解;另一方面則是其業務版圖向新場景的延伸。可以預見的是,未來,語音AI將不再只是辦公室里的效率工具,而是會滲透進大眾生活的方方面面,成為解決復雜問題的日常伙伴。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.