![]()
作者丨漫地
編輯丨關(guān)雎
圖源丨Midjourney
距離富有人情味的AI語(yǔ)音客服面世,還要多久?
最近,總部位于倫敦的初創(chuàng)公司PolyAI拿到了8600 萬(wàn)美元(人民幣約6億元)的D 輪融資,這家公司正在做的事情專攻一個(gè)點(diǎn)——打造可以像人工對(duì)話一樣自然的AI語(yǔ)音客服。
此輪投資,由著名風(fēng)投公司Georgian、Hedosophia和Khosla Ventures共同領(lǐng)投。其他投資者包括英偉達(dá)旗下的NVentures、英國(guó)商業(yè)銀行、花旗創(chuàng)投、Squarepoint Ventures、Sands Capital Ventures、Zendesk Ventures 和 Point72 Ventures。
01劍橋博士的創(chuàng)業(yè)路
PolyAI由Nikola Mrk?i?、Tsung-Hsien Wen和Pei-Hao Su于2017年創(chuàng)立,他們是在劍橋大學(xué)機(jī)器智能實(shí)驗(yàn)室的對(duì)話系統(tǒng)小組相識(shí)的。
Nikola此前在劍橋大學(xué)獲得機(jī)器學(xué)習(xí)博士學(xué)位,他在人工智能語(yǔ)音領(lǐng)域的從業(yè)經(jīng)歷,可以追溯到更早的時(shí)候。
![]()
Nikola Mrk?i? 圖源:PolyAI
在他碩士畢業(yè)的時(shí)候,原本計(jì)劃去瑞士信貸(Credit Suisse)實(shí)習(xí),走上大多數(shù)學(xué)生都會(huì)選擇的一條高成就、低風(fēng)險(xiǎn)的職業(yè)道路。但他的碩士導(dǎo)師,機(jī)器學(xué)習(xí)領(lǐng)域的傳奇人物Zoubin Ghahramani 提醒他:“別去做個(gè)只會(huì)做PPT的家伙。”
于是機(jī)緣巧合下,Nikola作為首位員工加入了彼時(shí)初創(chuàng)的語(yǔ)音技術(shù)公司 VocalIQ。2015年, VocalIQ被蘋果收購(gòu),主要是為了將VocalIQ的技術(shù)用于蘋果的語(yǔ)音助手Siri中,讓它變得更加智能。那個(gè)時(shí)候的VocalIQ產(chǎn)品,可以對(duì)用戶提出的語(yǔ)義不明確的問(wèn)題進(jìn)行追問(wèn),就好像是和真正的人在交流一樣。
有了這段智能語(yǔ)音的從業(yè)基礎(chǔ),在VocalIQ被收購(gòu)的兩年后,Nikola 與兩位來(lái)自臺(tái)灣的研究員 Tsung-Hsien Wen 和 Pei-Hao Su 決定更深入地探索語(yǔ)音助手領(lǐng)域。于是 PolyAI應(yīng)運(yùn)而生,其使命很簡(jiǎn)單:打造不會(huì)讓用戶感到被區(qū)別對(duì)待的語(yǔ)音助手。
Nikola此前在接受媒體采訪時(shí)談到,“我們團(tuán)隊(duì)從零開(kāi)始重建了語(yǔ)音助手的整個(gè)基礎(chǔ)設(shè)施。” 最后,一個(gè)不僅能識(shí)別語(yǔ)音,還能理解語(yǔ)音、適應(yīng)語(yǔ)音內(nèi)容并像人一樣回答問(wèn)題的平臺(tái)就這樣誕生了。
在一個(gè)人們大談延遲性和準(zhǔn)確性的技術(shù)環(huán)境里,PolyAI憑借其專有模型、戰(zhàn)略自主性和以客戶為中心的理念(超越技術(shù)層面)保持領(lǐng)先地位。談起經(jīng)營(yíng)理念,Nikola認(rèn)為, “我們專注于讓用戶真正感受到優(yōu)質(zhì)服務(wù)。這才是制勝之道。”
02一個(gè)像真人一樣回答問(wèn)題的平臺(tái)
都在做AI語(yǔ)音,怎么和其他同類對(duì)手區(qū)分開(kāi)來(lái)?
PolyAI抓住了企業(yè)運(yùn)用語(yǔ)音客服卻普遍無(wú)法做到反應(yīng)靈敏、以及場(chǎng)景適應(yīng)性差的痛點(diǎn)。
于是,創(chuàng)造一個(gè)足夠智能的對(duì)話式Agent就變得很重要!PolyAI將其定位在幫助企業(yè)管理客戶互動(dòng)——它不僅能夠理解復(fù)雜的多輪對(duì)話,處理不同地區(qū)的口音和語(yǔ)言,還能完成客戶的身份驗(yàn)證、預(yù)訂和支付等端到端任務(wù)。
對(duì)于顧客在語(yǔ)音通話中產(chǎn)生的中斷、解釋、甚至是離題的對(duì)話場(chǎng)景,PolyAI都能用傳統(tǒng)交互式語(yǔ)音應(yīng)答系統(tǒng)無(wú)法做到的方式來(lái)處理,這背后的技術(shù)支撐是PolyAI專為電話對(duì)話優(yōu)化的語(yǔ)音識(shí)別和對(duì)話模型。
![]()
圖源:Poly AI官網(wǎng)
“據(jù)我所知,我們是唯一一家運(yùn)行擁有數(shù)十種不同語(yǔ)言、適用于不同場(chǎng)景/用例的自動(dòng)化系統(tǒng)的公司。” PolyAI的CEO Nikola顯然以此為傲。對(duì)于AI公司對(duì)語(yǔ)音人工智能的打造,Nikola認(rèn)為,并不僅僅只是為了取代企業(yè)呼叫中心的人工客服,它能做的事情還應(yīng)該更多,包括自動(dòng)化處理那些人工操作成本過(guò)高的任務(wù)來(lái)幫助企業(yè)提高收入。“我們的人工智能不僅會(huì)接聽(tīng)顧客的每一個(gè)電話,而且從不忘記向他們順帶推銷其他產(chǎn)品。”
八年前,這家公司的前身只是劍橋大學(xué)呼叫中心開(kāi)發(fā)的AI助手,這些助手用來(lái)引導(dǎo)客戶處理各種咨詢、每天處理數(shù)百萬(wàn)個(gè)電話。
但是現(xiàn)在, PolyAI的客戶群涵蓋金融服務(wù)、醫(yī)療保健、酒店和零售等行業(yè),許多大企業(yè)客戶都在采用他們的智能語(yǔ)音平臺(tái),包括萬(wàn)豪酒店、凱撒娛樂(lè)和Foot Locker等知名企業(yè)。PolyAI正在為加州最大的能源公司太平洋煤氣電力公司 (Pacific Gas and Electric Co.) 處理有關(guān)停電的客戶問(wèn)詢電話,為意大利聯(lián)合信貸銀行 (UniCredit SpA) 處理有關(guān)新開(kāi)銀行卡和遺失信用卡的咨詢,并為拉斯維加斯的賭場(chǎng)(例如凱撒宮和金塊賭場(chǎng))處理餐廳訂單。
根據(jù)PolyAI公開(kāi)的財(cái)務(wù)記錄顯示,截至2024年1月31日的12個(gè)月內(nèi),其收入為890萬(wàn)美元,而到2025年同期,收入已超過(guò)1500萬(wàn)美元。PolyAI的CEO Nikola稱,PolyAI語(yǔ)音的逼真度和靈活性使其在過(guò)去一年中實(shí)現(xiàn)了銷售額的顯著增長(zhǎng)。他向媒體表示,公司有望在2025財(cái)年實(shí)現(xiàn)年度經(jīng)常性收入翻番,超過(guò)4000萬(wàn)美元,其中美國(guó)客戶的銷售額預(yù)計(jì)將增長(zhǎng)兩倍。
營(yíng)收不斷增長(zhǎng),PolyAI融資的腳步也是不斷。從2017年至今,其一共進(jìn)行了六輪融資。最近這筆8600萬(wàn)美元的融資里,英偉達(dá)的NVentures、科斯拉風(fēng)投(Khosla Ventures )、Point72 Ventures、Sands Capital Ventures等機(jī)構(gòu)都是多次跟投。本輪融資也使該公司迄今為止的總?cè)谫Y額超過(guò)2億美元,目前,PolyAI的估值達(dá)到7.5億美元。
![]()
對(duì)于最近的這筆新投資,PolyAI計(jì)劃進(jìn)一步開(kāi)發(fā)其Agent Studio平臺(tái)技術(shù),并擴(kuò)大市場(chǎng)推廣力度。
03中美人工智能語(yǔ)音市場(chǎng)前進(jìn)到哪了?
對(duì)PolyAI 進(jìn)行風(fēng)險(xiǎn)投資的機(jī)構(gòu)都清楚地認(rèn)識(shí)到人工智能帶來(lái)的機(jī)遇。
相較于市面上其它也在做語(yǔ)音客服的競(jìng)品,PolyAI 更關(guān)注高質(zhì)量的語(yǔ)音交互。這使它區(qū)別于 Five9、Genesys 或 Avaya 等更廣泛的聯(lián)絡(luò)中心平臺(tái),以及Cognigy、Kore.ai 或 Leaping AI 等更以工作流程為中心的對(duì)話式 AI 參與者。這些參與者通常跨越多個(gè)渠道,但在逼真、復(fù)雜的語(yǔ)音通話方面則顯得不太專業(yè)。
PolyAI 的競(jìng)爭(zhēng)對(duì)手包括多家美國(guó)語(yǔ)音人工智能初創(chuàng)公司,這些公司近幾個(gè)月也吸引了大量風(fēng)險(xiǎn)投資。其中包括Sierra Technologies 在9月份完成了一輪3.5億美元的巨額融資,使其估值超過(guò)100億美元;而總部位于舊金山的Decagon AI在6月份的融資中獲得了1.31億美元,估值達(dá)到15億美元。該公司在歐洲也面臨著激烈的競(jìng)爭(zhēng),總部位于巴黎的Parloa GmbH在5月份融資1.2億美元,估值達(dá)到10億美元。
PolyAI的CEO Nikola表示,PolyAI與其競(jìng)爭(zhēng)對(duì)手的主要區(qū)別之一在于,它開(kāi)發(fā)了自己的大型語(yǔ)言模型,這使其在真實(shí)性方面具有優(yōu)勢(shì)。而它的競(jìng)爭(zhēng)對(duì)手只是簡(jiǎn)單地接入OpenAI等公司或Eleven Labs 等語(yǔ)音AI初創(chuàng)公司的大語(yǔ)言模型。
回到中國(guó)智能客服市場(chǎng)來(lái)看,明顯呈現(xiàn)出一個(gè)頭部企業(yè)聚集的格局。科大訊飛、百度、阿里、騰訊、華為云紛紛布局智能語(yǔ)音。科大訊飛憑借全棧自研技術(shù)深耕教育與醫(yī)療等垂直行業(yè),走“AI+剛需”的技術(shù)驅(qū)動(dòng)路線;百度與阿里均側(cè)重生態(tài)構(gòu)建,但百度以DuerOS和小度硬件主攻家庭入口,阿里則依托電商、支付生態(tài)將語(yǔ)音深度融入商業(yè)場(chǎng)景;騰訊將語(yǔ)音作為底層能力賦能其社交與游戲等核心業(yè)務(wù),布局相對(duì)內(nèi)斂。
而近幾年中國(guó)的AI智能語(yǔ)音初創(chuàng)公司數(shù)量上相對(duì)美國(guó)市場(chǎng)較少,它們大都通過(guò)深耕細(xì)分領(lǐng)域(金融、政務(wù)、跨境等)和技術(shù)差異化(低延遲、方言支持、合規(guī)適配)來(lái)構(gòu)建護(hù)城河。比如賽舵智能深耕金融場(chǎng)景定制化語(yǔ)音機(jī)器人,云蝠智能的核心產(chǎn)品線包括大模型語(yǔ)音智能體,為企業(yè)提供CRM及AICC大模型呼叫中心,以及智齒科技通過(guò)提供全渠道的客戶聯(lián)絡(luò)解決方案,嵌入到企業(yè)的營(yíng)銷、服務(wù)等多個(gè)環(huán)節(jié)。
![]()
回到PolyAI來(lái)看,Georgian Capital的投資人 Emily Walsh 表示,這是她第二次投資這家初創(chuàng)公司。“對(duì)于全球最大的品牌而言,客戶服務(wù)不再僅僅是一個(gè)成本中心,而是一個(gè)巨大的價(jià)值創(chuàng)造機(jī)會(huì),”她說(shuō)道。“PolyAI 能夠在企業(yè)級(jí)規(guī)模上部署栩栩如生的語(yǔ)音助手,從而帶來(lái)顯著的成本節(jié)約和收入增長(zhǎng)。”
而作為一個(gè)創(chuàng)業(yè)者,Nikola認(rèn)為,打開(kāi)想象力很重要。如今很多語(yǔ)音類的產(chǎn)品創(chuàng)新能力不夠,這表現(xiàn)在它們往往只是一些輔助工具,讓客服人員的工作能力略有提升。
“但是,你要想象一下這樣的一個(gè)世界:大部分工作都實(shí)現(xiàn)了自動(dòng)化,人只需要輔以適當(dāng)?shù)娜斯じ深A(yù)就可以了。我們要構(gòu)建的是一個(gè)由人工智能驅(qū)動(dòng)、高薪知識(shí)型員工主導(dǎo)的世界。所以,現(xiàn)在就開(kāi)始實(shí)現(xiàn)電話自動(dòng)化吧!”
本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.