![]()
上周和一位好久沒聯系的前同事約了頓飯,他現在是一家知名金融SaaS企業的CTO,席間他給我講了他們的一個困惑:
現在公司要求全員向AI轉型,他也帶著團隊打造了一款對客智能體。現在這款產品已經打磨了1年,數據鏈路打通了,流程也跑得起來,邏輯覆蓋度和意圖識別準確率也比一年前高很多。可一談到推向市場,大家還是很猶豫。
他問我:“這產品到底怎么才算是能達到上限標準?上了會不會被用戶罵?是轉方向還是要繼續投入?”
這類問題我這兩年做項目聽得還挺多的。大模型能力提升很快,企業內部如果只是做出個能對話、給建議、生成結果的智能體,還是相對容易的。但真正的難點是:上線后有沒有人用,能不能形成一個穩定的業務價值?否則團隊閉門造車,最后只會越做越重、越做越像是個永遠上線不了的研究項目。
吃完那頓飯,我發現自己對“對客智能體”這件事,也重新建立了一套更清晰的理解。趁熱乎勁兒還沒過,就趕緊寫篇文章,借此機會把這套思路用可操作的方式給大家講清楚,方便你直接拿去對照自己的項目。
一、對客智能體能不能上,判斷標準不在技術,在結果
坦率說,對客智能體的上線標準,比對內要嚴格得多,尤其他們要做的產品,面向的還是垂直領域的企業客戶,萬一AI輸出的結果出錯,影響范圍還是非常大的。
不過在我問了一些技術上擔心的難點后,我的那位CTO同事非常自豪地告訴我,他們已經在自己的業務領域積累了很多行業數據,同步也打通了相關交叉領域的外部數據,我提到的一些復雜的查詢場景,也能用多輪澄清、再輸出候選方案的方式基本覆蓋。但就算是這樣,他們仍舊無法確認這產品是否“合格”。
我問他為什么,他給了三句原因:
技術雖然能跑通,但用戶的需求很難預測
場景涉及的變量太多,很擔心實際體驗不穩定
市場上對大模型的熱情和是否真實采用之間,還是有差距
這些顧慮,聽上去像是技術問題,但往深處想,真正的難點,在于決策體驗、用戶信任和商業價值。
在一個智能體項目中,判斷其成功的標準其實就一句話:
用戶愿意反復用,且能持續把關鍵指標往好的方向推。
這里有兩個關鍵詞:反復用、關鍵指標。
只要任何一個不成立,就算技術不是問題,也很難成為一個能長期投入的產品。
所以我給企業做判斷時,也會先向客戶明確這3個問題:
用戶愿意把哪一段決策環節交給你?
用戶從第一次體驗到產生信任,要經過幾步?
企業能否把價值算明白?
通過這3個問題,把判斷標準從技術方案,拉回到結果的可行性上。
二、對客智能體的兩條路線:執行型與決策型
在很多項目里,我發現最容易造成團隊混亂的,是產品定位不清晰。通常來講,對客智能體會走向兩種路線:
執行型:盡量替用戶做事,把流程自動走完
決策型:幫助用戶把選擇做得更穩,降低決策成本
執行型的想象力很強,技術挑戰也更大。決策型更克制,價值也更容易被驗證。
這兩種類型沒有好壞之分,因為在不同業務里,它們能發揮的價值不同。
而我在做定位時,會先看一個關鍵變量:用戶的容錯空間有多大?
容錯空間越小,執行型越危險。
容錯空間更大,執行型才有機會形成閉環。
差旅、金融、醫療、法務這類場景的共同特點很明顯:用戶對結果敏感,出錯的代價高,信任建立慢。這種情況下如果想通過流程自動化來解決效率問題,就很容易給自己挖坑。
所以那天的飯局上,我給出了一條很明確的判斷依據:如果你提供的AI產品,用戶對結果的容錯空間太小,那就要把方向從執行型收斂為決策型,先跑穩最核心的價值,再談更自動的執行能力。
三、判斷能否推向市場的四項硬指標
可能是產品經理的職業習慣吧,當討論陷入空對空的概念爭論時,我會傾向于用指標來對齊預期。
下面四條,是我在多個項目里會不斷強調的成功上線標準。它們都很樸素,但管用:
1)首次體驗的完成率與放棄點
AI產品,尤其是對客智能體,最致命的問題通常發生在前60秒。用戶第一次試用時一旦覺得麻煩、不穩定,會很快流失。
因此我通常建議把首次體驗拆成5個關鍵節點去看數據:
用戶是否能在第一輪就進入正確流程
澄清問題是否用戶愿意回答
用戶能否在 90 秒內拿到可行動的結果
用戶是否還要回到傳統方式自己查一遍
用戶在哪一步退出最多
如果完成率上不去,就先別急著把功能做復雜,而是先把前兩輪對話打磨到讓用戶覺得省心。
2)澄清輪數
對客智能體的澄清輪數過多,體驗基本就崩了。
我給過很多團隊一個簡單的上線門檻:平均澄清輪數控制在3輪以內。
超過3輪,用戶會覺得你在審問他。
少于3輪,很多場景又容易給不出靠譜結果。
這個閾值在很多項目里都很有效,可以先拿它作為目標。
3)結果采納率
對客智能體的結果,如果用戶很少采納,產品價值就會被質疑。
在業務復雜、風險較高的場景里,我常用的參考線是:結果采納率達到30%以上,并且能穩定維持。
如果連三成都不到,說明智能體在用戶眼里還沒有成為可靠的助力。你可以繼續優化,但不宜大規模曝光。
4)人工兜底比例和投訴率
對客場景一定會出現異常情況,關鍵在于異常是否可控。
我通常會要求客戶觀察兩個趨勢:
人工兜底比例能否逐步下降
投訴率在放量后是否穩定,不能出現明顯跳升
這里面有個很現實的經驗:很多團隊在小流量測試時表現很好,一放量就出問題。原因往往就出在數據超邊界、規則沖突、異常輸入處理不當、以及產品提示不足這些細節問題上。
四、產品定位的落地拆解方法
聊到最后,我把話題又拉回到產品本身,想聽聽他是怎么定位這款產品的。
他說了一句讓我印象很深的話:
“我們希望能幫用戶自動生成一套完整方案,但總感覺哪兒不對。”
我當時的判斷是:這個方向的問題,大概率出在“自動生成方案”這個目標上。
只要用戶對決策結果存在顧慮,他們就會反復檢查模型的答案。這樣一來,智能體不僅沒有幫忙,還增加了額外心理負擔。
基于這點,我們重新梳理了這個產品的定位,把它調整成一個對客場景的“決策助手”,而不是自動方案生成工具。
二者的區別是什么呢?下面這兩件事,我認為是決策助手更應該專注的點:
1)用戶不知道怎么選時,逐步引導他完成候選清單
這類助手的職責,不是直接給答案,而是讓用戶在幾步之內理清思路:
先確認關鍵約束(預算、偏好、時間區間)
再提出 2–3 個明確的澄清問題
最后匯總成一個結構化的可選清單
這個過程有助于降低不確定性,讓用戶感覺這是在AI的幫助下,逐步完善自己想法的過程,最終獲得一個可接受的方案。
“讓用戶參與到最后一公里中”,是目前AI產品獲得成功的關鍵原則。
如果用指標來衡量其是否可行,可以關注如下三項:
90 秒內產出清單的轉化率
澄清輪數是否不超過 3
清單采納率是否達到 30%
2)用戶已經選好了,希望有人幫他確認下這個方案是否最優
決策助手的第二個價值,是幫用戶確認當前的選擇是否是最佳方案。例如判斷當前方案:
有沒有違反企業政策
有沒有性價比更高的替代
有沒有隱藏風險(換乘間隔、退改簽限制、低評分等)
是否值得按原方案下單
輸出也可以固定成更結構化的格式:
建議結論:建議下單/建議換一個
觸發原因:哪條規則、哪項風險
替代方案:一到兩個即可
用戶需要確認的事項:兩條以內
這是我更建議他們團隊做深的一塊,原因很簡單:它更容易形成企業付費理由,也更容易降低風險。比如減少企業違規風險,避免被打回返工浪費的時間,還能幫企業節省預算,匹配出最優性價比的方案。
相比自動生成方案,這種服務為用戶提供了另一種安心感。
因此,只要從兩項出發找準定位、做出效果,銷售團隊也就能把故事講清楚,產品也會更好賣。
五、上線前還要cover住的三大成本
實驗階段,不斷放大模型能力來秀肌肉、造場景、擴功能,這都無可厚非,但真正要對客時,如果想不到這些成本,你的智能體就只會消耗在無休止的迭代里:
1)信任成本
用戶不信任你時,通常會出現下面三種典型行為:
反復追問同一個問題
拿它的答案去和其他渠道對比
只當作參考,不做實際動作
這些不信任行為帶來的額外成本,無法通過加功能解決,而是要在產品設計上,讓輸出結構化、可解釋,并允許用戶快速修正話術,不讓他再輸入一遍。總之就是盡量在前兩輪對話把約束說清楚,讓用戶覺得AI真的理解了他的訴求。
2)邊界成本
對客智能體最容易遇到的問題,就是基于模型能力倒推用戶需求,拿著錘子找釘子,最后的結果就是需求越堆越多、范圍越做越大、質量評測也會越做越難
為了控制邊界成本,我的建議是:
先定義10個高頻問題類型,跑穩一個閉環,建立評測集,作為一個迭代中期,之后再擴展到30個、50個,以此類推。
只要你愿意把邊界寫出來,團隊就會省掉大量無效投入。
3)運營成本
對客智能體上線后,必然會進入到運營階段。這里的運營,可不只是拉個群,回復下用戶反饋。因為你會發現:
答案結構要不斷迭代
規則和政策會持續變化
用戶輸入模式會多種多樣
評測集也要持續補充
很多團隊的預算只考慮了開發和模型成本,根本沒想著要運營這件事,最后就會出現上線后質量下滑、口碑反噬。
我通常會建議企業把運營機制當成產品的一部分設計,并在規劃時就要產出運營方案,包括但不限于:
每周收集Top問題并召開復盤會議
每周補充評測集并更新評測結果
每兩周檢查下規則與提示的有效性
每月跑一次大盤指標復核
這些動作聽著像是管理動作,但它們決定了智能體能不能長期穩定。
六、這頓飯后,我總結了對客智能體的三個判斷條件
雖然只是簡單地吃了頓飯,但對我而言,每次和高手的交流,都是對自己認知的一次復盤。
總結下來,一款對客智能體是否可行,從下面三點判斷就足夠了,如果無法同時滿足這三項,最后的市場化道路就會非常艱難:
1)用戶愿意把部分決策交給你
判斷方式很簡單:
能否在三輪對話內,把用戶的心態從迷茫變成清晰
是否真正幫用戶節省時間
用戶愿意采用智能體方案的比例能否達到三成以上
這決定了用戶是否愿意繼續使用。
2)場景的邊界和結構是否足夠明確
越能拆出結構化要素的場景,越適合作智能體,判斷標準如下:
需求能否被明確描述
變量是否能枚舉
規則能否被拆解成多套穩定的邏輯結構
模糊判斷是否可控
如果這些都不具備,越是想靠自動化提供服務,就越會給用戶帶來更多困擾。
3)企業能否從中獲得直接價值
對客智能體如果只是提升體驗,而缺少商業價值,就很容易被擱置。
因此要先問問自己,你的智能體,能否幫企業增加訂單、提升轉化、減少人工成本、規避不合規風險,又或者可以提升客單價或業務深度。企業要看到這些數字,才會愿意長期投入。
結語
對客智能體這兩年非常熱,很多團隊愿意投入,也投入得起。但真正稀缺的東西,反而是判斷什么時候該收斂,什么時候該放量,什么時候該停,什么時候該換方向。
這頓飯讓我更加確信:
對客智能體要想走得遠,靠的往往不是更大的想象力,而是更清晰的邊界、更穩定的體驗、更可計算的業務價值。
如果你的團隊正在做類似的產品,建議你把這套判斷閾值拿去對照一下。很多問題并不需要花太長時間討論,數據自然會給出答案。
希望這次飯局里討論出的經驗,可以成為你在思考智能體定位時的參考。
我是申悅,前互聯網大廠產品人,現在是一名All in AI的企業AI轉型咨詢顧問。歡迎加我好友互相交流。
回復“ 微信 ”,加我 個人微信
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.