![]()
當你在電商平臺搜索“蘋果”,系統會推薦“水果”還是“手機”?或者直接跳到某個品牌旗艦店?短短一個詞,背后承載了完全不同的購買意圖。而推薦是否精準,直接影響用戶的搜索體驗,也影響平臺的轉化效率。
查詢推薦(Query Suggestion)是現代電商搜索系統中的關鍵功能,通過在用戶輸入過程中實時推薦相關查詢,幫助用戶快速明確意圖,提升搜索體驗與轉化效率。傳統方法通常采用多階段級聯架構(MCA),雖然在效率與效果之間取得了一定平衡,但由于各階段目標不一致、長尾查詢召回困難等問題,限制了系統性能的進一步突破。
基于上述問題,快手在業界首次提出端到端的生成式統一查詢推薦框架 ——OneSug,成功將召回、粗排、精排等多個階段統一在一個生成模型中,顯著提升了推薦效果與系統效率,在快手電商場景中實現了業務指標與用戶體驗的雙重提升。
本工作相關成果《OneSug: The Unified End-to-End Generative Framework for E-commerce Query Suggestion》已被人工智能頂級會議 AAAI 2026 接收。
![]()
論文鏈接:https://arxiv.org/abs/2506.06913
一、研究背景
傳統查詢推薦系統通常采用多階段級聯架構,依次進行召回、粗排和精排。盡管該架構在響應時間與轉化率之間實現了一定平衡,但也帶來了明顯的局限性:
- 級聯式框架(召回 -> 粗排 -> 排序),前一鏈路性能決定下一鏈路上限;
- 召回、排序分離技術迭代范式,全鏈路統一目標優化難;
- 長尾前綴由于缺乏歷史行為數據,難以召回高質量 Query。
近年來,生成式檢索(Generative Retrieval)因其強大的語義理解與生成能力,在推薦與搜索領域展現出巨大潛力。然而,現有方法多聚焦于視頻推薦,其本質上是一個開集到開集的任務,難以直接應用于輸入輸出都是開放詞表的的查詢推薦場景。
![]()
![]()
二、方法簡介:OneSug 的三大核心模塊
![]()
針對上述問題,快手提出了 OneSug 模型,整體架構如上圖所示,主要包括 3 個部分:
(1)Prefix-Query 表征增強模塊(Prefix2Query Representation Enhancement)
(2)統一的 Enc-Dec 生成架構(Unified Encoder-Decoder Architecture)
(3)用戶行為偏好對齊(User Preference Alignment)
1. Prefix-Query 表征增強模塊
Sug 場景下,用戶輸入的前綴往往較短且意圖模糊(如 “蘋果” 可指水果或品牌)。為此,快手提出的解決方式分為 2 個部分。
- 語義與業務空間對齊:以 BGE 作為 base 模型,同時引入用戶真實的 prefix2query、query2query 數據,使用對比學習對 BGE 進行微調,使其語義空間與快手電商的業務特征空間對齊。
- 層次化語義 ID 生成:在對齊語義空間的基礎上,引入 RQ-VAE,為每個前綴和 Query 生成層次化的語義 ID。RQ-VAE 可將任意文本映射為離散的語義 ID,同時保證語義相近的 query 會被編碼到相同的簇中。通過這種方式,對于任何一個用戶輸入的前綴,可以快速匹配到與其語義 ID 最接近的 top-K 個相關 query,作為增強上下文輸入后續生成模型。
2. 統一的 Enc-Dec 生成架構
OneSug 的生成架構基于 Enc-Dec 結構,并直接通過自回歸(Autoregressive)方式生成用戶最有可能點擊的 Query。
該模型的輸入包含四個關鍵部分:
(1)用戶當前輸入前綴(如 “智能手機”)
(2)由 PRE 模塊增強的相關查詢序列(如 “智能手機性價比 2025”)
(3)用戶歷史行為序列(如過去搜索的 “藍牙耳機”、“手機殼” 等)
(4)用戶畫像信息
輸出即為模型生成的 Query 列表(如 “智能手機推薦 2025”、“智能手機性價比排行”)。
3. 用戶行為偏好對齊(RWR)
3.1 用戶偏好量化
![]()
![]()
![]()
3.2 混合排序框架獎勵加權偏好優化
傳統的 DPO 使用 < 正樣本,負樣本 > 對進行訓練,但默認兩者同等重要。這在業務場景中是不合理的,因為區分 “點擊” 和 “曝光” 的難度遠小于區分 “點擊” 和 “隨機負樣本”。
RWR 的核心思想是根據正負樣本之間的獎勵差距,為不同的樣本對賦予不同的學習權重。快手構建了九種類型的樣本對(如
)。對于每一對樣本,計算其獎勵差異權重 rwΔ:
![]()
![]()
3.3 混合排序框架
為了克服傳統 Pairwise 范式的 DPO 在全局排序能力上的局限性,快手引入了一種混合排序框架。該框架將 listwise 范式的排序損失和 point-wise 范式的 sft loss 進行混合,使得模型既能獲得高效的排序能力,同時避免 reward hacking 造成的生成能力下降。
Pairwise 范式對齊模型,在包含多個負樣本的候選中無法學習到 “哪個是最好的”。受 Plackett-Luce 模型啟發,快手設計了 Listwise 排序損失,對于正樣本,讓模型同時拉大它與所有負樣本的獎勵差距,迫使模型不僅要知道正樣本比負樣本好,還要學會在負樣本越多、越強的情況下,依然將正樣本排在前面,從而直接優化列表的整體排序質量。
論文中分別提出了基于 Pairwise 和 ListWise 范式的混合排序框架,同時在理論上證明了 Pairwise 范式的對齊模型是 ListWise 的特殊情況。
![]()
三、實驗結果
離線效果
在快手電商場景的大規模數據集上,OneSug 在 HR@16 和 MRR@16 指標上均顯著優于傳統多階段系統與生成式基線模型。論文中同時提到,OneSug 不僅適用于 Enc-Dec 結構的生成式模型,Decode-only 架構的模型同樣適用,且具有更高的離線指標,因為現階段的推理耗時約束暫時沒有進行在線實驗。
![]()
在線 A/B
OneSug 模型目前已在快手電商搜索場景下全量推全。在 AB 實驗中,OneSug 大幅度提高了 Ctr、訂單和 GMV 等指標,同時人工測評 GSB 指標也有很大幅度的提升。
![]()
![]()
在線推理
線上流程完全取代了召回 - 粗排 - 精排,使平均耗時降低了 43.2%,為后續優化提供了充足的空間。
![]()
四、總結與展望
OneSug 是業界首個在電商場景中實現全流量部署的端到端生成式 Query 推薦系統,其統一建模方式顯著提升了語義理解與個性化推薦的能力,為生成式模型在搜廣推的落地提供了新范式。
未來,快手將進一步探索大語言模型在排序階段的強化學習優化、實時更新等方向,持續推動端到端生成式系統在推薦、廣告等多業務場景中的廣泛應用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.