![]()
每天,推薦系統(tǒng)都在捕捉我們的興趣與偏好。從刷過的視頻到停留的直播間,算法總是聚焦在「內(nèi)容」的理解上,推斷用戶喜歡哪類視頻、哪種話題,擅長在「內(nèi)容層」識別用戶喜歡什么,卻很少真正理解「你是誰」。
快手消費策略算法團隊注意到了這一問題,他們想讓推薦系統(tǒng)不止「會猜」,而是「懂你」。為彌補這一缺失的建模角度,快手消費策略算法團隊聯(lián)合快手基礎大模型與應用部及武漢大學,提出了 TagCF 框架,讓推薦系統(tǒng)從「知其然」邁向「知其所以然」。
該研究成果已被 NeurIPS 2025 接收,相關(guān)代碼與實驗框架已全面開源,旨在為學術(shù)界與工業(yè)界提供一套以「理解驅(qū)動」為核心的推薦系統(tǒng)方法論。
![]()
- 論文標題:Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation
- 論文: http://arxiv.org/abs/2505.10940
- 代碼: https://github.com/Code2Q/TagCF
背景和動機
用戶理解:A Missing Formulation
![]()
圖 2
當推薦系統(tǒng)通過統(tǒng)計模型學出兩個內(nèi)容之間的關(guān)聯(lián)并據(jù)此進行推薦時,這種關(guān)聯(lián)背后往往隱藏著用戶角色這一「混雜因素」。如圖2 所示,headset-symphonist-violin 的關(guān)聯(lián)關(guān)系,實則來源于「交響樂手」這一用戶角色;在電商場景中,「啤酒-新晉奶爸-尿布」的經(jīng)典案例同樣印證了這一點。相比基于 ID 的傳統(tǒng)隱式建模,引入user role視角讓推薦系統(tǒng)得以更清晰地理解用戶,從而邁向顯式的可解釋推薦演進。
另一方面,當需要建模 topic-topic 關(guān)聯(lián)時,本身可以將其當作 topic-role-topic 關(guān)聯(lián)的結(jié)果圖。這意味著引入 user role 的建模方式在邏輯上更具通用性與表達能力。這種通用的協(xié)同行為建模,不僅能捕捉那些統(tǒng)計方法難以識別的弱交互,還能精準建模并有邏輯地突破用戶的信息繭房(后文有驗證)。
并且,團隊還通過實驗發(fā)現(xiàn),基于 user role 的建模在統(tǒng)計意義上優(yōu)于傳統(tǒng)的 topic 建模,不僅具備更穩(wěn)定的空間,也能帶來更顯著的推薦效果提升。
綜上所述,一個更有效的推薦系統(tǒng)需要有能力通過用戶與物料之間的交互數(shù)據(jù),學習到用戶是一個什么樣的人,并找到涉及用戶角色的通用的原則性的客觀邏輯規(guī)律。
注:文章后續(xù)描述中 user tag = user role = 用戶特性,item tag = item topic = 興趣點。
兩個新任務
除了傳統(tǒng)的推薦任務外,本研究借鑒 topic modeling 的思路,為推薦系統(tǒng)拓展出兩個新任務:
用戶角色識別(User Role Identification):建模一個用戶的特征、個性、社會角色、需求;其中特征包含但不限于用戶直接提供的特征值(如性別和年齡)。
用戶行為邏輯建模(Behavioral Logic Modeling):建模 user role 和 item topic 之間的邏輯關(guān)聯(lián)圖(如圖3),可細分為 I2U 和 U2I 兩個子任務:
- I2U:具有某一特性(topic)的物料適合分發(fā)給什么特性(role)的用戶。
- U2I:具有某種特性(role)的用戶會希望看到什么特性(topic)的物料。
![]()
圖3
解決方案
模塊設計
![]()
圖4 - TagCF 主要功能模塊
TagCF 主要包含如下三個模塊:
- 基于 MLLM 的視頻內(nèi)容理解中臺:系統(tǒng)遍歷每天新增的視頻(達到一定曝光數(shù)量后),利用 MLLM 模型(M3[1])對每個視頻i提取多模態(tài)內(nèi)容和視頻 embedding,然后通過人工設計的 prompt(圖5)引導 MLLM 模型理解視頻語義,從而自動生成相應的 item tag 與 user tag,并實時更新標簽庫。
![]()
圖5
- 基于 LLM 的行為邏輯圖探索中臺:在得到兩種 tag 集合后,第二步就是構(gòu)建 tag2tag 邏輯圖,即 U2I 和 I2U 邏輯圖。具體的,根據(jù)給定的起始 tag,我們構(gòu)建對應的邏輯推理 prompt(圖6),并通過一個 LLM(QWen2.5-7B[2])來生成對側(cè)的目標 tag。
![]()
圖6
- 賦能下游推薦系統(tǒng):在獲得內(nèi)容理解的 tag 信息和 tag2tag 邏輯圖后,下游推薦系統(tǒng)可以使用這些中臺信息對推薦模型進行對應的增強(屬 LLM-for-rec 范式,有別于 LLM-as-rec 范式)。為了保證建模空間的一致性,團隊提出可以單獨針對 itemtag 空間或 usertag 空間進行模型增強,對應的方案為TagCF-it和TagCF-ut。實驗驗證了三個可行的推薦系統(tǒng)增強方案:基于 tag 的 encoder 模型增強、基于 tag-logic 對齊的訓練增強和基于 tag-logic 的預估分數(shù)增強。
注:文章認為內(nèi)容理解中臺產(chǎn)出的 tag-logic 體系雖然來自于推薦系統(tǒng)且驗證于推薦系統(tǒng),但其具有一定通用性,尤其行為邏輯圖也被驗證有一定遷移能力,未來可以為其他相關(guān)業(yè)務(如電商和搜索)賦能。
挑戰(zhàn)和工程方案
實現(xiàn)過程中也存在如下挑戰(zhàn):無限制生成導致的 tag 集合無序擴張、視頻覆蓋率長尾分布、無序生成和精細打分需求的矛盾、大模型生成結(jié)果缺乏評測手段等。
為了解決上述問題,文章提出了幾個有效的解決方案并在線上落地:
- 構(gòu)建弱重疊高頻 tag 子集,即 cover set:該方法旨在自動化地提取使用效率高的 tag 子集,在后驗觀測上發(fā)現(xiàn)高頻 tag 經(jīng)驗上比長尾 tag 具有更好的通用性。cover set 的構(gòu)建也分為 usertag 和 itemtag 兩個對稱的部分,其過程相近,具體流程如下:
![]()
經(jīng)驗上,cover sets 在量級上為 7k-20k 不等,相比開放語義空間中的全集,cover sets 能夠在 30 天內(nèi)收斂,在工業(yè)場景下具有足夠的穩(wěn)定性和通用性,有利于各種下游鏈路的研發(fā)。
- 對內(nèi)容理解結(jié)果進行模型蒸餾:主要目的是根據(jù) MLLM 和 LLM 產(chǎn)出的 item2tag 數(shù)據(jù)和 tag2tag 數(shù)據(jù)訓練對應的蒸餾小模型,以便對 tag 進行精細排序,對應的蒸餾模型后續(xù)在推薦過程中也會被重復利用。
- 人工大模型對比驗證:采用經(jīng)典的 Good-Same-Bad 策略,從準確率、完整度、合理性和可讀性等多個維度進行了人工評測。結(jié)果顯示,該方法在效果上已能滿足工業(yè)級應用需求,整體表現(xiàn)與GPT-4o接近。
![]()
![]()
顯式繭房建模和突破
基于上述三個模塊,TagCF-it 模型延續(xù)興趣點建模思路,而 TagCF-ut 模型則拓展至用戶角色識別與行為邏輯挖掘。至此,推薦系統(tǒng)已有能力顯式地建模用戶繭房并通過統(tǒng)計模型進行對齊。
具體的,團隊通過學習得到的模型預估出對應的繭房內(nèi)(top-20)tag 集合,記為 T(0),然后通過 U2I 和 I2U 邏輯圖以一定 branch factor 進行發(fā)散,得到繭房外的 tag 集合,記為 T(1)。下圖為示例:
![]()
可以顯式控制的兩種預估策略:
- TagCF-util:僅使用T(0),維持繭房內(nèi)特性,注重提升準確度。
- TagCF-expl:使用T(0)和T(1)的并集,突破繭房并進行相關(guān)新特性探索,注重提升多樣性。
實驗
離線實驗
主實驗在快手的 industrial 離線數(shù)據(jù)集上首先得到驗證。
- NDCG 和 MRR 是推薦準確率指標,Cover 和 Gini 是多樣性指標。
![]()
實驗結(jié)論:
- TagCF 能有效增強 backbone 模型推薦效果。
- 提取的邏輯圖中臺可以 transfer 到其他數(shù)據(jù)集上(僅 transfer 邏輯圖,item2tag 信息仍然需要額外的大模型推理生成和蒸餾模型對齊),且仍然能夠提升對應 backbone 的效果。
- 兩種 TagCF 變體呈現(xiàn)出不同的行為特性,TagCF-ut 整體準確率更好,TagCF-it 則更容易提升多樣性。
三個增強模塊的 Ablation 驗證了對應模塊設計的有效性。
![]()
線上實驗
在研究中,團隊進行了線上重排階段的模型增強實驗,其具體的 workflow 如下圖:
![]()
- 團隊進行了模型增強、訓練增強和預估打分增強,且在打分增強階段分別實驗了 TagCF-util 和 TagCF-expl。
![]()
- 在實驗中,團隊發(fā)現(xiàn) TagCF-expl 能夠有效提升用戶長期留存指標 LT+0.037%。
此外,團隊還觀測到,usertag 集合比 itemtag 集合具有更強的穩(wěn)定性和表達能力,體現(xiàn)在其更小的集合大小、更快的收斂速度(如下表所示)以及 3.1 節(jié)所示更強的模型增強效果。這些優(yōu)勢意味著,相比興趣點,用戶角色是更加穩(wěn)定的特征,更加適于推薦系統(tǒng)中的建模和分析。
![]()
總結(jié)和思考
快手團隊從推薦系統(tǒng)的「雙端視角」出發(fā),首次提出「視頻理解與用戶理解并重」的理念,并證明了以用戶理解為核心的推薦系統(tǒng)在當前范式下的獨特優(yōu)勢。推薦系統(tǒng)的目標從來不只是「推薦內(nèi)容」,它更關(guān)乎理解人(微觀)與社會(宏觀)的科學。
基于這一理念,團隊構(gòu)建了 TagCF ——包含 tag-logic 內(nèi)容理解中臺和推薦系統(tǒng)增強兩個組成部分。tag-logic 內(nèi)容理解中臺具備強大的可遷移能力,其通用框架也可以在召回等其他鏈路階段使用,未來可擴展至召回、電商、搜索等多業(yè)務場景;另一方面,推薦系統(tǒng)增強模塊將有能力直觀建模用戶繭房并進行突破和探索。
推薦系統(tǒng)與大模型的結(jié)合,正在讓內(nèi)容分發(fā)進入一個全新的階段。
它能更聰明地理解用戶、更精準地匹配內(nèi)容,也帶來了關(guān)于隱私、安全與公平的新思考。未來,團隊將繼續(xù)完善 tag-logic 中臺體系,探索更高效的推理與資源利用方式。
長期以來,行業(yè)主要深耕于統(tǒng)計模型建模路徑,快手也相繼推出了 OneRec[3] 與 GoalRank[4] 等代表性前沿技術(shù)成果。而本文提出的顯式用戶理解與 tag-logic 建模方法,則在符號與統(tǒng)計兩種范式之間搭起了橋梁,為行業(yè)帶來了全新的想象空間。
更重要的是,tag-logic 邏輯圖讓系統(tǒng)有能力從用戶的信息繭房出發(fā),展開有邏輯的語義探索——既保持精準,又敢于突破。如何在「準確」與「多樣」之間找到平衡,正是推薦系統(tǒng)進化的關(guān)鍵命題。從「懂內(nèi)容」到「懂人」,TagCF 的探索不僅是技術(shù)的一次躍遷,更是技術(shù)貼近真實的人與社會的具象體現(xiàn)。
參考文獻:
[1] Mu Cai, Jianwei Yang, Jianfeng Gao, and Yong Jae Lee. Proceedings of the 13th International Conference on Learning Representations, 2025.
[2] An Yang, Baosong Yang, Beichen Zhang, Binyuan Hui, Bo Zheng, Bowen Yu,Chengyuan Li, Dayiheng Liu, Fei Huang, Haoran Wei, et al. Qwen2. 5 technical report. arXiv preprint arXiv:2412.15115, 2024
[3] Zhou, Guorui, et al. "OneRec Technical Report." arXiv preprint arXiv:2506.13695 (2025).
[4] Zhang, Kaike, et al. "GoalRank: Group-Relative Optimization for a Large Ranking Model." arXiv preprint arXiv:2509.22046 (2025).
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.