<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      推薦系統擁有"最強大腦"—看大模型如何破解用戶真實喜好密碼

      0
      分享至


      這項由復旦大學和快手科技聯合完成的研究發表于2026年的《Under Review》期刊,研究團隊提出了一個名為RecGOAT的突破性推薦系統框架。有興趣深入了解的讀者可以通過論文編號arXiv:2602.00682查詢完整論文。

      當我們在網上購物時,推薦系統就像一位貼心的購物助手,會根據我們的瀏覽記錄和購買歷史向我們推薦可能感興趣的商品。然而,現在的推薦系統面臨著一個巨大的挑戰,就如同一位翻譯官試圖在兩種完全不同的語言之間進行交流一樣困難。

      一方面,大語言模型和視覺模型擁有豐富的世界知識,能夠深刻理解商品的文字描述和圖像內容,就像一位博學的學者能夠準確理解每件商品的特征和價值。另一方面,傳統推薦系統依賴的是用戶行為數據,比如點擊、購買等記錄,這些數據更像是一串串抽象的數字密碼。

      問題在于,這兩套"語言系統"之間存在著嚴重的語義鴻溝。大模型看到的是商品的豐富語義信息,而推薦系統處理的卻是簡單的用戶ID和商品ID編碼。這就好比一個精通文學的詩人和一個只會數學公式的工程師試圖合作寫一本書,他們各自的專長無法有效結合。

      研究團隊通過實驗發現了一個令人震驚的現象:當直接將大模型的語義表示與傳統推薦系統的ID特征融合時,推薦效果不但沒有提升,反而出現了顯著下降。在嬰兒用品數據集上,這種簡單融合導致推薦準確率下降了約30%。這個發現證明了語義沖突問題的嚴重性。

      為了解決這個根本性問題,研究團隊開發了RecGOAT框架,這個名字來源于"Graph Optimal Adaptive Transport"(圖最優自適應傳輸)。這套系統的核心思想是建立一座精巧的"語義橋梁",讓大模型的世界知識與推薦系統的行為數據能夠真正融合。

      一、構建智能圖譜:讓商品和用戶建立深層聯系

      RecGOAT的第一步是為每種模態構建專門的圖網絡,這個過程就像為不同類型的信息建立專屬的社交網絡。

      對于商品信息,研究團隊使用了最先進的大模型來理解內容。他們選用Qwen3-Embedding-8B模型來處理商品的文字描述,這個模型能夠深刻理解商品標題、品牌、類別和詳細描述中的語義信息。同時,他們使用LLaVA-1.5-7B視覺模型來分析商品圖片,提取視覺特征。這個過程就像讓一位文學專家和一位藝術鑒賞家分別從文字和圖像角度來理解每件商品。

      接下來,系統會根據商品之間的語義相似性構建商品關聯圖譜。具體來說,對于每件商品,系統會找到與它最相似的K個商品,然后在它們之間建立連接。這就像在商品世界中繪制一張關系網,相似的商品會被連接起來,形成一個個商品社群。

      對于用戶建模,RecGOAT采用了一種創新的方法。傳統推薦系統通常只能給用戶分配一個隨機的ID編號,就像給每個人發一張只有編號的身份證,無法反映用戶的真實特征和偏好。RecGOAT則利用QwQ-32B大模型來分析用戶的歷史行為,生成個性化的用戶偏好描述。

      系統會為每個用戶創建一個詳細的行為分析提示,包含用戶的歷史互動記錄和相應商品的詳細信息。然后讓大模型扮演專業數據分析師的角色,通過結構化推理來識別用戶行為中的共同屬性,并總結用戶在多個維度上的偏好特征。這個過程就像讓一位心理學專家通過觀察用戶的購買歷史來分析其性格特征和喜好傾向。

      生成用戶偏好描述后,系統會將這些文字描述轉換為向量表示,然后構建用戶之間的相似性圖譜。這樣,具有相似偏好的用戶會在圖譜中形成社群,系統可以通過用戶間的關系來更好地理解和預測用戶行為。

      在處理用戶-商品交互圖譜時,RecGOAT采用了輕量級的LightGCN架構。這個圖網絡會通過多層信息傳播來學習用戶和商品的協同過濾表示。系統還會考慮顯式的評分信息,將用戶的評分作為注意力系數來調節信息傳播的強度。

      二、雙層語義對齊:消除大模型與推薦系統的代溝

      解決語義沖突的核心在于RecGOAT獨創的雙粒度語義對齊框架,這套方法就像同時進行微觀和宏觀兩個層面的翻譯工作。

      在微觀層面,RecGOAT采用跨模態對比學習來實現實例級對齊。這個過程類似于語言學習中的單詞對照練習。對于每件商品,系統會形成多個模態對:ID表示與文本表示、ID表示與視覺表示、文本表示與視覺表示。系統的目標是讓同一商品在不同模態下的表示盡可能相似,而不同商品的表示盡可能不同。

      具體來說,系統使用InfoNCE損失函數來優化這個對比學習過程。當處理一個正樣本對(同一商品的兩種表示)時,系統會計算它們之間的相似度,并與批次內其他負樣本對(不同商品的表示)進行對比。通過這種對比學習,系統能夠學到具有判別性的跨模態表示,確保不同模態對同一商品的理解保持一致。

      在宏觀層面,RecGOAT引入了基于最優傳輸理論的分布級對齊方法,這是該研究最具創新性的貢獻之一。這個方法的核心思想是將語義對齊問題轉化為一個運輸問題:如何以最小的代價將大模型的語義分布"運輸"到推薦系統的ID分布空間中。

      最優傳輸理論就像物流配送的數學表達。假設有兩個倉庫,一個存儲大模型提取的語義特征,另一個存儲推薦系統的ID特征。最優傳輸算法要解決的問題是:如何設計運輸方案,以最小的總成本將第一個倉庫的貨物運送到第二個倉庫,使得兩個倉庫的分布達到一致。

      在數學層面,系統首先計算語義模態分布與ID分布之間的成本矩陣。這個成本反映了不同特征之間的語義差異程度。然后,系統使用Sinkhorn-Knopp算法高效求解最優傳輸方案,得到一個傳輸矩陣,描述了如何將每個語義特征映射到ID空間中。

      為了讓這個幾何驅動的傳輸過程能夠適應具體的推薦任務,RecGOAT引入了自適應傳輸機制。系統在基礎傳輸矩陣的基礎上增加了可學習的殘差矩陣,使得傳輸過程能夠根據下游推薦任務的需求進行微調。最終的自適應傳輸矩陣等于基礎傳輸矩陣加上殘差矩陣。

      通過這種自適應傳輸,每個大模型增強的模態特征都會被傳輸到ID嵌入空間中,得到語義對齊的表示。這個過程有效緩解了不同語義空間之間的分布差異,確保了語義一致性。

      三、理論保障:為什么RecGOAT能夠做到最優融合

      RecGOAT不僅在實踐中表現出色,研究團隊還為其提供了嚴格的理論保障,這些理論就像數學定理一樣為系統的有效性提供了科學依據。

      研究團隊提出了兩個核心理論保證:對齊一致性和融合全面性。對齊一致性保證是指,通過雙粒度對齊后,任何單一模態的誤差與統一表示誤差之間的差距都能被有效控制。這個差距的上界由Wasserstein距離和InfoNCE損失共同決定。

      換句話說,如果系統在分布級對齊(Wasserstein距離)和實例級對齊(InfoNCE損失)上都做得很好,那么不同模態的表示就會具有很強的一致性。這個理論結果證明了雙粒度對齊設計的合理性。

      融合全面性保證更加有趣,它證明了融合后的統一表示的性能上界可以達到所有單一模態中的最佳性能,再加上對齊誤差項。這意味著,通過有效的對齊,多模態融合不僅不會損害性能,還能夠充分整合各個模態的互補信息,實現超越任何單一模態的效果。

      為了推導這些理論結果,研究團隊做出了幾個合理的假設。首先,他們假設用戶嵌入是固定且有界的,這在實際推薦場景中是合理的,因為用戶特征通常不會發生劇烈變化。其次,他們假設真實偏好函數具有Lipschitz連續性,這反映了用戶偏好的內在平滑性。

      基于這些假設,團隊證明了兩個關鍵引理。第一個引理建立了實例級距離與對比學習損失之間的聯系,表明通過優化InfoNCE損失,可以有效縮小不同模態表示之間的距離。第二個引理將模態特定誤差與統一表示誤差聯系起來,展示了分布級對齊和實例級對齊如何共同影響最終的融合效果。

      這些理論結果不僅為RecGOAT的有效性提供了數學證明,也為未來的多模態推薦研究提供了理論指導。研究團隊通過嚴格的數學分析,證明了他們的方法在理論上是最優的,這為該技術的實際應用提供了強有力的科學支撐。

      四、實驗驗證:在真實世界中的卓越表現

      為了驗證RecGOAT的實際效果,研究團隊在三個Amazon公開數據集上進行了全面的實驗評估,這些數據集分別涵蓋嬰兒用品、體育用品和電子產品三個不同領域。

      實驗設計就像一場公平的競賽,RecGOAT需要與多個強有力的對手進行比較。這些對手包括傳統的基于ID的方法(如BPR和LightGCN)、多種多模態推薦方法(如VBPR、FREEDOM、DiffMM、UGT和FindRec),以及最新的基于大模型的推薦方法(如TALLRec、A-LLMRec、UniMP和IRLLRec)。

      實驗結果令人印象深刻。在所有三個數據集上,RecGOAT都取得了統計顯著的最佳性能。以電子產品數據集為例,在Recall@10指標上,RecGOAT達到了0.0468的得分,比第二名UGT的0.0430提升了8.84%。在NDCG@10指標上,RecGOAT的得分為0.0271,比第二名UGT的0.0254提升了6.69%。

      更重要的是,實驗揭示了幾個關鍵洞察。首先,多模態方法普遍優于傳統的基于ID的方法,這證實了多模態信息在緩解數據稀疏性方面的價值。然而,基于大模型的方法在沒有適當對齊的情況下,通常表現不如傳統多模態基線,這突出了語義沖突問題的嚴重性。

      RecGOAT相比其他大模型增強方法的顯著優勢,主要歸功于其獨創的分布級對齊機制。與IRLLRec相比,RecGOAT使用Wasserstein距離而不是KL散度進行分布對齊,這使得系統能夠更好地保持語義結構。KL散度只關注概率密度的比值,而忽略了樣本空間的幾何結構。舉例來說,將特征"紅色"對齊為"紫色"與對齊為"室內物品"在KL散度下可能得到相似的懲罰,但Wasserstein距離會給前者分配更低的成本,因為它們在語義上更相關。

      為了深入理解各個組件的貢獻,研究團隊進行了詳細的消融實驗。他們比較了僅使用ID的基線方法、簡單的多模態融合方法(如連接和求和),以及RecGOAT的各個組件(僅CMCL、僅OAT和完整的RecGOAT)。

      消融實驗的結果非常有啟發性。簡單的多模態融合方法(連接或求和)經常產生比僅使用ID方法更差的結果,這再次證實了語義沖突的存在。在RecGOAT的兩個主要組件中,最優自適應傳輸(OAT)的貢獻通常大于跨模態對比學習(CMCL),這突出了分布級對齊的關鍵重要性。然而,兩個組件的有機結合產生了最佳效果,表明它們是互補的而不是競爭的。

      五、對齊效果的可視化驗證

      為了直觀地驗證理論分析的正確性,研究團隊設計了巧妙的可視化實驗來展示對齊一致性和融合全面性。

      對齊一致性的驗證采用了三角熱力圖的方式,展示了在不同模態權重組合下的推薦性能。實驗結果顯示,無論如何調整文本、視覺和ID模態的權重組合,系統的性能都保持在一個相對穩定的范圍內,性能差異不超過5%。這種穩定性表明,經過對齊處理的不同模態表示具有很強的一致性,它們對最終推薦效果的貢獻是可靠和可預測的。

      融合全面性的驗證則通過比較單一模態表示與融合表示的性能來實現。實驗結果清晰地顯示,融合后的統一表示在所有評估指標上都超越了任何單一的對齊模態表示。這個結果與理論分析完全一致,證明了通過有效對齊,多模態融合能夠充分整合各個模態的互補信息,實現1+1>2的效果。

      特別值得注意的是,即使是表現最好的單一模態(通常是ID模態),其性能也明顯低于融合表示。這表明文本和視覺模態在經過適當對齊后,確實為推薦系統提供了有價值的補充信息,而不僅僅是噪聲。

      六、工業級應用的可行性

      雖然論文中由于公司審核要求沒有詳細披露在線實驗的結果,但研究團隊在大規模在線廣告平臺上部署了RecGOAT,這證明了該方法的工業級可擴展性和實用性。

      從技術架構角度來看,RecGOAT的設計充分考慮了工業應用的需求。系統采用了高效的Sinkhorn-Knopp算法來求解最優傳輸問題,該算法具有線性收斂性質,能夠在大規模數據上快速運行。同時,自適應傳輸矩陣的引入使得系統能夠在保持通用性的同時,針對特定任務進行優化。

      在實際部署中,RecGOAT的模塊化設計使得它可以靈活地與現有推薦系統集成。圖網絡模塊可以利用現有的用戶-商品交互數據,而大模型增強模塊可以基于現有的商品內容信息進行構建。雙粒度對齊模塊則作為一個中間層,可以插入到現有的推薦管道中。

      從計算效率角度來看,RecGOAT的在線推理階段主要涉及向量查找和簡單的線性變換,計算復雜度較低。大模型的推理主要在離線特征提取階段進行,不會影響在線服務的響應速度。這種設計使得RecGOAT能夠在保持高精度的同時,滿足工業級推薦系統對延遲的嚴格要求。

      說到底,RecGOAT代表了推薦系統領域的一個重要里程碑。它不僅解決了大模型與傳統推薦系統融合中的核心技術難題,還為這一融合提供了堅實的理論基礎。這項研究就像為兩個不同文化的社群建立了一座堅固的橋梁,讓它們能夠真正實現深度合作。

      從實際應用的角度來看,RecGOAT的意義遠超出了技術本身。隨著大模型技術的快速發展,如何將這些強大的語義理解能力有效整合到現有的推薦系統中,已經成為整個行業面臨的共同挑戰。RecGOAT提供的雙粒度對齊框架為解決這一挑戰提供了一個通用的、理論驅動的解決方案。

      更重要的是,這項研究開啟了多模態推薦系統的新紀元。通過有效融合大模型的世界知識與推薦系統的行為數據,未來的推薦系統將能夠更深入地理解用戶的真實需求和偏好,提供更加精準、個性化的推薦服務。這不僅會改善用戶的購物體驗,也會為電商平臺帶來更高的轉化率和用戶滿意度。

      對于研究社區來說,RecGOAT的理論貢獻同樣重要。該研究建立的對齊一致性和融合全面性理論框架,為未來的多模態融合研究提供了重要的理論指導。這些理論洞察不僅適用于推薦系統,也可能為其他需要融合多種數據源的機器學習應用提供借鑒。

      展望未來,RecGOAT的成功也暗示了人工智能發展的一個重要趨勢:不同AI技術之間的深度融合將成為推動技術進步的關鍵動力。正如RecGOAT成功融合了大模型的語義理解與推薦系統的行為建模,未來我們可能會看到更多這樣的跨技術融合創新,共同推動人工智能技術向著更加智能、更加實用的方向發展。

      Q&A

      Q1:RecGOAT框架主要解決什么問題?

      A:RecGOAT主要解決大語言模型與傳統推薦系統之間的語義沖突問題。就像讓一個精通文學的詩人和只會數學公式的工程師合作一樣困難,大模型理解的是豐富的語義信息,而推薦系統處理的是簡單的用戶ID和商品ID編碼,兩者直接融合會導致推薦效果下降30%左右。

      Q2:雙粒度語義對齊是如何工作的?

      A:雙粒度對齊包括微觀和宏觀兩個層面。微觀層面通過對比學習讓同一商品在不同模態下的表示相似,宏觀層面使用最優傳輸理論將大模型的語義分布"運輸"到推薦系統的ID分布空間中,就像設計最優物流方案將兩個倉庫的貨物分布調整一致。

      Q3:RecGOAT的推薦效果比其他方法好多少?

      A:在三個Amazon數據集上,RecGOAT都取得了最佳性能。以電子產品為例,在Recall@10指標上比第二名提升了8.84%,在NDCG@10指標上提升了6.69%。更重要的是,所有提升都具有統計顯著性,證明了方法的可靠性。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      日本官員同王毅外長握手,日媒見狀大肆報道:對華關系取得進展!

      日本官員同王毅外長握手,日媒見狀大肆報道:對華關系取得進展!

      阿龍聊軍事
      2026-02-12 17:17:49
      驟降13℃!10級大風!除夕前,河南還有一波雨雪

      驟降13℃!10級大風!除夕前,河南還有一波雨雪

      大象新聞
      2026-02-12 08:21:04
      廣州地塊這條新線,明天正式開通!

      廣州地塊這條新線,明天正式開通!

      房地產導刊
      2026-02-12 16:32:37
      愛潑斯坦別墅內景曝光,老虎標本栩栩如生,男子跪地笑容陰森

      愛潑斯坦別墅內景曝光,老虎標本栩栩如生,男子跪地笑容陰森

      大魚簡科
      2026-02-11 17:08:09
      全都“叛變”了,臺積電、三星接連宣布,外媒:中國不買了?

      全都“叛變”了,臺積電、三星接連宣布,外媒:中國不買了?

      無處遁形
      2026-02-12 14:13:50
      怒江州1名干部接受審查調查

      怒江州1名干部接受審查調查

      黃河新聞網呂梁頻道
      2026-02-12 11:39:03
      王艷攜兒子球球登上雜志封面 19歲王泓欽身高1.8米 高顏值好帥氣

      王艷攜兒子球球登上雜志封面 19歲王泓欽身高1.8米 高顏值好帥氣

      生性灑脫
      2026-02-12 09:37:45
      怎么又是你?阿森納再遇新帥,而且還要多賽3場,利物浦則有優勢

      怎么又是你?阿森納再遇新帥,而且還要多賽3場,利物浦則有優勢

      嗨皮看球
      2026-02-12 18:48:33
      身家過億的財經女俠葉檀,抗癌3年悔悟:丁克是這輩子最錯的決定

      身家過億的財經女俠葉檀,抗癌3年悔悟:丁克是這輩子最錯的決定

      青眼財經
      2026-02-11 19:36:31
      報告:近六成日企計劃今年擴大或維持對華投資

      報告:近六成日企計劃今年擴大或維持對華投資

      第一財經資訊
      2026-02-12 11:01:30
      一個家庭被人借運的跡象:如果發現,一定要拒絕

      一個家庭被人借運的跡象:如果發現,一定要拒絕

      木言觀
      2026-01-23 06:31:42
      羊肉被關注!研究發現:腦梗患者吃羊肉,用不了多久,或有3益處

      羊肉被關注!研究發現:腦梗患者吃羊肉,用不了多久,或有3益處

      阿兵科普
      2026-02-07 21:11:54
      1974年伍修權探望葉劍英,葉帥得知他八年賦閑在家,當即說道:你給毛主席寫封書信

      1974年伍修權探望葉劍英,葉帥得知他八年賦閑在家,當即說道:你給毛主席寫封書信

      史海孤雁
      2026-02-12 14:34:06
      卡拉澤丨因扎吉連10個顛球都做不到,但……

      卡拉澤丨因扎吉連10個顛球都做不到,但……

      米蘭圈
      2026-02-12 08:28:33
      三分之一賽程已過金牌掛零?別急!中國大招在后面

      三分之一賽程已過金牌掛零?別急!中國大招在后面

      林子說事
      2026-02-12 17:24:54
      全球公認的真人版春麗:木村萌那,使用百裂腳KO全場

      全球公認的真人版春麗:木村萌那,使用百裂腳KO全場

      街機時代
      2026-02-11 19:26:15
      平心而論,鄭欽文想要擊敗萊巴金娜,必須要達成以下幾個條件!

      平心而論,鄭欽文想要擊敗萊巴金娜,必須要達成以下幾個條件!

      田先生籃球
      2026-02-11 21:32:07
      姚晨沒想到,離春節不到7天,前夫凌瀟肅靠著佟大為,又火了一把

      姚晨沒想到,離春節不到7天,前夫凌瀟肅靠著佟大為,又火了一把

      天天熱點見聞
      2026-02-12 10:42:06
      青海一家35口人開旅游大巴赴云南自駕游,采購100斤米面等物資沿途自己做飯,當事人:往返14天,彌補缺失的陪伴

      青海一家35口人開旅游大巴赴云南自駕游,采購100斤米面等物資沿途自己做飯,當事人:往返14天,彌補缺失的陪伴

      極目新聞
      2026-02-11 16:46:33
      死亡率近100%,千萬別喝!國內暫無解藥,50毫升就可致死

      死亡率近100%,千萬別喝!國內暫無解藥,50毫升就可致死

      小鹿姐姐情感說
      2026-02-11 21:02:45
      2026-02-12 20:32:49
      科技行者 incentive-icons
      科技行者
      科技正在如何變革商業世界
      7245文章數 550關注度
      往期回顧 全部

      科技要聞

      10倍速的一夜:三大模型春節前的暗戰

      頭條要聞

      女子返鄉"打順風車卻打到大貨車"視頻爆火 當事人發聲

      頭條要聞

      女子返鄉"打順風車卻打到大貨車"視頻爆火 當事人發聲

      體育要聞

      31歲首次參加冬奧,10年前她是個水管工

      娛樂要聞

      體操運動員墜樓涉事教練被立案調查

      財經要聞

      “影子萬科”如何掘金萬科?

      汽車要聞

      開212 T01柴油版去穿越 連牧馬人都跟不上

      態度原創

      數碼
      本地
      手機
      公開課
      軍事航空

      數碼要聞

      AMD發布26.2.1可選顯卡驅動:新增支持《仁王3》等、修復游戲崩潰問題

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      手機要聞

      逆勢獨漲!蘋果成1月中國手機市場唯一增長品牌 市占率近20%

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:若美伊談判失敗 或再派一支航母打擊群

      無障礙瀏覽 進入關懷版