![]()
編輯|冷貓
剛剛, 平臺(原 Twitter 平臺)公布了全新的開源消息:已將全新的推薦算法開源,該算法由與 xAI 的 Grok 模型相同的 Transformer 架構驅動。
該模型預測用戶行為(點贊、回復、轉發等)來對帖子進行排序,出現在 For You 一欄中。
![]()
眾所周知,推薦算法是社交媒體平臺的生命線,幾乎已經成為了媒體平臺獲取用戶留存,擴大營銷收益的核心。在一周多前,馬斯克在 平臺發推聲明「將在 7 天后開源平臺推薦算法」的時候幾乎令人難以置信。
![]()
而馬斯克確實說到做到,雖然比聲稱的 7 天內略晚,但推薦算法的確已經完全開源。希望之后能夠長期遵循每 4 周重復更新的承諾。
在開源信息發布后,馬斯克表示:「我們知道這個算法很笨拙,需要大量的改進,但至少你可以看到我們在實時和透明的情況下努力讓它變得更好。沒有其他社交媒體公司這樣做。」
不過,馬斯克選擇開源 平臺推薦算法可能另有原因。
據路透社報道,2025 年 7 月,巴黎檢察官調查了該社交媒體平臺,懷疑其存在算法偏見和欺詐性數據提取,馬斯克將其稱為「政治動機的刑事調查」,威脅到其用戶的言論自由。
12 月,歐盟對 處以 1.2 億歐元罰款,監管機構表示該公司違反了該地區數字服務法案下的透明度義務。罰款與的「藍 V」訂閱、廣告庫缺乏透明度以及未能向研究人員提供平臺公共數據有關。
既然已經開源,那我們來看一下 平臺到底公開了些啥?
![]()
- Github 開源鏈接:https://github.com/xai-org/x-algorithm
這份代碼倉庫包含了平臺「For You」信息流背后的核心推薦系統。
它將站內關系內容(來自你已關注賬號的內容)與站外發現內容(通過基于機器學習的召回機制發現的內容)進行融合,并使用基于 Grok 的 Transformer 模型對所有內容進行統一排序。
隨后就是一長串的系統架構:
![]()
推薦算法系統架構
新系統徹底拋棄了傳統的手工規則,并大幅減少啟發式方法,采用完全的神經網絡方式。
整個推薦過程的核心幾乎全部交給了這個基于 Grok 的 Transformer 模型:它通過理解你的歷史互動行為(比如點贊、回復、轉發等),來判斷哪些內容與你最相關。
整個系統的核心是稱為 Thunder 和 Phoenix 的組件。「For You」信息流算法會從兩個來源中召回、排序并過濾內容:
- 站內關系內容(In-Network,Thunder):來自你已關注賬號的帖子
- 站外發現內容(Out-of-Network,Phoenix Retrieval):從全局內容池中通過模型發現的帖子
來自這兩個來源的內容會被合并在一起,并統一交由Phoenix進行排序。Phoenix 是一個基于 Grok 的 Transformer 模型,它會為每一條帖子預測不同形式的互動概率。最終排序分數,是這些預測互動概率的加權組合。
Thunder 組件
這是一個基于內存的帖子存儲與實時數據攝取系統,用于跟蹤全體用戶的最新發帖情況,主要功能包括:
- 從 Kafka 中消費帖子創建 / 刪除事件
- 為每個用戶分別維護原帖、回復 / 轉發、以及視頻帖的存儲
- 向請求用戶提供其關注賬號的「站內關系內容(in-network)」候選帖
- 自動清理超過保留期限的舊帖子
- 支持亞毫秒級查詢,無需訪問外部數據庫即可獲取站內關系內容
Thunder 的作用,是讓系統能夠極高速地獲取「你關注的人最近發了什么」。
Phoenix 組件
這是推薦系統中的機器學習核心組件,主要包含兩個功能模塊:
召回(Two-Tower 雙塔模型),用于發現相關的站外內容(out-of-network):
- 用戶塔(User Tower):將用戶特征和歷史互動行為編碼為向量表示
- 候選內容塔(Candidate Tower):將所有帖子編碼為向量表示
- 相似度檢索:通過向量點積相似度,召回最相關的 Top-K 帖子
排序(帶候選隔離的 Transformer),用于預測每條候選內容的互動概率:
- 以用戶上下文(歷史互動)和候選帖子作為輸入
- 使用特殊的注意力掩碼機制,確保候選帖子之間不能相互看到彼此
- 輸出不同互動行為的概率預測(點贊、回復、轉發、點擊等)
基于 Phoenix 的 transformer 模型預測多種參與類型的概率:
Predictions:├── P(favorite)├── P(reply)├── P(repost)├── P(quote)├── P(click)├── P(profile_click)├── P(video_view)├── P(photo_expand)├── P(share)├── P(dwell)├── P(follow_author)├── P(not_interested)├── P(block_author)├── P(mute_author)└── P(report)
加權評分器將這些因素綜合成一個最終得分:
FinalScore= Σ (weight_i × P(action_i))
流量密碼
這個得分就是影響推文推薦水平的量化數據。簡單分析, 平臺的推薦邏輯更加關注評估內容與用戶的關系質量。
在新的「For You」機制下,每一條帖子都會被獨立評估,排序不再主要依賴點贊數量,而是基于系統對深度互動行為的預測與反饋,包括引用評論、私信分享、復制鏈接、個人主頁點擊與關注,以及停留時長。相反,「不感興趣」、靜音、拉黑、舉報等負面行為會直接被賦予負權重,顯著壓低內容分發。
此外,情緒化標題、短期刺激型內容的收益正在下降。算法不僅關注互動峰值,也會捕捉后續的負反饋,從而懲罰低質量、不可持續的互動模式。
同時,發布頻率越高并不等于覆蓋面越廣。系統會對同一作者在同一信息流中的多條內容進行遞減加權,刷屏式發布反而更容易被壓制。更有效的策略,是降低頻率、提高單條內容的獨立價值。
在分發機制上,關注關系的重要性進一步上升。來自關注者網絡的內容保持滿權重,而推送給非關注用戶的內容則會被系統性折扣,降低「純病毒式傳播」的成功概率。
總體來看, 的推薦系統正在明確優化長期關系和內容質量,而不是短期熱度。誰能建立穩定、正向的互動關系,誰才能獲得更可持續的曝光。
規則已經明確地展現在所有人面前,從中每個人都可以發掘自己的流量密碼。
或許大家可以去關注一下我們機器之心的 ?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.