![]()
編輯|張倩
導讀:黃仁勛剛在 GTC 上放話:Token 就是 AI 時代的新貨幣,誰能把每瓦特電力榨出更多高價值的 Token,誰就能稱王。幾乎同時,獎金池高達 600 萬元的騰訊廣告算法大賽開啟報名,為全球算法人才搭建了一座驗證這套規則的實戰沙盤。
![]()
「Token」「推理成本」「智能體」「工作流程自動化」…… 這些原本只在技術圈里流轉的詞,最近因為一場「龍蝦熱」開始頻繁出現在公眾視野中。
與此同時,很多人也從另一個側面感受到變化:手機、電腦陸續宣布漲價,而廠商給出的理由幾乎一致 —— 存儲芯片價格正在明顯上漲。
其實,這兩件事指向同一個背景:應用層面的 AI 需求正在迅速爆發,而在基礎設施層面,整個行業還沒有完全準備好。算力、芯片、系統效率,這些原本隱藏在幕后的問題,正在被突然放大的 AI 需求推到臺前。一個比較明顯的表現是,算力租賃行業已經出現漲價潮,而且可能持續一段時間。對于想要搭上「龍蝦」快車的企業來說,這無疑是一個切身相關的變化。
![]()
但對想在 AI 領域有所作為的人來說,這里面蘊含著機會。當越來越多的公司開始意識到一件事:在算力供應短期內持續緊缺的情況下,真正限制 AI 普及的,可能并不是模型不夠強,而是算力用得還不夠高效。如何用更少的計算資源,跑出同樣甚至更強的智能,會成為接下來一段時間的重點。
一旦問題變成這樣,需求也會隨之變化。能夠同時理解算法、系統和算力效率的人才,自然會變得越來越搶手。
這種對「高效能人才」的渴求,也催生了一個有趣的現象:科技公司開始嘗試把這一方向真實的工程問題拿出來做成公開競賽,讓外部的人一起參與解題 —— 這不僅是招募人才的方式,也是在測試自己的命題有沒有解法。2026 年騰訊廣告算法大賽就是這樣一場活動。
![]()
和往年一樣,今年的比賽依然圍繞真實業務場景展開,(脫敏)數據來自每天服務數十億用戶的廣告系統。換句話說,這不是一道紙面上的算法題,而是一次接觸真實 AI 基礎設施問題的機會,它代表了每家大廠都面臨、但還沒有人真正系統性解決的工程難題。
和往年相比,今年這屆比賽還有兩個明顯的變化:
一個是,它時隔多年再次與 KDD 國際頂級學術會議官方聯動,回到了更大的國際舞臺上。
另一個變化是賽道的打開。過去這類比賽大多面向在校學生,今年則首次單獨設立工業賽道,在職算法工程師、技術團隊也可以參與進來。
比賽的獎金池以及其他收益自然也是非常可觀,學術賽道冠軍可拿到 30 萬美元(約合 200 萬元)獎金,這在國內幾乎是天花板級別的存在。
這個級別的比賽,對應的自然是足夠前沿、足夠復雜的問題,連出題人都在等著看答案。如果找到了足夠優秀的解法,它可能直接改寫國內大廠技術基礎設施的底層邏輯。
全新挑戰:探索推薦系統的 Scaling Law
今年的賽題為什么重要?因為這道賽題,本質上是在問一個顛覆性的問題:推薦系統,能不能像被 AI 大模型影響的其他領域一樣,被「重做一遍」?
過去十幾年,推薦系統一直是科技公司最重要的基礎設施之一。它從海量信息中,篩選出最契合用戶需求的信息,并屏蔽信息爆炸帶來的噪音。
但隨著 AI 領域進入大模型時代,甚至是 Agent 時代,推薦系統的演進也來到了一個新的拐點:一邊是像大模型那樣的「統一架構 + GPU 高效計算」已經被證明可以吃掉一切;另一邊卻是推薦系統還停留在「拼裝式工程」,結構割裂、算力利用效率還有大量提升空間
為什么這么說呢?一般來說,在廣告推薦系統里,模型通常要解決兩件完全不同的事情。
第一件是理解用戶的行為序列。比如一個人最近看了什么視頻、點了哪些商品、搜索過什么。這些行為是按時間排列的,所以模型要理解「順序」。這一類問題一般叫序列建模。
第二件是理解各種特征之間的組合關系。比如「女性 + 買過嬰兒推車」,這些特征組合起來,可能更應該推薦「安全座椅」。這類問題叫特征交互。
問題在于,在工業界,現在這兩件事是分開做的 —— 一部分網絡專門處理行為序列,另一部分網絡專門做特征交互,最后把結果合并。
這在早期 CPU 時代問題不大,但到了 GPU 時代,這種拼接式架構帶來了很多問題。首先,信息在中間是斷開的,很多復雜關系捕捉不到。其次,整個系統結構復雜,很多小模塊,GPU 算不滿。而且 CPU/GPU 要來回搬數據,效率很低。
主辦方希望參賽者嘗試做一件事:把兩套東西,徹底合成一個模型。所以賽題被命名為「大規模推薦系統中序列建模與特征交互的統一」。
![]()
本次競賽的核心任務架構。
這并不是拍腦袋想出來的賽題,而是順著大模型已經驗證過的那條路在走。像 Transformer 這種統一架構已經證明了一件事:只要把各種數據用同一種方式表示、交給同一套模型處理,就能更高效地利用算力,而且規模越大效果越好,也就是所謂的 Scaling Law。但推薦系統還停留在東拼西湊的老結構里,很難享受到這種提升。這道題,其實就是在試一件事:推薦系統能不能也換成這一套,更簡單、更統一,而且越做越強。
當然,這件事做起來沒有那么容易。核心難點在于,廣告推薦場景的數據極其復雜 —— 既有用戶當下的靜態信息,也有帶時間戳的行為流水,你需要在一個統一架構里把這兩種完全不同的數據「翻譯」成模型能懂的語言并深度融合。同時,工業級數據規模海量且極度稀疏,模型必須足夠魯棒。更苛刻的是,你既要預測準,又要跑得快,得在高端 GPU 上支持大批量高效訓練和推理。需要注意的是,比賽嚴禁用「model ensemble」這種刷榜技巧,只能憑真本事靠單一模型硬碰硬。
不過,從主辦方給到的支持來看,這次比賽并不是「丟一道題就讓選手自己摸索」。為了降低門檻,他們提供了一套可復現、起點很高的 Baseline—— 不只是簡單示例,而是基于 Transformer 的完整統一架構,連 Token 化思路和核心網絡都搭好了,還會提供免費算力支持。
數據方面也不用擔心,他們提供的數據直接來自騰訊廣告的真實工業日志,規模和復雜度都接近真實生產環境,同時又做了嚴格的不可逆的匿名化處理。
![]()
客觀來講,題確實難,但也足夠真實、足夠前沿。如果能花 1-2 個月時間挑戰一下,相信無論接下來是打算在工業界做推薦系統,還是繼續深挖大模型與系統架構,這段經歷都會成為少有的「觸碰過真實一線問題」的證明。
為什么值得參加?
前面提到,這次比賽有兩個值得關注的變化,一是與 KDD 聯動,二是在職人士也能參加。
眾所周知,KDD 在頂會圈的地位和 ICML、NeurIPS 齊平。這次大賽能和 KDD 聯動,本質上也是因為賽題本身已經具備了頂會級別的學術價值。所以,如果能在大賽中脫穎而出,你簡歷上就多了一個全球認可的加分項。而且,你的成果會被大會的 Workshop Proceedings 收錄,頒獎典禮也將在今年 8 月份的 KDD 會議現場舉行。
![]()
「學術 + 工業」雙賽道的并軌則是出于兩方面考慮。一是賽題本身不是一個 toy problem,而是每家大廠都面臨的工程難題,必須有真實系統落地經驗的工程師帶入更接地氣的工業約束和實現視角。二是在這個技術日新月異的時代,高校學術派和行業實戰派需要一個直接對話的契機,從而加速前沿算法從論文到生產系統的轉化。
這項比賽從 3 月 19 日開啟報名。總獎金池高達 88.5 萬美元(約合 610 萬元)。其中學術賽道冠軍獎金為 30 萬美元(約合 200 萬元),工業賽道冠軍獎金為 15 萬美元(約合 100 萬元)。
值得一提的是,為了獎勵選手在 Scaling Law 與統一架構方面的原創突破,大會還設置了兩項技術創新獎,即便排名不在前列也有機會獲獎,每項獎金為 4.5 萬美元(約合 31 萬元)。
![]()
比賽結束之后,Top 隊伍選手將有機會加入騰訊,親手把方案落地廣告系統驗證實際效果。
看到這里,相信很多同學已經躍躍欲試了,但也會有人擔心:自己從來沒碰過推薦系統,現在上車來得及嗎?
其實完全不用慌。翻翻騰訊廣告算法大賽歷年的獲獎名單,你會發現不少選手都是報名之后才從零開始啃,邊賽邊學。最后不僅拿了獎,還順便摸清了自己的職業方向。比賽本身就是一個尋找賽題答案和人生答案的過程:既能驗證自己是不是吃這碗飯的,也能在高壓下快速摸清這個領域的真實樣貌。
隨著 Token 逐漸成為 AI 時代的基礎貨幣單位,一個全新的價值交換體系正在我們面前展開。對每一個個體而言,這或許正是那個稍縱即逝的窗口期。當新秩序初具雛形,率先參與其中的人,往往能擁抱最大的紅利。如果能抓住機會參與其中,未來的你可能會感謝今天的這個選擇。
報名鏈接:https://algo.qq.com/?type=register&weixinadkey=f405ff9dc868ccb36f9ab519e2e97c4acd972f95787dcca5767fa4e51f72dc1a9b63b48b3ca29e1d697976022a005cd6&wx_aid=89409756818&wx_traceid=wx0cjtq2qvqfw2fy00&weixinadinfo=89409756818.wx0cjtq2qvqfw2fy00.126.1
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.