<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Transformer與RNN合體,谷歌打下顯存門檻,解鎖超長(zhǎng)上下文

      0
      分享至



      編輯|澤南

      最近,谷歌跟內(nèi)存干上了。

      上個(gè)月,谷歌的 TurboQuant 研究曾經(jīng)引發(fā)過(guò)一場(chǎng)行業(yè)地震,其宣稱能直接把大模型最吃顯存的 KV Cache 壓縮幾倍,讓市場(chǎng)開始擔(dān)憂未來(lái)對(duì)內(nèi)存的需求,引發(fā)了一波內(nèi)存股暴跌,后續(xù)還有不小的學(xué)術(shù)爭(zhēng)議。

      這個(gè)星期,又有一篇谷歌論文引發(fā)了 AI 圈的關(guān)注,作者表示他們提出的方法解決了大模型處理長(zhǎng)文本時(shí)的「內(nèi)存瓶頸」(又來(lái)了),但實(shí)施的是完全不同的技術(shù)路線。

      他們新開一條道路,通過(guò)對(duì)于大模型架構(gòu)的機(jī)制創(chuàng)新,賦予了 RNN 「可生長(zhǎng)的記憶容量」,找到了一種兼顧 Transformer 與 RNN 優(yōu)勢(shì)的新方法



      該方法可以讓 AI 處理更長(zhǎng)的文本,解鎖「超長(zhǎng)上下文」能力,與此同時(shí)極大地降低了推理的資源門檻。

      人們紛紛表示歡迎:大模型生產(chǎn)環(huán)境要的就是這個(gè)。





      當(dāng)前的大模型幾乎都是基于 Transformer 架構(gòu)打造的,它占據(jù)統(tǒng)治地位,主要?dú)w功于其可增長(zhǎng)的記憶容量(注意力機(jī)制的計(jì)算和空間復(fù)雜度隨上下文長(zhǎng)度呈二次方增長(zhǎng))。這使得 Transformer 極其擅長(zhǎng)長(zhǎng)上下文的信息召回(Recall)。

      然而,這種二次方復(fù)雜度也導(dǎo)致了嚴(yán)重的算力和顯存瓶頸,使得處理超長(zhǎng)文本的成本極高。

      為解決這個(gè)問(wèn)題,社區(qū)一直在復(fù)興 RNN、線性注意力模型(Linear Attention)以及狀態(tài)空間模型(SSM,如 Mamba 等)。這些循環(huán)架構(gòu)的優(yōu)勢(shì)在于記憶容量固定(復(fù)雜度為),推理速度快且顯存占用低。然而,它們的致命弱點(diǎn)在于:無(wú)論讀了多少文本,都必須把所有過(guò)去的信息壓縮到一個(gè)「固定大小」的隱藏狀態(tài)(Hidden State)中。

      這種「信息漏斗」導(dǎo)致它們?cè)诿芗倩厝蝿?wù)(Recall-intensive tasks,比如從極長(zhǎng)的文檔中精準(zhǔn)提取某個(gè)細(xì)節(jié))中表現(xiàn)往往遠(yuǎn)不如 Transformer。

      為打破僵局,來(lái)自 Google Research 的研究團(tuán)隊(duì)提出了一種名為Memory Caching(MC)的技術(shù),據(jù)說(shuō)簡(jiǎn)單而有效。



      • 論文:《Memory Caching: RNNs with Growing Memory》
      • 論文鏈接:https://arxiv.org/abs/2602.24281

      在這項(xiàng)研究的視角中,存在一個(gè)架構(gòu)光譜:一端是 Transformer(無(wú)壓縮,Token 級(jí)緩存),另一端是傳統(tǒng)的 RNN(全壓縮,單一記憶)。而「記憶緩存(MC)」則解鎖了介于兩者之間的新形態(tài):將成組 Token 壓縮并緩存到長(zhǎng)期記憶狀態(tài)中,然后在需要時(shí)進(jìn)行檢索。

      Transformer 會(huì)緩存每一個(gè)單獨(dú)的標(biāo)記,而 RNN 則考慮一個(gè)固定大小的記憶,并將上下文中的一切壓縮到記憶的參數(shù)中。那么,如果我們把 RNN 的歷史記憶也緩存下來(lái)會(huì)怎樣?

      簡(jiǎn)單來(lái)說(shuō),與其讓 RNN 只維護(hù)一個(gè)不斷被覆蓋和更新的「當(dāng)前狀態(tài)」,不如定期對(duì)這些隱藏狀態(tài)進(jìn)行「快照打卡」(Caching checkpoints)。這樣,在進(jìn)行信息檢索時(shí),模型不僅可以查看當(dāng)前的「在線記憶」,還能直接調(diào)取「緩存記憶」中的歷史快照,瞬間找回過(guò)去的相關(guān)信息。



      在研究的過(guò)程中,作為概念驗(yàn)證,研究人員提出了三種變體,基于過(guò)去的信息如何組合在一起。

      1、門控殘差記憶(Gated Residual Memory):使用查詢從過(guò)去檢索相關(guān)信息,然后執(zhí)行類似注意力的池化來(lái)組合檢索到的信息。實(shí)際上,RNN 的記憶在增長(zhǎng),因此解碼成本也在增長(zhǎng):



      2、記憶湯(Memory Soup):另一種結(jié)合過(guò)去記憶的方式,是直接結(jié)合記憶的權(quán)重,而不是針對(duì)特定查詢的輸出。在這種情況下,我們需要對(duì)過(guò)去記憶的權(quán)重執(zhí)行類似注意力的池化操作,然后對(duì)池化后的記憶執(zhí)行一次檢索。同樣,這種變體相對(duì)于上下文長(zhǎng)度具有不斷增長(zhǎng)的有效記憶,因此解碼成本也在增長(zhǎng)。



      3、稀疏選擇性緩存(Sparse Selective Caching,SSC):到目前為止,似乎沒(méi)有免費(fèi)的午餐,我們需要在不斷增長(zhǎng)的有效記憶和每 token 恒定的解碼成本之間做出選擇。

      于是作者提出了 SSC,這是一種類似于 MoBA 的專家混合模型,在序列維度上稀疏地選擇過(guò)去緩存記憶的一個(gè)子集,從而引出一個(gè)模型,其有效記憶在增長(zhǎng),但其每 token 解碼成本保持相對(duì)恒定:



      那么效果如何呢?

      該方法可以作為一種通用框架,插入到各種現(xiàn)有的循環(huán)架構(gòu)中,如線性注意力模型,或作者之前提出的深度內(nèi)存模型 Titans 等。

      實(shí)驗(yàn)結(jié)果表明了其強(qiáng)大的有效性:



      模型在語(yǔ)言建模和常識(shí)推理任務(wù)上的表現(xiàn)。

      作者在 13 億參數(shù)的模型上進(jìn)行了語(yǔ)言建模、召回密集型、長(zhǎng)上下文以及 needle-in-a-haystack 等實(shí)驗(yàn),結(jié)果顯示 MC 相較于基礎(chǔ)模型提供了改進(jìn)。其中包括:

      • 長(zhǎng)上下文能力提升:在語(yǔ)言建模和長(zhǎng)上下文理解任務(wù)中,加入了 MC 機(jī)制的循環(huán)模型性能得到了全面提升。
      • 縮小與 Transformer 的差距:在最具挑戰(zhàn)性的「上下文內(nèi)召回(in-context recall)」任務(wù)中,加入了 MC 的模型擊敗了目前最先進(jìn)(SOTA)的其他循環(huán)模型。
      • 依然存在上限:雖然 MC 極大地彌補(bǔ)了 RNN 的召回短板,并極大縮小了與 Transformer 之間的性能差距,但論文也指出,在純粹的密集召回任務(wù)上限上,Transformer 依然保持著最佳的準(zhǔn)確率。

      總的來(lái)說(shuō),該研究利用一種極其優(yōu)雅的算法直覺(jué)(緩存歷史狀態(tài)快照),解決了一個(gè)長(zhǎng)期存在的理論難題,讓非 Transformer 架構(gòu)在實(shí)用性上又向前邁進(jìn)了一大步。

      盡管在極限的密集召回上,它依然尚未徹底超越 Transformer,但新路已經(jīng)鋪就,隨著 RNN、SSM 等架構(gòu)的持續(xù)進(jìn)化,Transformer 一家獨(dú)大的現(xiàn)狀或許要有所改變了?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      警惕!日本啟動(dòng)十二年來(lái)最重大軍售,價(jià)值70億美元

      警惕!日本啟動(dòng)十二年來(lái)最重大軍售,價(jià)值70億美元

      觀察者網(wǎng)
      2026-04-19 08:45:58
      英超最新積分戰(zhàn)報(bào):熱刺慘遭絕平,切爾西0-1曼聯(lián),紐卡被絕殺

      英超最新積分戰(zhàn)報(bào):熱刺慘遭絕平,切爾西0-1曼聯(lián),紐卡被絕殺

      足球狗說(shuō)
      2026-04-19 05:15:52
      簽1億合同才能看演出?恒大歌舞團(tuán)女團(tuán)長(zhǎng):感恩許家印 但我沒(méi)違規(guī)

      簽1億合同才能看演出?恒大歌舞團(tuán)女團(tuán)長(zhǎng):感恩許家印 但我沒(méi)違規(guī)

      念洲
      2026-04-17 17:15:25
      布倫森28+5+7尼克斯戰(zhàn)勝老鷹1-0,唐斯25+8麥科勒姆26分

      布倫森28+5+7尼克斯戰(zhàn)勝老鷹1-0,唐斯25+8麥科勒姆26分

      湖人崛起
      2026-04-19 08:51:00
      伊朗女博主因以軍空襲遇難,至死不知伊朗情報(bào)部長(zhǎng)家在自家附近

      伊朗女博主因以軍空襲遇難,至死不知伊朗情報(bào)部長(zhǎng)家在自家附近

      網(wǎng)易新聞出品
      2026-04-17 16:52:32
      爆大冷!點(diǎn)球大戰(zhàn)決勝負(fù),馬競(jìng)意外落敗,皇家社會(huì)奇跡奪冠

      爆大冷!點(diǎn)球大戰(zhàn)決勝負(fù),馬競(jìng)意外落敗,皇家社會(huì)奇跡奪冠

      足球狗說(shuō)
      2026-04-19 05:59:29
      火箭官宣:杜蘭特右膝挫傷缺席首輪G1 隊(duì)內(nèi)訓(xùn)練撞到隊(duì)友受傷

      火箭官宣:杜蘭特右膝挫傷缺席首輪G1 隊(duì)內(nèi)訓(xùn)練撞到隊(duì)友受傷

      醉臥浮生
      2026-04-19 07:21:53
      暴力抗法的拼多多,不送外賣,卻被罰的最重,別讓低價(jià)毀了制造業(yè)

      暴力抗法的拼多多,不送外賣,卻被罰的最重,別讓低價(jià)毀了制造業(yè)

      王新喜
      2026-04-18 20:31:06
      1946年,孔祥熙二女兒逛公園被軍閥公子糾纏,她二話不說(shuō)拔槍就射,兩人對(duì)射十余槍,卻顆顆打空無(wú)一命中

      1946年,孔祥熙二女兒逛公園被軍閥公子糾纏,她二話不說(shuō)拔槍就射,兩人對(duì)射十余槍,卻顆顆打空無(wú)一命中

      起飛做故事
      2026-04-17 18:15:15
      以牙還牙!日本戰(zhàn)艦橫穿臺(tái)海第2天,東部戰(zhàn)區(qū)出動(dòng)戰(zhàn)巡東海

      以牙還牙!日本戰(zhàn)艦橫穿臺(tái)海第2天,東部戰(zhàn)區(qū)出動(dòng)戰(zhàn)巡東海

      阿芒娛樂(lè)說(shuō)
      2026-04-19 02:29:16
      9連30+!季后賽G1的GOAT,還有10助的登哥,太輕松了

      9連30+!季后賽G1的GOAT,還有10助的登哥,太輕松了

      貴圈真亂
      2026-04-19 09:35:48
      開了又關(guān)!為何反轉(zhuǎn)?伊朗警告所有船只“特朗普的言論毫無(wú)可信度”,英國(guó)稱3艘船只在附近水域遇襲

      開了又關(guān)!為何反轉(zhuǎn)?伊朗警告所有船只“特朗普的言論毫無(wú)可信度”,英國(guó)稱3艘船只在附近水域遇襲

      新民晚報(bào)
      2026-04-19 08:49:16
      越南迎來(lái)公務(wù)員下崗潮,數(shù)十萬(wàn)人鐵飯碗不保,越南要做什么?

      越南迎來(lái)公務(wù)員下崗潮,數(shù)十萬(wàn)人鐵飯碗不保,越南要做什么?

      琴琴有氧運(yùn)動(dòng)
      2026-04-17 23:36:42
      為什么擦窗機(jī)器人這個(gè)品類只有科沃斯窗寶?它究竟幫我們解決了哪些需求?

      為什么擦窗機(jī)器人這個(gè)品類只有科沃斯窗寶?它究竟幫我們解決了哪些需求?

      極果酷玩
      2026-04-17 18:26:15
      狀態(tài)出色,詹姆斯首節(jié)8助攻創(chuàng)季后賽生涯及賽季新高

      狀態(tài)出色,詹姆斯首節(jié)8助攻創(chuàng)季后賽生涯及賽季新高

      懂球帝
      2026-04-19 09:43:05
      中國(guó)不急,美國(guó)急!特朗普訪華求簽經(jīng)貿(mào)大單,美國(guó)為何放低姿態(tài)?

      中國(guó)不急,美國(guó)急!特朗普訪華求簽經(jīng)貿(mào)大單,美國(guó)為何放低姿態(tài)?

      浪子阿邴聊體育
      2026-04-18 08:11:50
      美軍封鎖霍爾木茲,巴基斯坦反將一軍,為伊朗送去最需要的東西

      美軍封鎖霍爾木茲,巴基斯坦反將一軍,為伊朗送去最需要的東西

      空天力量
      2026-04-18 13:09:10
      新華社點(diǎn)名曝光:拼多多暴力抗法細(xì)節(jié)!

      新華社點(diǎn)名曝光:拼多多暴力抗法細(xì)節(jié)!

      仕道
      2026-04-18 20:55:32
      降速闖臺(tái)海的日本"雷"號(hào)軍艦 別忘了當(dāng)年的下場(chǎng)

      降速闖臺(tái)海的日本"雷"號(hào)軍艦 別忘了當(dāng)年的下場(chǎng)

      看看新聞Knews
      2026-04-19 00:28:03
      5-6!小蜘蛛絕平+失點(diǎn),馬競(jìng)難破5年冠軍荒,皇家社會(huì)爆冷奪冠

      5-6!小蜘蛛絕平+失點(diǎn),馬競(jìng)難破5年冠軍荒,皇家社會(huì)爆冷奪冠

      我的護(hù)球最獨(dú)特
      2026-04-19 06:01:32
      2026-04-19 09:52:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12792文章數(shù) 142632關(guān)注度
      往期回顧 全部

      科技要聞

      50分26秒!榮耀獲得人形機(jī)器人半馬冠軍

      頭條要聞

      牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

      頭條要聞

      牛彈琴:伊朗遭到特朗普"羞辱"被激怒 結(jié)果印度遭了殃

      體育要聞

      時(shí)隔25年重返英超!沒(méi)有人再嘲笑他了

      娛樂(lè)要聞

      劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

      財(cái)經(jīng)要聞

      華誼兄弟,8年虧光85億

      汽車要聞

      奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

      態(tài)度原創(chuàng)

      家居
      時(shí)尚
      游戲
      手機(jī)
      軍事航空

      家居要聞

      法式線條 時(shí)光靜淌

      選對(duì)發(fā)型,真的能少走很多變美彎路

      《冰汽時(shí)代》系列慶典啟幕!官方致謝中國(guó)玩家

      手機(jī)要聞

      華為Pura X Max:被曝24日開賣!華為Pura 90:發(fā)售日成謎!

      軍事要聞

      解放軍護(hù)衛(wèi)艦與外艦纏斗20小時(shí) 細(xì)節(jié)披露

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版