一篇論文引發(fā)存儲芯片股暴跌，Google 的「DeepSeek 時刻」來了？

2026-03-26 12:28:34　來源: AppSo

廣東舉報

分享至

看過 HBO 神劇《硅谷》（Silicon Valley）的朋友，想必都對那個名為 Pied Piper（魔笛手）的虛構(gòu)公司念念不忘。

在劇中，男主角 Richard Hendricks 發(fā)明了一種「中間壓縮算法」，能以極高的壓縮率無損處理文件，甚至因此改寫了整個互聯(lián)網(wǎng)的規(guī)則。

當(dāng)時我們都以為這只是編劇的腦洞。直到 Google Research 正式發(fā)布了名為 TurboQuant 的 AI 壓縮算法。

這原本是一條枯燥的技術(shù)新聞，卻在社交網(wǎng)絡(luò)上引發(fā)了病毒式傳播，不到 24 小時，就收獲了 1280 萬次瀏覽。原因無他，這項技術(shù)的設(shè)定簡直就是 Pied Piper 的翻版：

在不損失模型性能的前提下，將 AI 的「工作記憶」壓縮至少 6 倍。

市場的反應(yīng)也極為真實，美股存儲芯片板塊盤中遭遇拋售，美光科技、閃迪等頭部企業(yè)股價齊齊收跌。

這不禁讓人好奇，一項純軟件層面的算法創(chuàng)新，為什么會讓賣硬件的先慌了神，而Google 到底向當(dāng)前的 AI 牌桌上扔了一張怎樣的底牌？

困在「記憶黑洞」里的大模型

拋開網(wǎng)絡(luò)熱梗，TurboQuant 的出現(xiàn)其實不僅是為了好玩，更是為了解決一個讓整個 AI 行業(yè)頭疼已久的真實瓶頸。

眾所周知，現(xiàn)在的 AI 模型越來越大，對顯存的胃口也像無底洞一樣。尤其是在推理階段（也就是你和 AI 聊天的時候），AI 需要記住上下文信息，這部分?jǐn)?shù)據(jù)被稱為 KV Cache（鍵值緩存）。

每處理一個詞，模型都要把它轉(zhuǎn)成一個高維向量存進 GPU 顯存。對話越長，這份「數(shù)字備忘錄」膨脹越快，很快就把 GPU 顯存塞滿。這就是為什么你的 AI 助手聊久了會「變笨」或者直接報錯，腦容量不夠了。

更棘手的是，傳統(tǒng)的壓縮方法一直面臨一個兩難困境：壓縮數(shù)據(jù)時，需要額外存儲「量化常數(shù)」來告訴模型怎么解壓。這些元數(shù)據(jù)聽起來很小，加起來卻能把壓縮帶來的收益全部抵消掉。

Google 的 TurboQuant 的誕生正是基于此。

研究人員設(shè)計了一套兩階段的數(shù)學(xué)解法。第一階段叫 PolarQuant，把數(shù)據(jù)向量從傳統(tǒng)的直角坐標(biāo)系轉(zhuǎn)換成極坐標(biāo)系，拆分成「半徑」（表示大小）和「角度」（表示方向）。

這個幾何變換的妙處在于：轉(zhuǎn)換后角度的分布變得高度可預(yù)測，模型不再需要為每個數(shù)據(jù)塊單獨存儲昂貴的歸一化常數(shù)，直接映射到固定的圓形網(wǎng)格上就行了，開銷為零。

第二階段叫 QJL（Quantized Johnson-Lindenstrauss 變換），充當(dāng)數(shù)學(xué)層面的糾錯器。它把壓縮后殘留的誤差投影到低維空間，再把每個誤差值壓縮成一個符號位（+1 或 -1）。

這個設(shè)計保證了 AI 在計算「注意力分?jǐn)?shù)」時，壓縮版本的結(jié)果與高精度原版在統(tǒng)計意義上完全一致。所謂注意力分?jǐn)?shù)，就是模型判斷上下文里哪些詞最重要的關(guān)鍵步驟。

如果說以前 AI 記筆記是「逐字逐句抄寫」，那么 TurboQuant 就像發(fā)明了一套「極簡速記符號」：該記的一個不漏，占的空間卻少了六倍。

這套方法還有一個對企業(yè)來說格外友好的特性：無需重新訓(xùn)練模型。你現(xiàn)有的開源模型，或者自己微調(diào)過的模型，直接套上 TurboQuant 就能跑，不用額外的數(shù)據(jù)集，也不用重新跑一遍訓(xùn)練流程。

光說不練假把式，在「大海撈針」基準(zhǔn)測試?yán)铮?AI 從 10 萬個詞里找出一句藏好的話，TurboQuant 在 Llama-3.1-8B 和 Mistral-7B 上跑出了滿分召回率，同時把 KV Cache 的顯存占用壓縮了至少 6 倍。

在 LongBench 綜合評測套件（涵蓋問答、代碼生成、長文摘要）上，TurboQuant 全面追平甚至超過了此前的最強基線方法 KIVI。

最硬核的數(shù)字來自英偉達 H100 GPU 的實測：4 位精度的 TurboQuant 在計算注意力邏輯上的速度，比未壓縮的 32 位方案快了整整 8 倍。

Google 的「DeepSeek 時刻」？

論文發(fā)布后的 24 小時內(nèi)，社區(qū)已經(jīng)開始動手驗證。

Apple Silicon MLX 框架的知名開發(fā)者 @Prince_Canuma 把算法移植到了 Apple Silicon 的 MLX 框架，測試 Qwen3.5-35B 模型，上下文長度從 8500 到 64000 token 全覆蓋，每個量化等級都跑出了 100% 的精確匹配。

他還發(fā)現(xiàn)，2.5 位的 TurboQuant 能把 KV Cache 壓縮近 5 倍，準(zhǔn)確率零損失。

對于 TurboQuant 的發(fā)布，Cloudflare CEO Matthew Prince 甚至將其稱為 Google 的「DeepSeek 時刻」。

把時間撥回一年前，DeepSeek 以極低的成本訓(xùn)練出了性能驚人的模型，徹底打破了硅谷大廠對高成本才能訓(xùn)練出高性能 AI 的迷信。那次沖擊也讓整個行業(yè)意識到：光有大模型不夠，還得跑得起、跑得快。

TurboQuant 也是這種背景下的產(chǎn)物。如果這項技術(shù)能從實驗室走向大規(guī)模應(yīng)用，它將帶來肉眼可見的商業(yè)價值。

同樣一張 H100，推理成本理論上可以直接打折超過 50%；端側(cè)部署的門檻也會大幅降低，以前需要 32 位精度才能跑的大模型，放在 Mac Mini 或者本地服務(wù)器上也能運行，還不會有質(zhì)量損耗。

市場的反應(yīng)，已經(jīng)很說明問題了。TurboQuant 發(fā)布當(dāng)天，美股存儲芯片板塊盤中遭遇明顯拋售。閃迪、美光科技等頭部企業(yè)股價顯著收跌，存儲芯片與硬件供應(yīng)鏈相關(guān)指數(shù)單日跌幅超過 2%。

究其原因，如果 AI 巨頭能用一套純軟件算法把顯存需求砍掉六分之五，那些押注 AI 會持續(xù)瘋狂消耗高帶寬顯存的多頭，就得重新盤算自己的倉位了。

而這種防御性反應(yīng)背后，也表明，過去兩年支撐存儲股估值的核心邏輯之一，是 AI 對顯存的需求只會越來越大。TurboQuant 第一次在技術(shù)層面正式動搖了這個假設(shè)。

當(dāng)然，雖然聽起來很美好，還是要潑一盆冷水。

一方面，歷史上每次效率提升，往往反而帶動了總需求增長，經(jīng)濟學(xué)里叫「杰文斯悖論」。AI 跑得更便宜，可能意味著更多人更頻繁地用它，最終消耗的算力反而更多。所以這場「顯存危機」到底會不會因此化解，還真不好說。

另一方面，TurboQuant 目前仍處于實驗室階段，根據(jù)最新消息，Google 計劃在下個月的 ICLR 2026 大會上正式展示這項技術(shù)，屆時還將同步亮相另一場頂會 AISTATS 2026。

但從論文到大規(guī)模生產(chǎn)部署，中間隔著工程適配、不同架構(gòu)的兼容性測試、真實場景的性能驗證，每一關(guān)都不輕松。

論文地址：https://arxiv.org/abs/2504.19874

有網(wǎng)友直接開炮，這篇論文的底層研究其實早在去年四月就已公開，根本談不上橫空出世，眼下的輿論熱潮，多少有點追著舊聞起哄的意思。

在他看來，如果存儲股因為一篇算法論文而大跌，恰恰暴露了市場里有多少人根本沒搞清楚這件事的邊界，并把這波反應(yīng)比作「豐田出了新混動引擎，石油就該崩盤」。

更重要的是，TurboQuant 解決的只是推理（Inference）階段的顯存瓶頸，訓(xùn)練階段的顯存消耗依然是另一座大山。想從頭訓(xùn)練一個主流量級的大模型，需要的算力資源依然是天文數(shù)字。

在《硅谷》里，Pied Piper 的壓縮算法最終改變了整個互聯(lián)網(wǎng)。而在現(xiàn)實中，TurboQuant 的野心沒那么大，目標(biāo)只是讓 AI 在有限的物理空間里記得更多、算得更快、跑得更便宜。

現(xiàn)實終究不是好萊塢劇本，不必徹底改變互聯(lián)網(wǎng)，能和 AI 聊得更長、不再半途報錯，已經(jīng)是很多人想要的了。

附上 TurboQuant 官方技術(shù)博客：

https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關(guān)鏈接）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

谷歌創(chuàng)始人布林：當(dāng)年發(fā)完Transformer論文，我們太不當(dāng)回事了

機器之心Pro 2025-12-15 10:18:00
49 跟貼 49
谷歌跪了？400億砸向死敵！AI御三家終結(jié)，OpenAI孤立無援

新智元 2026-04-25 10:12:04
34 跟貼 34

谷歌400億美金投資Anthropic，算力成AI巨頭資本游戲的砝碼

DeepTech深科技 2026-04-25 21:26:08
8 跟貼 8

谷歌豪擲400億鎖定Anthropic，OpenAI慌不慌？

華爾街見聞官方 2026-04-25 19:31:27
2 跟貼 2
谷歌亞馬遜同時砸錢養(yǎng)競爭對手，AI時代最荒誕的商業(yè)邏輯正在成真

鈦媒體APP 2026-04-26 09:02:10
0 跟貼 0

谷歌Cloud Next大會焦點：AI Agent邁入規(guī)模化，推理芯片成獨立增長曲線

華爾街見聞官方 2026-04-24 11:02:50
0 跟貼 0

Epoch AI萬人調(diào)研：老板不訂閱，AI就是擺設(shè)！

新智元 2026-04-26 09:04:03
0 跟貼 0
DeepSeek靠近華為，英特爾先別樂

虎嗅APP 2026-04-26 01:17:06
2 跟貼 2

“不誘于譽，不恐于誹”！DeepSeek致謝近300名研發(fā)者，10名“已離職”大將赫然在列

每日經(jīng)濟新聞 2026-04-25 22:28:14
339 跟貼 339
GPT image-2爆火后，設(shè)計師的天塌了嗎？

鈦媒體APP 2026-04-26 09:12:11
0 跟貼 0
男子表示這種舊手機別賣，里面的“金豆”價值不菲，網(wǎng)友：這玩意真是金的嗎

星沙時報 2026-04-24 15:04:12
49 跟貼 49
華人CEO為什么“帶飛”芯片巨頭

鈦媒體APP 2026-04-26 08:41:56
0 跟貼 0
中美芯片戰(zhàn)爭再次升級！特朗普要全面封殺中國？外交部重磅發(fā)聲！

丁丁鯉史紀(jì) 2026-04-25 14:10:25
0 跟貼 0
「龍蝦之父」吐槽人類互聯(lián)網(wǎng)后，終于有人把這當(dāng)個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
中國堅守立場拒購H200芯片，特朗普急了

軍聞新大門 2026-04-26 00:49:53
0 跟貼 0
谷歌計劃向Anthropic投資至多400億美元，支持后者大幅擴展算力

界面新聞 2026-04-25 10:46:52
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
海外熱議！中國汽車為啥便宜？真相讓人大吃一驚！

歸環(huán) 2026-04-26 03:40:57
3 跟貼 3
民進黨揚言禁用高德地圖，董智森：怎么不禁谷歌地圖?

海峽新干線 2026-04-24 22:01:18
2 跟貼 2
搞了半天，中國并沒有買英偉達的H200芯片

夢想總會變成真 2026-04-25 20:24:27
0 跟貼 0
首發(fā)被華為搶了！英偉達火速官宣適配DeepSeek V4

快科技 2026-04-26 08:38:35
0 跟貼 0
馬斯克：全球最大晶圓工廠定了！將采用Intel 14A工藝制造芯片

快科技 2026-04-24 01:05:15
0 跟貼 0
中國“艙駕融合”芯片來了，汽車從此長出“兩只鉗子”

EV世紀(jì) 2026-04-24 19:45:50
0 跟貼 0
這個Harness普通人可用！

機器之心Pro 2026-04-21 15:47:04
0 跟貼 0
臺積電亮出新一代芯片技術(shù)：擬繞開ASML天價設(shè)備

快科技 2026-04-25 04:51:32
0 跟貼 0
昇騰超節(jié)點系列產(chǎn)品全面支持DeepSeek V4新模型

財聯(lián)社 2026-04-24 15:21:06
0 跟貼 0
2分鐘看懂地平線發(fā)布會：智能汽車正式迎來“龍蝦時刻”

車載娛樂 2026-04-25 11:20:04
3 跟貼 3
DeepSeek-V4預(yù)覽版上線并開源，國產(chǎn)AI芯片股拉升

每日經(jīng)濟新聞 2026-04-24 15:19:16
0 跟貼 0
缸中之腦現(xiàn)代版：20萬人腦神經(jīng)元一周學(xué)會打Doom

量子位 2026-03-06 17:34:11
0 跟貼 0
烏克蘭前線士兵骨瘦如柴照片披露被指最長斷糧17天

澎湃新聞 2026-04-25 14:48:31
27448 跟貼 27448
AI公司開始大量招文科生，微軟谷歌高薪聘文科生

江西都市現(xiàn)場 2026-04-24 22:10:35
0 跟貼 0
英偉達的L4野心：吳新宙拆解“五層蛋糕”，迎接自動駕駛ChatGPT時刻

第一財經(jīng)資訊 2026-04-26 08:49:00
0 跟貼 0
網(wǎng)易游戲、愛奇藝在拼命擁抱AI，但用戶不樂意

鈦媒體APP 2026-04-26 09:02:09
0 跟貼 0
蘇超最新積分榜出爐！

無錫博報 2026-04-25 21:51:59
112 跟貼 112
美能源出口創(chuàng)新高二戰(zhàn)以來首次接近成為原油凈出口國

紅星新聞 2026-04-25 12:32:20
8690 跟貼 8690
從軟件定義到AI 定義汽車，車業(yè)競爭迎來“奇點時刻”

Autolab 2026-04-25 22:30:56
0 跟貼 0
2026北京車展｜佰維高帶寬、高可靠車規(guī)級UFS 3.1發(fā)布！疾速向前，穩(wěn)應(yīng)萬變

新浪財經(jīng) 2026-04-24 21:35:19
0 跟貼 0
賴清德竄訪斯威士蘭失敗背后的三重邏輯

井芹仁小菜 2026-04-26 02:57:51
0 跟貼 0
美國富豪非洲打獵被5頭大象踩死

看看新聞Knews 2026-04-25 19:38:18
3754 跟貼 3754
半掛模型玩具車買菜，要是超重了怎么辦，雷軍都不敢這么設(shè)計！

宇宙搞笑生活 2026-04-23 14:10:00
4 跟貼 4

AppSo

讓智能手機更好用的秘密

6311文章數(shù) 26830關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

家居

時尚

房產(chǎn)

軍事航空

手機 / 數(shù)碼

房產(chǎn) / 家居

一篇論文引發(fā)存儲芯片股暴跌，Google 的「DeepSeek 時刻」來了？

漲價浪潮下，DeepSeek推動AI“價格戰(zhàn)”

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子 特朗普被氣壞了

那一刻開始，兩支球隊的命運悄然改變了

《我們的爸爸2》第一季完美爸爸翻車了

90%訂單消失，中東旺季沒了

2026款樂道L90亮相北京車展 樂道L80正式官宣

態(tài)度原創(chuàng)

學(xué)校管理：“管”出規(guī)范，“理”出活力

自然肌理 溫潤美學(xué)

伊姐周六熱推：電視劇《方圓八百米》；電視劇《金關(guān)》......

新一輪教育大爆發(fā)來了！海口，開始瘋狂建學(xué)校！

伊朗總統(tǒng)：不會在壓力、威脅下進行談判

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

牛彈琴：伊朗放了美國人鴿子特朗普被氣壞了

2026款樂道L90亮相北京車展樂道L80正式官宣

自然肌理溫潤美學(xué)