每經記者:岳楚鵬 每經編輯:高涵
3月26日,谷歌研究院(Google Research)的一篇論文震動全球存儲芯片市場,引發美國和韓國巨頭超900億美元市值蒸發。
谷歌論文宣稱,名為TurboQuant的新算法能夠在不損失準確率前提下,將AI大模型KV緩存的內存占用壓縮至原來的1/6。
僅僅一天后,蘇黎世聯邦理工學院博士后高健揚在社交平臺發文,直指谷歌論文存在嚴重的學術問題。
高健揚指出,谷歌回避了TurboQuant算法與2024年他在新加坡南洋理工大學(NTU)讀博期間發布的RaBitQ方法的相似性,并錯誤描述了RaBitQ的理論結果,還刻意營造不公的實驗環境。
RaBitQ是一種向量量化算法,能夠確保向量數據在高度壓縮下仍保持搜索的可靠性。
高健揚還表示,谷歌TurboQuant團隊“知錯不改”。谷歌論文2025年4月正式發表前,自己就已通過郵件指出了上述問題,但谷歌方面在知情后仍未在最終版本中進行徹底修正。
3月29日,《每日經濟新聞》記者(以下簡稱NBD)采訪了RaBitQ論文作者高健揚和龍程。
RaBitQ是高健揚在新加坡南洋理工大學讀博期間的主要工作,龍程則是他的博士生導師。
同時,《每日經濟新聞》記者也向谷歌發送了采訪郵件,但截至發稿,尚未收到回復。據悉,谷歌研究院即將在4月舉行的2026年國際學習表征會議(ICLR 2026)上展示其TurboQuant論文。
![]()
事件時間線
“谷歌論文嚴重失實,溝通后仍未修改”
![]()
高健揚 圖片來源:受訪者供圖
NBD:你們最初是什么時候注意到谷歌TurboQuant論文存在問題的?
高健揚:早在2025年1月,TurboQuant論文的第二作者Majid Daliri就主動聯系了我們,請求協助調試他自己基于RaBitQ C++ 代碼翻譯的Python版本,并描述了詳細的復現步驟和報錯信息。這說明 TurboQuant團隊對 RaBitQ 的技術細節有充分的了解。
2025年4月TurboQuant論文發布后,我們注意到該論文中對RaBitQ的描述存在嚴重失實——將RaBitQ描述為grid-based PQ(基于網格的乘積量化),完全忽略了其核心的隨機旋轉步驟,同時在沒有任何推導或證據的情況下將RaBitQ的理論保證定性為"次優",實驗對比也存在明顯的不公平設計。
我們的第一反應是困惑和遺憾:TurboQuant與RaBitQ的相似性在技術上清晰可辨,而對方對RaBitQ的了解程度也遠超一般讀者,這種情況下出現如此系統性的失實描述,很難用疏忽來解釋。
![]()
郵件截圖
NBD:在公開發聲之前,雙方團隊有哪些溝通?
高健揚:我們進行了多輪溝通,時間跨度超過一年。
2025年5月,我們通過郵件與 Majid Daliri就實驗條件差異和理論結果最優性進行了詳細的技術討論,逐條澄清了TurboQuant團隊的錯誤解讀,Majid Daliri明確表示已將討論結果告知全體共同作者。
然而,在我們要求修正論文中的事實性錯誤之后,他停止了回復。
2025年11月我們發現TurboQuant已提交 ICLR 2026(2026年國際學習表征會議),且錯誤內容原封未動,隨即聯系了 ICLR 2026 PC Chairs(大會主席),但未獲回應。
2026年3月論文通過谷歌官方渠道大規模推廣后,我們再次正式向全體作者發送郵件。
收到的回復是:第一作者Amir Zandieh承諾修正理論描述和實驗條件,但明確拒絕修正方法論相似性的討論,且聲稱只愿在ICLR 2026正式會議結束之后才做修改。這一回應令我們感到失望但并不意外。對方顯然清楚問題所在,卻選擇了最小限度的讓步。
![]()
“核心機制高度吻合卻未說明,審稿人曾指出問題”
NBD:TurboQuant與RaBitQ最關鍵的相似之處是什么?
高健揚:兩者最核心的相似之處,在于都采用了在量化前對向量施加隨機旋轉(Johnson-Lindenstrauss變換)這一關鍵設計,并利用旋轉后坐標分布的統計性質來構建距離估計器。
值得注意的是,TurboQuant論文作者在ICLR OpenReview(學術圈常用的公開論文評審平臺)的審稿回復中,這樣描述自己的方法:“我們的實現方式是,先用向量的 L2范數對其進行歸一化,然后施加一次隨機旋轉,以確保這些向量在旋轉后的各個分量服從 Beta 分布。”這與 RaBitQ 的核心機制高度吻合,但在論文正文中卻從未正面說明這一聯系。
可以用一個比喻來理解:假設一位廚師率先公開發表了一道菜的完整食譜,之后另一位廚師發布了一道采用幾乎相同核心步驟的菜,卻在介紹中將前者描述為“做法不同、效果較差的另一道菜”,對兩者之間的聯系只字不提。
讀者在不知情的情況下,自然無法得出公正的判斷。
![]()
龍程簡歷照 圖片來源:受訪者供圖
NBD:按照學術規范,這類關系應如何處理?
龍程:學術規范要求,當一項新工作在方法論上與已有工作存在實質性聯系時,應明確引用并正面討論這種聯系,包括說明新工作在哪些方面有所推進,哪些方面沿用了已有框架。
這一點在本案例中尤為重要,因為ICLR的一位審稿人也在審稿意見中獨立指出“RaBitQ及其變體與TurboQuant的相似之處在于,它們都使用了隨機投影”,并明確要求更充分的討論和比較。
連審稿人都注意到了這一聯系,論文作者卻在最終版本中不僅沒有補充討論,反而將原本正文中對RaBitQ的不完整描述移入了附錄。這種處理方式與學術規范的基本要求背道而馳。
![]()
網友評論
“小型科研團隊很難與谷歌抗衡”
NBD:為什么選擇現在公開,而不是繼續通過學術渠道內部解決?
龍程:我們并非跳過學術渠道,而是在學術渠道已基本走完的情況下選擇公開。
我們先后聯系了論文作者、ICLR PC Chairs(程序委員會主席),并已向ICLR General Chairs(大會主席)和Code and Ethics Chairs(代碼與倫理主席) 提交附有完整證據包的正式投訴,同時也在 ICLR OpenReview平臺發布了公開評論。
但我們也必須承認一個現實:我們是一個小型高校科研團隊,對方是谷歌研究院。在資源、影響力和話語權上,雙方本就不對等。
TurboQuant論文在社交媒體相關瀏覽量短時間內達到了數千萬次,這是任何高校實驗室都不可能具備的傳播能力。
在這種不對等的格局下,如果我們繼續沉默等待內部流程,錯誤的敘事只會加速固化為共識。公開發聲,是弱勢方在正式渠道響應遲緩時,為維護基本學術事實所能采取的為數不多的手段之一。
![]()
高健揚發文截圖
NBD:如果相關問題未被修正,可能帶來哪些影響?
龍程:第一,它會系統性地扭曲學術史的記錄,讓后來的研究者誤判方法論演進的源頭,進而在錯誤的基礎上構建新工作。
第二,它會打擊原創性研究的激勵機制。如果一項經過嚴格理論推導、達到漸近最優誤差界的方法,可以被重新包裝后以數千萬曝光量推向公眾,而原作者卻得不到應有的認可,這對學術生態的傷害是長期且深遠的。
第三,對于向量量化這一正處于快速發展階段、工業界高度關注的領域,不準確的方法歸屬會直接影響從業者和研究者對技術路線的判斷,導致資源的錯誤配置。
NBD:你們認為這屬于學術分歧嗎?
龍程:這已超出學術分歧的范疇。學術分歧通常發生在雙方對技術內容存在真實的理解差異時。
但在本案例中,TurboQuant團隊對RaBitQ技術細節的了解有充分記錄;我們在2025年5月已通過郵件逐條澄清了理論保證的最優性,Majid Daliri明確表示已告知全體作者;實驗條件的不對等也在郵件中得到了作者本人的承認。
在上述情況下,相關錯誤在論文經歷投稿、審稿、接收、發表和大規模宣發的全過程中始終未被修正。我們不傾向于輕易做出定性,但我們認為,這一系列行為已經有充分的事實基礎供學術共同體和相關機構獨立判斷。
![]()
高健揚社交媒體賬號截圖
“計劃公開技術報告,繼續尋求學術渠道解決”
NBD:對于像谷歌研究院這樣大型研究機構,他們的責任在哪里?
龍程:大機構的背書本身會產生放大效應。一篇論文通過谷歌官方渠道推廣,其傳播速度和覆蓋范圍與普通學術論文不可同日而語。
在這種規模下,論文中的錯誤敘事一旦擴散,糾正所需的代價會成倍增加。我認為大機構有責任在論文對外大規模宣發之前,確保其中涉及他人工作的描述經過基本的事實核查,而不是將這一責任完全推給同行評審。
同時,當外部研究者提出有據可查的異議時,大機構也應當有正式的內部機制來處理,而非保持沉默。這既是對學術社區的責任,也是對自身公信力的保護。
NBD:你們接下來會采取進一步行動嗎?
龍程:接下來,我們計劃在arXiv發布詳細的技術報告,系統梳理RaBitQ與TurboQuant在方法論上的關系,并對三個問題逐一進行技術層面的闡述,供學術社區參考。
我們也在考慮通過進一步的渠道向相關機構如Google Research Escalation Council(谷歌研究申訴理事會)反映。我們的目標始終是讓公共學術記錄準確地反映各方法之間的真實關系,而不是制造對立。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.