2026年新年第一天,國內領先的人工智能公司深度求索(DeepSeek)在預印本平臺發布重磅研究論文,提出了名為“流形約束超連接”(Manifold-Constrained Hyper-Connections,簡稱mHC)的新一代神經網絡基礎架構,旨在突破當前大規模模型訓練的核心瓶頸。尤為引人注目的是,這項前沿研究的前兩名核心作者均出身清華大學,展現了該校在AI頂尖人才培養上的持續輸出。
核心突破:為AI模型架構裝上“智能調節閥”
該研究直指大模型訓練的底層挑戰。近年來,“超連接”(HC)架構通過拓寬神經網絡的信息通道提升了性能,但也帶來了訓練不穩定、難以擴展和內存消耗大等工業化難題。
DeepSeek提出的mHC架構,被通俗地理解為給信息通道加上了“交通規則”或“智能調節閥”。它通過數學上的流形約束,在保留超連接性能優勢的同時,恢復了信息穩定、高效傳遞的特性。這好比在一條拓寬但水流湍急的河道中設置了智能水閘系統,既保障了通航能力(性能),又防止了決堤風險(不穩定),還節約了維護成本(資源)。這一改進有望顯著提升訓練穩定性與擴展性,降低大規模AI模型的研發門檻與算力成本,為未來萬億參數乃至更復雜模型(如多模態、智能決策系統)的落地鋪平道路。
論文指出,mHC為下一代基礎架構演進指明了新方向,并可能重新激發學界對宏觀神經網絡拓撲結構設計的興趣。有行業人士評價,此項針對Transformer最基礎問題的底層創新,結合DeepSeek此前積累,或預示其將在未來的V4等版本中實現重大更新。
清華力量:論文前兩位核心作者畢業于清華
本次研究的三位核心貢獻者中,前兩位均為清華校友。
解振達(并列第一作者,排名第一):于2023年獲得清華大學高等研究院博士學位,研究方向為計算機視覺,曾參與發表Swin Transformer V2、SimMIM等具有影響力的工作,現為DeepSeek深度學習研究員。
韋毅軒(并列第一作者,排名第二):于2020年獲清華大學自動化、經管雙學士學位,2025年獲清華大學高等研究院博士學位。其博士期間合著的Swin Transformer論文曾于2021年獲得計算機視覺領域最高榮譽——ICCV馬爾獎(Marr Prize)。
![]()
過去一年,DeepSeek雖未發布全新代際版本,但持續保持高強度迭代與開源,先后推出DeepSeek-V3.2系列及達到國際奧數金牌水平的數學推理模型。此次在新年首日發布架構層面突破性論文,并以扎實的“清華力量”作為研發先鋒,再次展示了其在AI基礎研究領域的深厚野心與強大實力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.