![]()
| 文心
首發 | 公眾號云海觀星
【云海觀星】—— 專注于AI和互聯網科技,做您數字時代的陪伴者,一起學習、見證成長。
去年DeepSeek剛推出的時候,就曾在行業里引發巨大的熱議,甚至引發行業大佬們集體震驚!
一個搞量化的人,和AI貌似沒什么交集的人,竟然顛覆了大模型!
你以為這就完了?
最近,梁文鋒又丟出王炸!
2026 開年第一天,DeepSeek 扔出的新論文就炸了鍋 —— 那個低調到搜不到幾張照片的梁文鋒,帶著團隊把 AI 的 “承重墻” 給換了。
這事得先掰明白:AI 模型里藏著無數條 “數據公路”,殘差連接就是維持交通的核心,相當于公路的地基。之前美國人搞的 “超連接” 想拓寬公路提升速度,結果沒了規矩,數據一跑就堵車、追尾,模型越大越容易 “癱瘓”。
一時間,這種問題成了瓶頸,沒人能解決。
可是沒過多久,梁文鋒就扔出王炸!
梁文鋒團隊的新招叫 mHC 架構,說白了就是給這些公路裝了套 “智能交通系統”,用數學規則把車流框在安全范圍內,既不擋速度,又能避免事故。
他們給連接矩陣加了個約束,要求每行每列的權重加起來都是 1,就像規定每條車道的車流量必須均衡,這樣數據跑再遠也不會 “超速失控”,連訓練時的能量都不會憑空浪費。
![]()
更妙的是,這套系統用成熟的算法做調度,額外成本幾乎可以忽略,3B 到 27B 參數的模型都能穩跑。
這已經不是梁文鋒第一次 “不按常理出牌” 了。去年《自然》評他為全球十大科學人物,直接喊他 “科技顛覆者”,理由很實在:別人訓練 AI 要花 10 塊錢,他的方法 1 塊錢就夠,還用中低端芯片就能跑起來。
要知道這可是在芯片受限的情況下,DeepSeek 愣是靠算法優化闖出了路。
更難得的是,他們把核心技術全開源了,就像把修路的圖紙公之于眾,誰都能來學、來用,一下子帶動中美好多企業跟著開放模型。
9 月份的時候,他們的 R1 模型還成了首個通過《自然》同行評審的大模型,8 位審稿人提了上百條意見,從單詞細節到安全評估全過了關,《自然》說這是打破了 AI 圈 “吹牛不打草稿” 的怪圈。
有人說這是 “運氣好”,可了解梁文鋒的人都知道,他從來都是 “死磕底層” 的脾氣。這位從廣東湛江農村走出來的學霸,父母都是小學老師,從小就抱著數理化課本不放,浙江大學畢業后沒去考公編,反而扎進了 AI 和金融的交叉領域。
后來創辦幻方量化做到千億規模,手握一萬塊 GPU,卻在 2023 年突然轉身做 DeepSeek。別人都在做聊天機器人、文生圖這些 “快錢生意”,他偏要啃大模型的硬骨頭,說 “應用門檻遲早會低,但底層技術得有人先搞定”。
他的公司也透著股 “反套路” 的勁兒:沒有 KPI,核心崗位全是剛畢業的年輕人,招人的唯一標準是 “熱愛”。
有個中學生還成了 R1 論文的作者,這在講究資歷的科研圈簡直不敢想。梁文鋒自己更是把低調刻進骨子里,穿普通衣服,背平價包,除了技術會議幾乎不露面,卻會親自下場給論文署名,跟團隊一起改算法細節。
去年 DeepSeek 披露過一組數據,他們用 H800 GPU 跑服務,通過白天滿負荷、晚上降節點的調度,理論利潤率能到 545%,可他們轉頭就把夜間 API 價格砍到 25 折,就為了讓更多人用得起。
這會兒肯定有人問:搞這些底層技術有啥用?其實答案早寫在了現實里。
過去我們總說 “中國能把 1 做到 100”,可梁文鋒用行動證明,我們也能搞 0 到 1 的原創。
當美國靠芯片壟斷卡脖子時,他的團隊用算法把訓練成本降到十分之一;當行業都在炒概念時,他們用同行評審的硬成果說話;當別人捂著技術當寶貝時,他們開源共享搭建生態。就像《自然》說的,DeepSeek 就是中國科技從 “模仿者” 轉向 “創新者” 的縮影。
![]()
更動人的是梁文鋒身上的那股 “平靜勁兒”。在這個追風口、比流量的時代,他能沉下心花幾年改架構,不搞營銷不蹭熱度,只靠技術說話。這種 “不疾而速” 的定力,或許比技術突破本身更珍貴。
畢竟科技競爭從來不是短跑,而是長跑,那些愿意蹲下來修補地基的人,才真正決定了賽道能延伸多遠。
當 AI 圈還在為 “誰的模型更快” 爭論時,梁文鋒已經告訴我們:真正的領先,是讓后來者都能站在你的肩膀上往前跑。
這大概就是中國科研最該有的樣子 —— 不喧嘩,自有聲。
本文審核聲明:本文內容已進行合規核查,確保符合國家法律法規和平臺規定,堅持正面引導,傳播正能量。文中觀點基于公開信息進行行業觀察探討,旨在促進行業健康發展。圖片源于網絡,僅做分享使用,如侵權請聯系刪除。文章僅做分享交流,無任何商業目的和行為,如有不妥聯系刪除。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.