![]()
梁文鋒
作者/馮雨晨
此刻,諸神就位。
互聯網巨頭紛紛爭上牌桌,它們野心昭然:都想自家AI大模型應用成為最強流量入口。而AI大模型賽場,那個男人曾是主角。
去年今日,他正巧成名。回到2025年春節前一周,梁文鋒帶領DeepSeek發布推理大模型R1,以意想不到的低成本,煉出與世界頂級模型同臺競技的性能,自此東方神秘力量成功征服全球科技圈。
這位來自廣東湛江的85后,極少露面,身家上百億,他所創立的DeepSeek江湖地位不需多言。然而,值此中國AI大模型鏖戰之際,DeepSeek卻似乎隱身。2月11日,DeepSeek只是悄悄更新升級,當外界猜測“DeepSeek新版本要來了嗎”,梁文鋒及DeepSeek依然保持沉默。
有時候,越是平靜,對手越是害怕。
AI戰事正酣,梁文鋒卻靜悄悄
這是中國AI史上非常微妙的時刻。
先看大眾體感最強烈的發錢——1月底,騰訊元寶撒出10億元現金紅包激勵用戶,同一時間,百度投入5億現金紅包推廣文心助手。很快,阿里千問就帶著30億元紅包干爆奶茶店,宇宙廠字節也接著放招,豆包APP上參與新春抽獎最高可領8888元現金紅包。
經費在燃燒,用戶在狂喜,背后透射著頭部AI大模型未來命運的博弈。
產品側,字節點了一把大火。2月14日,字節豆包大模型2.0官宣發布,而此前2月7日,字節視頻模型Seedance 2.0刷爆全網,網友直呼:“一個文藝復興和科技革命同時發生的時刻到來”。幾乎同一時間,阿里火線出擊,發布新一代圖像生成基礎模型Qwen-Image 2.0,還有智譜、MiniMax也趕來,齊發新模型。
此番“招招有回應”,頗有一種詭異的競爭默契。而驀然回首間,那個曾經掀起大模型開源革命的DeepSeek就顯得有些冷靜了。
實際上,早前有一些消息流出。
據外媒The Information,DeepSeek 計劃于2月中旬即春節前后發布代號為V4的新一代旗艦級人工智能模型,劍指Coding AI王座。但旋即,又有關于V4可能不會按時發布的報道提到:DeepSeek內部對發布時間保持沉默。
就在2月11日,DeepSeek悄悄更新,上下文窗口長度從此前的128K token直接拉到了1M(百萬)token。在外界紛紛猜測該版本可能是V4 Preview時,官方依然沉默如常。
但這匹“不問戰事”的神秘黑馬總是吸引著外界目光。
2026年1月,DeepSeek團隊密集發了兩篇由梁文鋒署名的論文——mHC(流形約束超連接)及Engram(條件記憶),當時市場就開始揣測:這是否與DeepSeek V4核心技術相關?
正值許多公司招聘節奏放慢的年關,DeepSeek仍在各個平臺持續招人。如DeepSeek官號上,其2月5日更新了產品經理、客戶端研發工程師等多個崗位。
“我們大部分公司習慣follow,而不是創新。”梁文鋒曾如此談及。眼下,諸神混戰之際,外界都在期待那個曾經創新出奇跡的顛覆者梁文鋒。
縣城狀元,與中國DeepSeek時刻
中國大陸最南端,廣東湛江的米歷嶺村一度游人如織。
1985年出生的梁文鋒就來自這里。父母都是當地小學老師,他從小成績優異,在初中就學完高中數學,甚至已經開始學大學數學。但相比考試排名,“今天解決了什么問題”,這才是梁文鋒少年時期里他父母更關注的。
如此成長底色,與許多年后他在AI圈里被稱作“難得擁有純粹技術理想的人”相得益彰。
17歲那年,作為當地吳川一中的高考狀元,梁文鋒考入浙江大學電子信息工程專業。2007年,梁文鋒繼續在浙大信息與通信工程專業讀研,師從項志宇,主要做機器視覺研究。
說起來,當時計算機其實算個冷門專業,土木、電氣自動化、金融國貿等是更為熱門的選擇。一種刻板印象是,學計算機的畢業后就要去電腦城修電腦賣電腦,“是個打工的”。
但梁文鋒偏偏做此選擇。個人興趣,時代巨變,為天才少年的未來埋下草蛇灰線。
金融危機2008年席卷全球,彼時還是學生的梁文鋒敏銳捕捉到危機背后的機遇,與同學一起組團隊開始使用機器學習等技術探索全自動量化交易。2015年,梁文鋒與浙大同學徐進正式創立杭州幻方科技有限公司——這便是后來大名鼎鼎的幻方量化。
AI從始至終貫穿幻方。在早期,幻方就幾乎所有量化策略都采用AI模型計算,2019年及2021年,幻方投了逾10億元建設自主研發深度學習訓練平臺“螢火一號”及“螢火二號”。
一路高歌猛進,到2021年,幻方量化成功躋身千億量化私募之列。這年,幻方量化拿到英偉達A100顯卡,并且其AI集群搭載顯卡的數量達到“萬卡級別”。值得注意的是,此時國內超過1萬枚GPU的企業屈指可數,除了幻方量化,其余幾乎都是互聯網大廠。
38歲這一年,金融大佬梁文鋒做了一個決定:創辦DeepSeek,要做通用的人工智能。
在他眼里,這或許是滿足對技術世界好奇心的一部分。DeepSeek要做的不止是復刻當時已經名聲大噪的GPT,而是如其公司名一般,深度求索——真正去做關于大模型的研究,引領行業生態。
愿景很快變為現實,并且出場極其震撼。2025年1月,距離春節還有一周,彼時近百人團隊的DeepSeek上線DeepSeek R1版本,直接慷慨開源,推理能力比肩世界頂尖水平但成本僅約幾十萬美元,徹底顛覆頂級模型需要千萬美元級別投入的認知。
至此,梁文鋒在中國AI進程史上留下了珍貴一筆:DeepSeek時刻。
諸神之戰,中國AI嶄新時代
“AI還是要給人用的”,如今更為迫切。
誠如一向追求效能、致力做研究的DeepSeek,也開始俯身去看C端具體的人。在其近期一則產品經理崗位招聘中,職責一欄寫道:
·主導DeepSeek C端產品的功能規劃與體驗設計,敏銳洞察用戶需求,不斷推動產品創新和體驗優化;
·定位并拆解問題,降低用戶使用成本,關注用戶增長,提升使用深度、粘性和轉化;
而過去一年多的時間里,許多DeepSeek C端用戶一度懷疑DeepSeek沒有產品經理。“頁面和入口十分簡單,好像不需要賺錢一樣”,一位DeepSeek個人用戶這么說起,甚至調侃道:它終于發現我們C端用戶是實現AGI的關鍵一環了。
相比DeepSeek的內秀與含蓄,更渴望商業化的大廠們出招則應接不暇。
正如阿里砸30億紅包讓千問點奶茶,看似在燒錢買量,實際是AI時代培育用戶心智必須做的一步。通過免單這種大眾再熟悉不過的補貼打法,先吸引普通人把千問用起來,再試圖讓他們意識到AI是能點單甚至“能做事”的。
同樣,要上春晚送禮的字節豆包,早已在眾多生活場景中尋找立足之地:幫人指導韓系帥哥穿搭,給寵物拍藝術照,輔導小孩寫作業......在這些角色扮演和情感對話中,豆包月活已然突破2億。
如此種種,揭開大模型競爭后時代,AI C端應用的需求爆發點將至。
這也讓競爭回歸最樸素的本質:誰能解決用戶真實需求和問題,誰就能成為AI時代的超級入口。
而對于歷來需要流量的互聯網巨頭們,這場戰爭意義更重——定義下一個十年互聯網秩序的機會就在眼前。
本文來自微信公眾號“投資界”,作者:馮雨晨,36氪經授權發布。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.