2025年12月8日,世界頂級學術期刊《自然》將年度十大人物榮譽授予了一位中國面孔——DeepSeek(深度求索)創始人梁文鋒。
![]()
上榜理由簡潔有力:他推出的大語言模型“表現媲美頂尖模型,構建成本卻僅需一小部分”。梁文鋒被評價為“科技顛覆者”,刊物介紹中寫道:“這位在投資界聲名鵲起的中國金融奇才,創立了DeepSeek”。
《自然》的認可只是一個開端。同期發布的《2025全球獨角獸企業500強報告》顯示,DeepSeek估值已飆升至1.05萬億元人民幣,超越阿里云與螞蟻集團,躍居國內獨角獸企業次席。
![]()
圖片來源:《2025全球獨角獸企業500強》
頗具象征意味的是,一貫低調的梁文鋒謝絕了《自然》的采訪請求。這份來自科學殿堂的最高褒獎,與他本人刻意保持的沉默,在2025年歲末共同構成了充滿戲劇張力的科技敘事。
將時間撥回同年的1月。那時的DeepSeek,猶如一顆毫無預警的炸彈,在中國科技界轟然炸響,引發長達數月的全民狂歡。然而到了年底,當互聯網巨頭的AI產品已滲透生活各個角落時,那位最初的引爆者,其身影卻似乎一直不曾走入公眾視野。
從年初的現象級爆火,到年末創始人在榮耀加身時選擇“隱入塵煙”,DeepSeek完整演繹了一個技術現象從引爆、普及到沉淀的全周期。這段旅程,遠不止是一家公司的成長故事,更如同一面多棱鏡,清晰映照出中國AI產業的復雜心態、真實能力與內在矛盾。
開年驚雷——一場找不到“火源”的技術狂歡
2025年1月,DeepSeek的爆發幾乎是現象級的。沒有發布會,沒有KOL帶節奏,甚至沒有明確的上線渠道——但它突然就“炸了”。
據“環球網”報道,1月27日,DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。同日,蘋果中國區應用商店免費榜顯示,DeepSeek成為中國區第一。
![]()
圖片來源:《環球網》報道截圖
在“海外版貼吧”Reddit上,網友們的討論炸開了鍋:“它居然是開源的!這相當于把頂尖AI知識免費給了全世界,沒人能再壟斷技術了”;國產3A游戲《黑神話:悟空》開發者馮驥更是在微博直言:“DeepSeek,可能是個國運級別的科技成果”。這顆來自中國的“AI驚雷”,就這樣以意想不到的方式,敲開了全球市場的大門。
最奇幻的是,沒人說得清它到底從哪兒火起來的。不像Kimi借力月之暗面在資本市場先行引爆,也不像通義千問依托阿里生態鋪開——DeepSeek的走紅,近乎“自發性傳播”。
而彼時,DeepSeek北京融科資訊中心的辦公室,已成了科技圈“朝圣地”。公司園區有英偉達、AMD、蘋果、intel、華為、ARM等知名的AI公司以及百度風投、襄禾資本等投資公司。其物業公司還在DeepSeek所處樓層單獨加裝了閘機,并增設了安保人員。據“每日人物”報道中指出,前臺老趙和他同事他每天要攔下近30波試圖闖入寫字樓的陌生人。
![]()
圖片來源:《每日人物》報道截圖
這種由極致低調所引發的神秘感,在其杭州總部得到了更具象的印證。未來圖靈小編曾實地探訪,大廈一樓設有閘機與專職保安,前臺對所有意圖“打卡”的訪客均保持高度警惕,要求必須持證登記。小編多方嘗試進入均告失敗——無論是借道相鄰餐廳,還是進入地下車庫,都因全面升級的刷卡門禁與鎖閉通道而受阻。內部人員透露,此般嚴密的物理管控,正是為應對此前紛至沓來的過多訪客。公眾的狂熱關注與公司日益森嚴的防衛之間,形成了無比鮮明的對比。
![]()
圖片來源:《未來圖靈》文章截圖
在技術層面,DeepSeek帶來的震撼同樣直接。其V3模型的訓練成本僅為557.6萬美元,是同類頂級模型的十分之一甚至更低。當OpenAI等公司還在為如何降低天價訓練費用發愁時,這家中國公司已經用“極致性價比”改寫了游戲規則。
更讓行業震動的是其開源策略。在硅谷巨頭紛紛筑起技術壁壘的當下,DeepSeek選擇將核心成果向全球開發者開放。
“這不是中國追趕美國的問題,而是開源追趕閉源的問題”。深度學習先驅楊立昆在社交媒體上的這句評價,道破了這場變革的本質。
這場以技術為唯一燃料的爆火,以一種最樸素的方式證明了:當產品力足夠鋒利時,它可以穿透一切營銷的噪音,直達人心。這記開年驚雷,不僅宣告了一個強大競爭者的入場,更在某種程度上,改寫了中國AI公司全球崛起的敘事腳本——原來,技術本身,可以成為最好的傳播媒介。
市場奇觀——教育了所有人,卻沒當捕魚者
DeepSeek的真正魔幻之處,在于它無意爭搶用戶,卻意外重塑了整個行業格局。一個看似矛盾的現象浮出水面:DeepSeek自身的全民熱浪開始自然回落,但整個中國AI應用與云計算市場的池塘,卻被徹底煮沸、猛然擴張。
2025年上半年,云廠商財報印證了AI需求的爆發式增長。阿里云Q2營收增速飆升至26%,騰訊云企業服務板塊同比增長10%,百度云非在線營銷收入同比增長34%,而火山引擎GPU業務同比增幅更超200%。“上半年GPU大賣,還得感謝DeepSeek”。火山引擎的銷售張訊對“雷峰網”坦言。正是DeepSeek以開源模型和極低使用門檻,將大模型從科研圈推向黨政、制造、教育等泛行業場景,意外點燃了推理算力的規模化采購潮。
正是DeepSeek將大模型從科研象牙塔推向大眾——中小企業開始嘗試AI客服,內容創作者用它生成腳本,學生拿它輔助學習。調用量激增,GPU需求暴漲,整個基礎設施層被徹底激活。
在DeepSeek大模型的加持下,騰訊元寶、納米AI搜索的日活躍用戶規模也顯著提升,躋身TOP5行列。與此同時,字節跳動的豆包、阿里的通義加速迭代,紛紛推出面向C端的對話產品。它們擁有DeepSeek所不具備的流量、運營和商業化能力,迅速將“技術可能性”轉化為“產品確定性”。
![]()
圖片來源:《QuestMobile TRUTH 中國移動互聯網數據庫》
“DeepSeek教育了市場”。一位不愿具名的大廠的人員向未來圖靈小編坦言,它就像一位傾囊相授、卻不收費的啟蒙老師,完成了對中國市場從企業到個人的大模型心智普及。然而,市場成熟后最豐碩的商業果實,往往被那些手握流量與渠道的“后來者們”摘取。
最具反諷意味的是,這位“老師”對“學生”們的熱情追捧,表現得異常冷靜甚至“冷淡”。產品上線初期,當大多數公司追求用戶增長、關注月活數據時,DeepSeek卻顯得“克制”甚至“冷淡”。
年初許多用戶發現DeepSeek出現了短時閃崩現象。不少網友反映,使用時遇到 “服務器繁忙”的提示,甚至現在小編在使用時,也會出現此類情況。對此,DeepSeek回應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發需求。不過,官方狀態頁并未將這一事件標記為事故。
梁文鋒曾在2024年7月接受36氪旗下“暗涌”公眾號深度專訪,并明確表示:“長遠來說,我們希望形成一種生態,就是業界直接使用我們的技術和產出,我們只負責基礎模型和前沿的創新,然后其它公司在DeepSeek的基礎上構建ToB、ToC的業務。如果能形成完整的產業上下游,我們就沒必要自己做應用。當然,如果需要,我們做應用也沒障礙,但研究和技術創新永遠是我們第一優先級”。
在所有人都在為日活躍用戶數、用戶時長等流量指標拼命廝殺時,DeepSeek這種“反流量、反速成”的冷靜姿態,在狂熱的市場中顯得格格不入,卻也成為了其技術理想主義最純粹的注腳。
市場的火爆甚至意外引發了一場“城市之爭”。杭州自豪地將DeepSeek列為拉動數字經濟的“AI六小龍”之首。而北京方面則不乏微妙聲音:其核心研發人才大量來自清華、北大,許多實質性工作也在北京完成,為何光環盡歸杭州?這場小小的插曲,折射出AI產業已然成為地方經濟競逐中舉足輕重的籌碼。
DeepSeek無意中扮演了“市場拓荒者”的角色,它用技術劈開荊棘,把肥沃的土地,留給了后來者耕耘。
內核解碼——“隱身”的創始人與他的非典型武器
在DeepSeek這一年的魔幻旅程中,最引人注目的或許不是技術本身,而是其創始人梁文鋒的“隱身”。當大多數科技公司創始人爭相站上聚光燈下、頻繁發聲造勢時,梁文鋒卻在DeepSeek爆火后退出輿論場——2025年全年,他未接受任何主流媒體專訪,未出席一場行業峰會(除2025年年初,他作為民營企業代表出席了相關座談會),社交媒體上能找到他的只言片語或公開影像,采訪和錄制時間都在DeepSeek未火之前。
羅永浩在AGI Playground 2025上的一段回憶,為這位神秘創始人勾勒出最生動的素描:春節前與梁文鋒見面,發現他“無論是穿衣打扮還是言談舉止,都非常樸素,很像個學生”。而據“智東西”報道,如今想要見到梁文鋒,“需要匯報到地方辦公室”,流程極為嚴格。
![]()
圖片來源:《智東西》報道截圖
這種極致的低調并非故作姿態,而是其背后一整套獨特生存邏輯的外在表現。它由三個環環相扣的要素構成:絕對的財務獨立、前瞻的戰略儲備以及極致的工程效率基因。
財務獨立是根基。根據媒體報道,DeepSeek自創立起從未進行任何外部融資,完全依賴母公司幻方量化的資金支持。這一選擇使其徹底擺脫了風險資本對短期商業回報的焦慮與干擾。梁文鋒在早期采訪中明確表示:“我們面臨的問題從來不是錢”。當其他AI初創公司為下一輪融資絞盡腦汁、為商業化數據疲于奔命時,DeepSeek得以將全部精力聚焦于長周期、高不確定性的基礎技術攻堅。
戰略儲備是關鍵勝負手。在ChatGPT引爆全球AI熱潮之前,甚至在多數人還未意識到算力將成為戰略資源時,梁文鋒已領導幻方量化開始了“賭注式”布局。2019年投資近2億元建設“螢火一號”AI集群;2021年追加至10億元打造“螢火二號”,囤積了約一萬張英偉達A100高端GPU。據當時媒體報道,國內擁有如此規模GPU儲備的企業不超過5家。
![]()
圖片來源:由豆包AI生成
這一超前決策的意義,在美國對華高端芯片出口管制不斷升級的背景下愈發凸顯。當行業普遍為“算力荒”所困時,DeepSeek已手握稀缺的“硬通貨”。更重要的是,這些算力資源并非完全自用。通過與頂尖高校建立聯合實驗室,以“算力共享”模式開放部分資源,DeepSeek不僅提高了資產利用率,更在早期就與學術前沿建立了緊密的合作網絡,積累了寶貴的工程實踐經驗。這正應了行業那句調侃:“家里有卡,心里不慌”。
工程效率是破局利刃。如果說算力是硬件基礎,那么DeepSeek真正的“軟件靈魂”在于其根植于量化交易背景的極致工程優化能力。梁文鋒及其團隊將金融領域對“毫秒級延遲決定盈虧”的效率苛求,完整遷移到了AI大模型的訓練中。
其技術突破不是某個孤立的“黑科技”,而是一套系統性的工程哲學重構:
MLA架構將KV Cache顯存占用降低93.3%,破解了長上下文推理的顯存瓶頸;
DeepSeekMoE通過細粒度專家分割,在保持超大參數規模的同時,讓每次推理僅激活少量參數;
無輔助損失負載均衡策略等創新,從整體上優化了訓練動力學;
與工程效率基因相匹配的,是DeepSeek獨樹一幟的人才戰略。公司核心研發團隊人員精干,其中絕大多數是由中國本土頂尖高校自主培養的應屆畢業生,平均年齡不足30歲。梁文鋒相信“在顛覆性技術面前,沒有包袱的年輕人往往能帶來意想不到的突破”。
這打破了“唯資歷論”、“唯背景論”的迷思。梁文鋒本人畢業于浙江大學,團隊中亦不乏來自北師大等高校的核心骨干。他們用事實證明,頂尖的創新能量并不只儲存在少數幾家“超級名校”或海外實驗室里。
魔幻之外,留下一種新的可能
然而,這套獨特邏輯在帶來巨大競爭優勢的同時,也將DeepSeek推向了商業化的深水區。其API定價僅為行業巨頭的1%,被譽為“AI界的拼多多”,雖踐行了“普惠AI”的理念,卻也讓市場對其長期商業可持續性產生疑問。極致的開源策略贏得了全球開發者的心,卻也讓“如何將技術影響力轉化為穩固的商業收入”成為必須直面的課題。
人們或許已經淡忘了那個年初炸翻全球的名字。但它留下的痕跡清晰可見:技術不必閉源才能領先,創新不必追逐用戶也能改變行業,理想主義在商業世界依然可以存活——哪怕只是以“隱身”的方式。
![]()
圖片來源:由豆包AI生成
梁文鋒的“隱身”,或許正是對這種兩難境地的清醒認知與主動選擇。當外界熱衷于討論估值、市場份額和商業模式時,他選擇將所有的注意力與資源,押注在一條更本質、也更艱難的道路上:用工程的方法論,在有限的算力約束下,持續逼近AGI的邊界。
這一年,DeepSeek 像一顆流星劃過夜空:突然來臨,照亮了整片天幕。它未必能贏到最后,但它證明了一件事:在中國這片土地上,依然有人愿意用一群本土年輕人,在算力封鎖下,挑戰世界上最難的問題——不為流量,不為估值,只為驗證一個信念:“讓最偏遠山村的孩子,也能和硅谷工程師使用同樣強大的智能助手”。
當帷幕落下,故事未完。而一種新的可能性,已然被種下。
![]()
隨著人工智能技術的快速迭代,大模型的能力邊界不斷拓展,智能體作為大模型的重要應用模式,正憑借其在規劃決策、記憶、工具使用等方面獨特的創新性和實用性,引領著一場產業變革。
為貫徹實施《國家人工智能產業綜合標準化體系建設指南(2024版)》,中國移動通信聯合會正式啟動三項團體標準研制工作:
●《人工智能智能體能力要求》(計劃號:T/ZGCMCA 011-2025)
●《人工智能智能體內生安全技術要求》(計劃號:T/ZGCMCA 023-2025)
●《人工智能智能體互操作性接口規范》(計劃號: T/ZGCMCA 024-2025)
現誠邀數據服務企業、醫療機構、科研院所、高校、檢測認證機構等全產業鏈
行業機構及
研發工程師、項目經理、應用專家
專業人士共同參與標準編制。
期待您的積極參與,讓我們攜手共進,共同引領人工智能產業的發展方向!
聯系人:李貞琦
聯系方式:18519753675(同微信)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.