作者 | 松壑
4月17日,The Information放出一條消息:DeepSeek正在和部分機構洽談融資事宜,目標至少3億美元,估值超過100億。
消息不脛而走,炸開了鍋。
梁文鋒和他的深度求索在國內AI領域一直是個特殊的存在。別人搶著被投,他一直拒絕融資和過度商業化,并回絕了不少投資人的接洽意向。
因此當這條融資訊息擴散開來的時候,不少觀點的反應非常直覺,一些聲音認為梁文鋒開始扛不住了,DeepSeek缺錢并開始嘗試商業化轉型了,曾經高傲的理想主義者終究還是向資本和現實低了頭。
這個結論看似干脆利落,但很可惜,它是錯的。
因為它用上一階段的邏輯,去解釋一個已經進入下一階段的行業。
一. 幻方的彈藥
先回答一個最直覺的問題:DeepSeek到底缺不缺錢?
從賬面上看,確實不缺。
2025年,DeepSeek背后的幻方量化在2025年創下了56.6%的平均收益率,在全國管理規模超百億的量化私募中排名第二,僅次于靈均投資。
按照流傳甚廣的行業估算,700億管理規模,1%管理費加20%業績提成,一年下來的收入約合人民幣約50億。
考慮到幻方本身的運營成本、渠道分成、稅收摩擦等因素,實際能用來投入Deepseek研發的經費,仍然至少可達數億元量級。
這個彈藥量并不低,而且這筆錢是相對簡單的——幻方早幾年就停了外部募資,梁文鋒持有多數股權。
DeepSeek的研發經費直接從幻方的研發預算中出,不受任何外部股東、LP或董事會的干涉,不需要給任何人看報表,不需要為任何人的退出計劃負責。
如今的矛盾之處在于,明明一個背靠穩定現金流支持的模型,為何要開始啟動融資了?
二. Agent賬本變了
答案或許在于,AI行業正在發生一次快速的范式切換,即從三年前出圈的Chatbot到如今遍地養蝦熱的AI Agent。
過去兩年,大模型的核心敘事是"一次訓練、反復調用"。耗費幾百萬美元訓一個模型,然后部署出去,用戶提問、模型回答,一來一回就是一次推理。算力的消耗集中在訓練階段,推理階段的成本相對可控。
但Agent的邏輯完全不同。它執行一整條任務鏈,涉及規劃、調用工具、與環境交互、在失敗后回溯糾錯。
一個Agent完成一項復雜任務所消耗的推理token,可能是Chatbot時代下的幾十倍甚至上百倍。推理成本開始逼近訓練成本,兩者共同呈指數級膨脹。
與此同時,模型參數量還在繼續爬升。2024年底的V3參數量是671B,而行業推測的Claude Opus4.6已有5T之巨。
隨著行業前沿的模型參數規模正在從千億級向萬億級跨越。這意味著單次訓練所需的算力、數據和工程復雜度都在陡峭上升。
DeepSeek過去能用500多萬美元訓出V3,靠的是方法論上的極致效率,包括MoE架構、多頭潛在注意力(MLA)、細粒度專家路由,每一項技術創新都是在有限算力下榨取最大性能。
這是一種以巧勝拙的打法,但有一個前提:牌桌上的賭注不能漲得太快。
如今賭注漲了。
Agent時代的模型訓練,正在成為持續迭代的飛輪,模型要在復雜環境中反復試錯、積累反饋、自我改進。數據、算力和工程資源的需求正在指數型抬升。
幻方的50億收入,在Chatbot時代是綽綽有余。但在Agent時代正在變得未必夠用。
![]()
三 .被挖走的那些人
算力需求的指數上升是一張明牌,人才流失則是更扎心的暗牌。
據晚點LatePost報道,自R1大獲成功以來,DeepSeek至少有5名核心研發成員離職,他們覆蓋了基座模型、推理、OCR和多模態四條核心技術主線:
第一代大語言模型核心作者王炳宣去了騰訊。V3模型關鍵貢獻者羅福莉去了小米出任AI部門負責人。R1核心研究員、DeepSeek-Coder第一作者郭達雅加入字節跳動Seed團隊,擔任Agent負責人之一。此外,OCR系列核心作者魏浩然、多模態成果核心貢獻者阮翀也先后離開。
DeepSeek的核心研發團隊不過百人上下。走掉5個核心,相當于4條技術主線同時出現斷點,正在暴露人才機制上的結構化問題。
DeepSeek的整個組織模式極度扁平的,只有梁文鋒和研究員兩個層級,不打卡、不考核、沒有明確的KPI和截止時間。團隊超七成不到30歲,超七成是本碩。
一名接近DeepSeek的算法工程師透露,只要團隊內有人產生靈感或想法,就可以內部組隊嘗試探索,這在層級繁冗的大公司是很難實現的。
這種模式適合做前沿探索,但它仍有一個致命的短板:缺乏成熟的股權激勵體系。
早在2023年,梁文鋒曾嘗試用類似OpenAI與微軟的"回報上限"協議去接觸投資人,但沒有機構接受。而DeepSeek缺乏融資經歷和股份定價,給予員工的期權很難成為確定性的激勵工具。
這種狀態下,當字節開出由現金、字節期權和豆包期權組成的薪資總包,當小米用千萬年薪來招手,當阿里甚至開出后訓練負責人的職位,當一些競爭對手開出2-3倍的收入挖角之時——很難不讓讓95后研究員扎堆的DeepSeek面臨人才困境。
不僅如此,智譜、MiniMax相繼上市,股價上漲帶來了可觀財富效應。在這種環境下,一張無法定價、無法變現的期權協議,說服力越來越有限。
融資在這個維度上,不只是為了儲備算力,也能給員工的期權標一個價格。有了估值,才有確定性,才能與大廠的搶人機器正面過招。
梁文鋒顯然意識到了這一點,DeepSeek已在推動公司估值工作,明確期權定價,試圖給團隊更多確定感。
四. 除了錢,還有場景
"給估值"和"買算力"并不是融資的全部目標,更關鍵的可能還有Agent的發展方向。
2026年3月,DeepSeek一口氣放出了17個新招聘崗位。
最引人注目的是三個Agent方向的專屬崗位:Agent深度學習算法研究員、Agent數據評測研究員、Agent基礎設施工程師。
算法研究員要做的是探索強化學習在大模型對齊與能力提升中的應用,涵蓋RLHF、過程獎勵、偏好學習等方向。
數據評測研究員要做的是構建評測數據集,針對Agent的規劃、工具調用、多輪交互、長期記憶等核心能力設計測試用例。
基礎設施工程師要做的是搭建Agent運行的底層基座,要求熟悉MCP、Tool Use、Function Calling等Agent交互協議。
除此之外,連模型策略產品經理崗位都單獨設立了Agent方向,要求熟悉Agent核心機制,例如Tool Use、Planning、長期記憶、Multi-Agent協作。
對比今年1月,那時DeepSeek開放的核心崗位還集中在"深度學習研究員-AGI"這類通用研究方向。
短短兩個月,DeepSeek的擴招重心明顯從基礎模型研究向Agent產品化傾斜。
過去行業有一個流行猜想:當模型能力足夠強,Agent能力自然就強,不斷進化的模型最終可以將Agent的價值吞掉。
但我們在Agent的苦澀覺醒:智能正從語言走向經驗一文中強調過:AI與Agent的互補作用是雙向的。
Agent在復雜場景中的豐富度,會反向拉升模型的能力。模型需要在真實的任務鏈中摔打、試錯、積累反饋,才能習得那些在實驗室里訓不出來的能力。
比如超越上下文的記憶連續性,比如多工具調度的可靠性,比如面對模糊指令時的自主規劃能力。
這些能力的成長,依賴于豐富、復雜、真實的應用場景與訓練環境。
3月26日,從阿里離職三周后的林俊旸在技術長文《從"推理式思維"到"智能體思維"(From "Reasoning" Thinking to "Agentic" Thinking)》中提出了一個更具洞察力的結論:
"在SFT(監督微調)時代,我們癡迷的是數據多樣性;在智能體時代,我們應該癡迷的是環境質量:穩定性、真實性、覆蓋面、難度、狀態多樣性、反饋豐富度、抗利用能力,以及rollout(完整執行一遍流程)生成的可擴展性。"
可好的環境從哪里來?
一種路徑是自己搭建,但這需要時間和資源。
另一種路徑是通過戰略投資方的產業網絡獲取。一個擁有B端客戶生態的投資方,能夠直接提供金融、辦公、開發等垂直領域的Agent訓練場景,這種"場景協同效應"的價值,遠超資金本身。
從這個角度看,融資的意義不在于"輸血",而在于"接入",尤其是接入那些單靠幻方的利潤無法購買的產業資源。
![]()
五. 未變的極客底色
市場上還有另一種聲音:DeepSeek這兩年被追上了,R1和V3的效果已經被國內大廠逐步逼近,因此需要融資來追趕其他競爭者。
這種判斷看到了表面,卻忽略了內核。
DeepSeek的定位本就不是傳統商業公司,而是一個前沿人工智能實驗室。
它的價值不需要客戶端的產品體驗或者幻覺控制來體現,也不用通過某個模型的benchmark分數或基準測試來證明,其核心影響在于:向行業輸出了多少可以被復用的方法論。
2026年元旦,DeepSeek在arXiv上發布了一篇新論文,提出了mHC(流形約束超連接)架構,通過將連接權重矩陣約束在雙隨機矩陣流形上,解決了超連接架構在大規模訓練中的不穩定性問題。論文的第一作者包括解振達和韋毅軒,梁文鋒本人也在19位作者名單之列。
這篇論文動的是Transformer架構中最古老、最基礎的那塊磚——何愷明2015年提出的殘差連接。過去十年間,殘差連接幾乎沒有過根本性的改動。
再往前看:2025年9月發布的DeepSeek-V3.2引入了DSA(稀疏注意力)機制,寒武紀在發布四分鐘后就宣布完成了對該框架的適配,而這一架構后來也被智譜GLM-5所借鑒。
2025 年 10 月,DeepSeek 發布初代 OCR 模型,以上下文光學壓縮實現高效文檔識別;2026 年 1 月推出DeepSeek-OCR-2,引入視覺因果流,3B參數即超越百億級模型,且具備水印魯棒性。該系列開源后引發行業廣泛應用,其技術被匹茲堡大學、普林斯頓大學等機構在學術研究中直接引用,重塑了OCR與多模態視覺理解的技術路線。
當然,最被熟知的還是郭達雅在DeepSeek期間提出的GRPO(群體相對策略優化)算法,后來被直接應用到R1的訓練中,成為行業公認的關鍵方法論創新。
在開源模型領域,DeepSeek輸出的不只是模型權重,更是一套被行業反復引用和跟隨的技術路線圖。
對于一個能夠持續產出被行業follow方法論的團隊,1-2次的融資動向并不意味著AGI方向的根本改變。
六.彼岸的鏡子
對于"融資是否等于妥協"這個問題,大洋彼岸有一面現成的鏡子,那就是Anthropic。
2024年,Anthropic的年化收入還在10億美元左右。到2025年底,這個數字漲到了90億美元。然后到了2026年4月,年華收入已經達到了300億美元。
從10億到300億,用了大約15個月,而Anthropic做到這一切,并不依賴消費端的用戶規模——
它的消費用戶量大約只有ChatGPT的5%,更多靠的是企業API合同、開發者訂閱和Claude Code。上線不到1年的Claude Code,在2026年2月的年化收入就已突破25億美元。
更值得注意的是效率差異。
OpenAI到2030年的年訓練成本預計為1250億美元,Anthropic的同期預測是約300億。同一場競賽,4倍的成本差距。OpenAI預計2026年虧損140億美元,Anthropic預計2027年實現正向自由現金流。
Anthropic證明了一件事:商業化與模型能力提升之間,不是非此即彼的零和關系。
通過B端API實現自我造血,不僅沒有阻礙它成為頂尖模型提供商,反而支撐了它不受制于人的持續研發投入。
DeepSeek未必要走Anthropic走過的路,但它至少說明了一種可能性:有限度的商業化,可以為前沿研究探索提供更大的燃料。
AI前沿研發,本質上是一項高度不確定的探索活動。它和做App、做電商、做信息流完全不同,后者有明確的用戶指標、轉化漏斗和ROI公式,砸錢進去,產出是可以預測的。
但訓練大模型,動手之前并不知道某個架構改動、某種數據配比、某條強化學習路徑到底能不能跑通。
mHC論文的背后是多少次失敗的嘗試,V3.2的DSA機制經歷了多少輪廢棄的實驗,外界永遠看不到。
這意味著,這項事業天然不適合由那些KPI考核嚴格、投資回報周期明確的組織來主導。
大廠做AI,老板每個季度要看DAU和收入增長,項目組每半年要證明存在的合理性,一條路線如果兩個季度沒出成果,就會被砍掉換方向。
這種環境可以把成熟技術做到極致的產品化,但很難容忍那種"花了三個月發現此路不通、推倒重來"的研發節奏。
DeepSeek過去兩年能在架構層面持續產出被行業follow的創新,恰恰是因為梁文鋒給了團隊一種"不考核、不設deadline"的試錯空間。
但試錯從來不是免費的。它的成本就是大量無法體現在論文里的廢棄實驗、走不通的技術路線、以及在成功之前被消耗掉的算力和人力。
幻方的利潤能在過去兩年承擔這個成本,是因為Chatbot時代的試錯代價還在可控范圍內。
一旦進入Agent時代,參數規模躍升、訓練周期拉長、每一次試錯所消耗的資源都在成倍放大,而單靠幻方輸血,試錯的彈性就開始被壓縮。
所以自我造血不只是一個財務問題,而是一個關乎研發自由度的問題。
有持續的收入流入,意味著即使某一輪探索失敗了,也不會因為彈藥耗盡而被迫收縮戰線。
Anthropic能在2024年到2026年之間密集產出從Claude 3到Opus 4.7的多代模型迭代,底氣正是API收入帶來的正向現金流,這筆錢不需要向任何投資人解釋用途,也不需要證明每筆開支都花在了"正確"的方向上。
它會給研發團隊一種最稀缺的資源:犯錯的權利。
DeepSeek如果通過有限度的商業化建立起一定規模的經常性收入,那它在下一代模型的研發中就多了一層緩沖,不是替代幻方的輸血,而是在幻方之外再加一條供給線,讓試錯的空間不隨算力通脹而萎縮。![]()
七.改變與不能改變的
當然,還有一個問題需要審視:融資如果發生,是否會改變DeepSeek既定的前沿研究定位與AGI目標?
這絕非一個可輕描淡寫的問題。融資這件事,天然攜帶治理結構、退出路徑和時間約束。OpenAI引入微軟之后發生了什么,整個行業都看在眼里——更強的產品化導向、更復雜的商業敘事、更大的迭代壓力。
但判斷妥協的標準,不應該是是否融資,而是融資是否改變了原本的研究方向。
如果DeepSeek是在融資之后才轉向Agent,那可以叫路徑修正。
但從已有的證據來看。例如2025年9月就被曝出正在開發Agent功能的模型,2025年12月V3.2就強化了Agent能力,2026年3月一口氣放出17個Agent方向崗位。
這說明Agent本身就是DeepSeek既定路線的一部分,而不是融資之后的選擇。
3億美元的融資規模,在今天的AI市場也談不上多大規模。xAI剛剛做了200億美元的E輪,OpenAI以8520億美元估值融了1220億。3億美元更像是一筆戰略補給,而非方向性投降。
因此,把這次融資簡單理解為"向資本低頭",是用Chatbot時期的框架去理解一個已經進入Agent時代的AI行業。
真正發生變化的不是DeepSeek的立場,而是AI發展的階段。當模型從回答問題演進為執行任務,當推理成本逼近訓練成本,當人才競爭從"比理想"升級為"比確定性",當Agent的訓練需要的不只是算力而是復雜的真實場景,那些原本可以依靠方法論效率彌補資源差距的窗口期,正在收窄。
在這個窗口收窄的節點上,DeepSeek既需要保證純粹性,也需要探索技術路線的過程中,為下一階段的競爭儲備彈藥、鎖定人才、接入場景。
不是DeepSeek需要資本,是Agent時代需要一個資源配置更完整的DeepSeek。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.