![]()
出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|視覺中國
今天準備融資的梁文鋒,已經不是一年前的那個梁文鋒了。
4月17日晚,據悉,DeepSeek(深度求索)正以約100億美元估值尋求新一輪融資,規模約3億美元。而就在一年前,梁文鋒還明確拒絕過VC投資,并對外表示“DeepSeek暫無融資計劃”。對此,虎嗅向DeepSeek方面發送郵件進行核實,截至發稿未獲回復。
“我現在還不清楚梁是否真的開始找VC了。”華映資本海外合伙人邱諄告訴虎嗅。邱諄常年往返于硅谷和國內,并長期關注AI與具身智能領域。
嚴格意義上,DeepSeek并不屬于華映在海外的直接項目,但VC的目光幾乎都聚焦在DeepSeek身上。邱諄非常清楚地知道DeepSeek正在面臨的困境,但同時他也告訴我,“這不代表我們不會投他。”
短短一年,梁文鋒的態度發生360度反轉。
4月19日,社交媒體上又開始流傳另一種說法:過去一年里,梁文鋒曾先后見過馬化騰與雷軍,討論融資的可能性。雖然真假尚未完全坐實,但傳遞出的信號已經非常明顯了。對此,虎嗅也向騰訊方面求證,截至發稿,尚未得到回復。
那么問題來了,為什么時隔一年,這個一直以克制、低調著稱的創始人,會從“拒絕融資”的態度,轉變為主動接觸資本?這中間究竟發生了什么?在筆者看來,這并不只是態度變化,更像是某種外部約束開始顯性化。
一年前的梁文鋒,幾乎沒有對手。架構與算法層面的連續突破,讓DeepSeek一度被視為中國大模型體系中少數具備“自洽能力”的玩家之一,也在一定程度上加速了傳統企業擁抱AI的進程。
但在某種程度上,也正是由于他過去突出的成績,一時間被上百家國內外媒體稱贊后,梁文鋒幾乎是被“捧殺”了。
過去一年,圍繞DeepSeek的敘事開始出現裂縫。一方面,關于V4的發布時間,多次被外媒提前“預告”,卻始終未能如期落地;另一方面,在這些報道中,延遲原因也被直接指向一個更現實的問題,即擺脫英偉達體系所帶來的代價。
然而,節奏開始變慢,外部預期卻沒有下降。
同樣是在過去這一年中,團隊層面也出現波動:包括參與代碼研究的郭達雅、LLM核心作者王炳宣、OCR核心作者魏浩然在內的多位關鍵人才相繼離開。
從外部視角看,這家曾被寄予厚望的公司,似乎遇到難題了。
而就在這些復雜信號傳出之后,融資的消息出現了。如果把上述這些故事線連接到一起,一個很顯而易見的答案是,梁文鋒是被逼著走到今天的。
那么,我們先做一個假設,如果梁文鋒真的去VC尋求幫助,VC們會救他嗎?
我得到的答案是肯定的。
被“捧殺”的DeepSeek
DeepSeek被“捧殺”了:它最被贊賞的能力,正在成為最難調整的部分。
回看2025年春節,那個“年”是屬于DeepSeek的。
R1發布之后,這家公司迅速被推到一個極高的位置:極致性價比、算法創新、國產替代路徑等等。在一系列敘事疊加之下,DeepSeek也被推到了一個被人仰望的高度。
彼時,外界的共識是,DeepSeek在做的不僅是大模型,而是重寫一套更便宜的AI基礎設施。
但一年之后,這套敘事開始出現裂縫。
原本被認為會在2026年春節前后發布的新一代模型,卻遲遲未能落地。外界幾乎一致認為,關鍵卡點在于從依賴英偉達到擺脫這種依賴,這個過程很不順利。
但DeepSeek曾經的優勢,恰恰在于對英偉達強綁定。
與多數依賴規模堆疊的大模型不同,DeepSeek是從“效率”入手,通過一系列算法與工程優化,實現了接近SOTA水平的性能,同時大幅壓低成本。例如,其提出的GRPO架構,本質上是對訓練與推理效率的再設計。
但這種效率,并不是憑空出現的。一方面,在算力上,創始人梁文鋒早年量化交易的積累,使其擁有遠超一般創業公司的英偉達GPU資源;另一方面,在數據上,DeepSeek大量依賴對一流模型的蒸餾結果。
而真正關鍵的一步,在于底層工程。DeepSeek通過直接優化PTX編程,對GPU執行層進行改寫,從而實現了對AI算力基礎設施的系統性重構。
對此,華映資本海外合伙人邱諄對虎嗅解釋道:“正是這一步,才讓DeepSeek的‘性價比’能夠實現。”
而問題也出在這里。PTX本質上是英偉達CUDA體系中的中間語言,是其生態的核心接口之一。這意味著,DeepSeek雖然在算法層實現了創新,但在基礎設施層,卻是高度綁定英偉達體系的。
也就是說,一旦嘗試切換算力路徑,例如轉向國產芯片,問題就不再是“適配”,而是“重寫”。
目前,大多數國產芯片廠商提供的是對CUDA生態的兼容方案,但對于已經深入PTX層優化的DeepSeek而言,這種兼容并不成立。底層代碼、調度邏輯乃至整體工程體系,都需要重構。
換句話說,它的優勢越深,遷移成本就越高。
這也解釋了過去一年里的一些變化:模型節奏放緩、組織層面出現波動,以及部分核心人才的離開。從外部看,這些是現象,但背后指向的問題是:DeepSeek正在嘗試擺脫一條曾經讓它領先的路徑。
這條路徑,甚至讓DeepSeek無法有機會與國內一流模型站在同一梯隊。
邱諄是一位常年住在硅谷的投資人。他告訴虎嗅,包括OpenAI在內的公司,并不會在底層過度依賴PTX優化,其原因是,他們不希望被單一算力體系鎖死。國內互聯網廠商亦是如此,他們不會將自己賴以生存的業務都押注在英偉達算力體系之上的。
但DeepSeek已經走得太深了。
在過去一年,DeepSeek正在重寫自己的底層代碼,但這對他們來說,幾乎是從0開始。
VC一直在等梁文鋒
于是,才有了DeepSeek尋求融資的故事。
一位頭部VC投資人告訴虎嗅,“融資并不會改變什么”。
原因已經很清楚了。從技術的角度來講,這一切都是不可逆轉的。盡管DeepSeek重寫底層代碼,試圖適配國產芯片,性能也會大打折扣。
然而,從資本層面來看,這就是另一個故事了。“雖然我很清楚DeepSeek現在面臨的問題,但這并不影響很多VC搶他們”。邱諄對虎嗅說道。
從大模型投資周期的角度來看,DeepSeek早就錯過了這一風口。但即便這家公司是從0開始,即便已經錯過風口,都不會影響VC入局。
“VC向來都是看人,而且VC本質上是一種‘沖動消費’。”邱諄告訴我。
不過,梁文鋒的想法,依然陰晴不定。根據目前已上市的大模型公司來計算估值,DeepSeek的目標估值100億美元并不高,甚至低于智譜、MiniMax和Kimi任意一家。
但還有一種可能是,如果按照梁文鋒從去年不愿意融資到今年開放融資的想法來推測,也許是梁文鋒本人并不愿意釋放過多股份。
從這一角度來看,DeepSeek是否會融資,不確定性依然很高。
如果,梁文鋒的目標是騰訊,也許融資后,對DeepSeek而言并不會發生太大變化,至少不會“傷筋動骨”;但倘若,他的目標是所有VC,那么也許DeepSeek會變成一家商業化公司,而這似乎并不符合這家公司的基因。
DeepSeek會墜入“凡間”嗎?
墜入“凡間”,就意味著DeepSeek要站在和Kimi、MiniMax、智譜、階躍星辰一樣的位置,成為新的“基模五強”。
過去一年,DeepSeek之所以被反復討論,并不只是因為模型能力本身,而是因為它看起來“像一個例外”。
它用更少的錢,做出了接近甚至逼近SOTA的模型;它拒絕融資,在一輪資本狂熱中保持克制;它強調效率,而不是規模。
這些都可以證明,DeepSeek從來沒有走“既定路線”。
但現在,這個“例外”正在變得越來越難以維持。
但也許,梁文鋒是想成為“凡人”的。因為就算是按照“既定路線”來判斷這家公司,他也有著自己的獨特優勢:
首先,它是一家能做出創新的公司,這一點就已經非常難得;第二,DeepSeek并不缺錢,他尋求外界幫助,也許是想釋放出另一種信號,甚至是身份上的轉變。
從這種角度來看,融資意味著重新選擇一條路徑。
但如果,DeepSeek真的變成一家商業化公司,他就需要考慮一個他從前并不需要過分考慮的事情:它的模型能力如何轉化為收入?
當然,DeepSeek可以用于梁文鋒自己的幻方量化里,從而助力其他業務產生收入。但如果這樣,DeepSeek還會是一家傳統意義上的大模型公司嗎?
似乎,DeepSeek正站在一個十字路口上。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4851882.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.