網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

V4 發(fā)布前的 DeepSeek：特質(zhì)、組織和梁文鋒的獨(dú)特目標(biāo)

2026-04-02 15:34:54　來源: 晚點(diǎn)LatePost

北京舉報(bào)

分享至

有人離開，更多人留下。

文丨程曼祺

編輯丨宋瑋

DeepSeek 正處在一個(gè)變化的關(guān)口，從 2025 年下半年至今，明確已離開、找到新去處的 DeepSeek 成員有：

- 去年底被騰訊姚順雨挖走的王炳宣，他是 DeepSeek LLM（DeepSeek 第一代大語言模型）的核心作者，此后參與歷代模型訓(xùn)練。

- 約在春節(jié)前后離開的魏浩然，他是 DeepSeek-OCR 系列的核心作者，可能會(huì)入職某大廠。

- 近期正式離職的郭達(dá)雅，他是 DeepSeek-R1 的核心作者，可能會(huì)入職某大廠。

- 以及 2025 年早些時(shí)候離職進(jìn)入退休狀態(tài)的阮翀，他在今年 1 月官宣加入自動(dòng)駕駛創(chuàng)業(yè)公司元戎啟行；阮翀是從幻方時(shí)期就加入的老成員，是 Janus-Pro 等 DeepSeek 多模態(tài)成果的核心貢獻(xiàn)者。

DeepSeek 此前并未融資，沒有明確的公司估值。當(dāng)其它 AI 公司市值或估值高漲，梁文鋒正在想辦法回答團(tuán)隊(duì)成員的疑問：公司到底值多少錢？這關(guān)系著員工簽的期權(quán)協(xié)議到底價(jià)值幾何。

從 2025 年秋天起，梁文鋒也開始更多提產(chǎn)品化和商業(yè)化。DeepSeek 已有小數(shù)十人的產(chǎn)品團(tuán)隊(duì)，但尚未涉足 AI 編程、通用 Agent 等熱門應(yīng)用方向，在 C 端仍只有典型的 Chatbot 產(chǎn)品。

梁文鋒的新課題還有管理規(guī)模。DeepSeek 的人數(shù)已超過幻方，是他管過的最大的組織。

籠罩以上多重變化的是，DeepSeek V4 仍未正式發(fā)布。

其實(shí)在 26 年 1 月左右，V4 的一個(gè)小參數(shù)版本已給到了一些開源框架社區(qū)開始做適配。按此前相對(duì)樂觀的預(yù)期，大參數(shù)版的 V4 原本可能在 2 月中旬春節(jié)前后發(fā)布和開源。據(jù)了解，DeepSeek V4 有可能會(huì)在 4 月發(fā)布。

有人離開，更多人選擇留下。DeepSeek 在調(diào)整，但也有諸多不變的特質(zhì)。

它是全球僅有的 “不卷” 的核心 AI Lab。當(dāng) Google、OpenAI、xAI、字節(jié)跳動(dòng)等中美公司的核心 AI 開發(fā)人員每周工作 70~80 小時(shí)時(shí)，平日里 DeepSeek 的多數(shù)員工會(huì)在下午 6 點(diǎn)~7 點(diǎn)左右離開公司，他們早上也不打卡。

梁文鋒認(rèn)為，一個(gè)人一天能高質(zhì)量輸出的時(shí)間很難超過 6~8 小時(shí)。

DeepSeek 沒有明確的績效考核和 DDL（截止時(shí)間）。這個(gè)精簡而人才密度極高的組織依然延續(xù) “自然分工”，研究員可自由組隊(duì)或獨(dú)自鉆研一些新想法。

“除了主線之外，DeepSeek 也有人在做一些可能一年都不會(huì)有成效的長期研究。”“DeepSeek 是一個(gè)真心想做研究的人，在國內(nèi)，甚至全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。

當(dāng)然，DeepSeek 還有一個(gè)特點(diǎn)：神秘。尤其 2025 年之后，除了公開發(fā)布技術(shù)報(bào)告外，從創(chuàng)始人梁文鋒到團(tuán)隊(duì)成員集體 “沉默”，在 AI 從業(yè)者活躍的社交媒體或社區(qū)里很難聽到他們的聲音。

這篇報(bào)道里，我們呈現(xiàn)了從各種渠道了解到的 DeepSeek 的特點(diǎn)、工作重心、組織運(yùn)轉(zhuǎn)方式，和這個(gè)不到 200 人的組織正在發(fā)生的變化。這一切的源頭，都是梁文鋒為 DeepSeek 設(shè)立的獨(dú)特目標(biāo)。

梁文鋒其人：做少數(shù)事，做到極致

梁文鋒的 AI 目標(biāo)遠(yuǎn)早于 DeepSeek 成立的 2023 年。

2016 年，AGI 的提出者、DeepMind 創(chuàng)始人哈薩比斯曾組建量化交易團(tuán)隊(duì)，試圖給當(dāng)時(shí)想從 Google 獨(dú)立的 DeepMind 創(chuàng)收，結(jié)果沒賺到錢。

同一年，浙大本碩畢業(yè)的梁文鋒做量化投資已經(jīng) 8 年。他在 2015 年創(chuàng)立幻方，2016 年開始用 GPU 跑深度學(xué)習(xí)實(shí)盤交易，在 2017 年底實(shí)現(xiàn) “幾乎所有交易策略 AI 化”，在 2019 年開始建立幻方的第一個(gè)算力集群，有 1100 張 GPU 的 “螢火 1 號(hào)”。

也是 2019 年，幻方 AI（幻方人工智能基礎(chǔ)研究有限公司）正式注冊成立。現(xiàn)在在小米負(fù)責(zé) AI 的羅福莉和近期加入元戎的阮翀都是在這之后加入幻方，后在 2023 年轉(zhuǎn)入 DeepSeek。

作為一個(gè)不到 30 歲就財(cái)富自由的人，梁文鋒的生活簡單而神秘。

在周圍人的印象中，他會(huì)好多天穿同一件衣服。他在杭州曾長期住酒店，在多數(shù) DeepSeek 研發(fā)人員所在的北京則租房住。他身材精瘦、有運(yùn)動(dòng)習(xí)慣，被人所知的愛好是徒步等戶外運(yùn)動(dòng)。

黃仁勛會(huì)邀請(qǐng)英偉達(dá)員工去家里做客，喝小酒、聊家常，開心地展示跑車。而梁文鋒不參與季度團(tuán)建活動(dòng)，很少和成員聚餐，年底大團(tuán)建也只在講話時(shí)露面，不會(huì)參與全程。

2022 年，幻方一位員工 “一只平凡的小豬” 個(gè)人向慈善機(jī)構(gòu)捐助 1.38 億元。后來很多人猜這只小豬就是梁文鋒。幻方工作人員的回復(fù)是：“員工捐款均是匿名，公司內(nèi)部也不知道小豬的真實(shí)身份。”

在工作范疇里，梁文鋒只做少數(shù)事。他不做多數(shù)初創(chuàng)公司 CEO 做的一些事，如融資。

2023 年，梁文鋒小范圍見過一些投資人。但據(jù)我們了解，他提出了一個(gè)不常規(guī)的要求：類似 OpenAI 與微軟的投資協(xié)議，梁文鋒希望投資方接受一個(gè)回報(bào)上限。這一輪見下來，沒有機(jī)構(gòu)投資 DeepSeek。

之后兩年，中國大模型融資洶涌，頻現(xiàn)數(shù)億美元大單輪，梁文鋒卻不再見投資人了，甚至不建立新的聯(lián)系。即使不在融資窗口，大部分創(chuàng)始人也不會(huì)拒絕認(rèn)識(shí)一下一線機(jī)構(gòu)合伙人，而梁文鋒拒絕了多數(shù)此類請(qǐng)求。

梁文鋒幾乎把所有時(shí)間投入到他認(rèn)為應(yīng)該聚焦的少數(shù)事上，做得細(xì)致、做到極致。

DeepSeek 此前成功的關(guān)鍵之一是 “力出一孔”，明確以語言模型為更高優(yōu)先級(jí)，沒有做多模態(tài)生成等熱門方向。

在選定的主線上，梁文鋒會(huì) “hands on” 地深入細(xì)節(jié)。他從不同背景的團(tuán)隊(duì)成員身上學(xué)習(xí)算法、架構(gòu)、Infra、數(shù)據(jù)的知識(shí)，會(huì)自己參與模型和產(chǎn)品的細(xì)節(jié)討論。

見過梁文鋒的不少人提到，他沒有 CEO 或所謂天才的 “氣場”，更像一個(gè)研究員，他和人談?wù)撟疃嗟氖蔷唧w技術(shù)問題。

綠洲資本創(chuàng)始合伙人張津劍曾在《那些活出來的人中》分享了一個(gè)小故事，他問自己投資的 MiniMax 創(chuàng)始人閆俊杰：“有比你更專注的人嗎？” 閆俊杰說有一次約一位沒見過的朋友吃飯，到早了，看到一位穿 T 恤的小哥，以為是助理。對(duì)方開始沒有自我介紹，問了閆俊杰很多技術(shù)問題。過了半小時(shí)，閆俊杰說：“梁總什么時(shí)候來？” 對(duì)方說：“我就是梁文鋒”。

DeepSeek 組織：扁平、交叉分工、不加班

與梁文鋒的風(fēng)格相應(yīng)，DeepSeek 的組織極其扁平、各環(huán)節(jié)交叉分工、謹(jǐn)慎擴(kuò)張規(guī)模、不加班。

創(chuàng)立幻方時(shí)，梁文鋒有合伙人，而 DeepSeek 沒有二把手，尤其在研究團(tuán)隊(duì)，只有梁文鋒和其他研究員兩個(gè)層級(jí)。梁文鋒做重大決定，承擔(dān)最多結(jié)果。

這部分研究團(tuán)隊(duì)現(xiàn)在約有 100 多人，它像一個(gè)大型實(shí)驗(yàn)室。主要在 2000 年前后出生的 DeepSeek 研究員們習(xí)慣稱 1985 年出生的梁文鋒為 “梁老板”。這個(gè)老板更接近導(dǎo)師：組織研發(fā)、協(xié)調(diào)資源，也做具體研究，在共同成果上署名為通訊作者。

梁文鋒本人參與最多的是基模架構(gòu)團(tuán)隊(duì)，會(huì)與團(tuán)隊(duì)深入討論后確定每一代基模的架構(gòu)定版。這個(gè)團(tuán)隊(duì)有小幾十人，他們是預(yù)訓(xùn)練的主力。

與基模架構(gòu)密切相關(guān)的是 Infra 和數(shù)據(jù)團(tuán)隊(duì)，各有小幾十人。Infra 團(tuán)隊(duì)在一些公司里更像完成算法需求的 “內(nèi)部乙方”，而 DeepSeek 的 Infra 團(tuán)隊(duì)會(huì)在模型訓(xùn)練前的定版階段就參與討論、給出建議。

這幾個(gè)模塊間的緊密合作使 DeepSeek 的團(tuán)隊(duì)界限沒那么涇渭分明，形成了 “交叉分工”。這其實(shí)是最符合模型訓(xùn)練特點(diǎn)的協(xié)作形式，因?yàn)樵谀Ｐ蛯?shí)驗(yàn)和定版階段，就要考慮數(shù)據(jù)選擇和 Infra 實(shí)現(xiàn)。

梁文鋒是串起這些不同模塊的探測器和粘合劑，他會(huì)出席每一個(gè)團(tuán)隊(duì)各自的會(huì)議，了解全局進(jìn)度和卡點(diǎn)。DeepSeek 大部分團(tuán)隊(duì)的周會(huì)也向其它團(tuán)隊(duì)的人開放，可跨組參會(huì)。

深入細(xì)節(jié)的一號(hào)位風(fēng)格和自發(fā)形成的緊密協(xié)作都很難在大組織里實(shí)現(xiàn)。所以 DeepSeek 會(huì)很謹(jǐn)慎地?cái)U(kuò)大核心研發(fā)團(tuán)隊(duì)的規(guī)模。

在全球 AI 圈都非常特異的一點(diǎn)是，DeepSeek 不加班。他們不打卡、沒有明確的績效考核，平日多數(shù)成員會(huì)在 6 點(diǎn)~7 點(diǎn)左右離開公司。DeepSeek 給員工免費(fèi)提供一些下班后福利，如球類課程、運(yùn)動(dòng)場地報(bào)銷等。

梁文鋒認(rèn)為：一個(gè)人每天能高質(zhì)量工作的時(shí)間很難超過 6~8 小時(shí)。加班疲勞下的昏庸判斷反而會(huì)浪費(fèi)寶貴的算力資源，得不償失。

在人員構(gòu)成上，DeepSeek 此前幾乎不社招，以應(yīng)屆生和實(shí)習(xí)生留任為主。2025 年初，《晚點(diǎn)》曾梳理當(dāng)時(shí)參與過 DeepSeek 三代模型（LLM、V2、V3&R1）的 172 名研究者（包括實(shí)習(xí)生），并找到了其中 84 人的履歷：超 7 成的人是本科生和碩士生，超 7 成的人小于 30 歲。

在 V3 和 R1 之前，DeepSeek 是以大廠約 1/10 的人數(shù)，約 1/2 的人均工作時(shí)間，以極高的專注和聚焦，躋身全球大模型第一梯隊(duì)。

但隨著觸達(dá)頂尖 AI 能力需要探索的方向越來越多，繼續(xù)保持這種組織規(guī)模、溝通方式和協(xié)作氛圍已越來越難。

過去 15 個(gè)月，DeepSeek 繼續(xù)做自己，而外部世界急劇變化

2025 年初 V3 和 R1 爆火后，DeepSeek 并沒有乘勝追擊放大招，而是沿著他們專注的方向繼續(xù)研發(fā)，已經(jīng)公開的成果大致有三類：

一是效率優(yōu)化：極致壓榨 GPU 算力，提高單位算力能產(chǎn)出的智能。這包括 DeepSeek 在 2025 年初的開源周釋放的一整套訓(xùn)練與推理 Infra，涵蓋推理 kernel、通信庫、矩陣乘法庫和數(shù)據(jù)處理框架。（注：kernel 是在 GPU 上執(zhí)行最底層計(jì)算的代碼，用來實(shí)現(xiàn)矩陣乘法等核心運(yùn)算。）

還有對(duì) “注意力機(jī)制” 的持續(xù)改進(jìn)：如 25 年初的 NSA（原生稀疏注意力）和后續(xù)的 DSA（動(dòng)態(tài)稀疏注意力）。加上更早時(shí) V2 中的 MLA（多頭潛在注意力），它們的共同目標(biāo)，是在不大幅增加算力的前提下處理更長的上下文。

從 25 年 9 月底更新的 DeepSeek-V3.2 中還可以看到，DeepSeek 甚至把底層的算子庫從主流的 CUDA 和 Triton 語言換成了 TileLang。CUDA 是英偉達(dá)提供的最底層語言，Triton 由 OpenAI 開源，TileLang 則是北京大學(xué)楊智團(tuán)隊(duì)發(fā)起的開源項(xiàng)目。

二是模型架構(gòu)改進(jìn)，如 26 年初發(fā)布的 mHC（流行約束超連接），旨在提升大規(guī)模訓(xùn)練中的穩(wěn)定性；和在模型之外構(gòu)建長期記憶的 Engram。外界普遍認(rèn)為，mHC 會(huì)被用到 V4 的訓(xùn)練中。

三是一些 “非主流” 探索，如把文本轉(zhuǎn)成圖片，再輸入給模型的 DeepSeek-OCR，這個(gè)思路是讓模型按更接近人類 “看文字” 的方式理解段落與層級(jí)，提升對(duì)復(fù)雜文檔的理解力。

在 DeepSeek 內(nèi)部，還有更多進(jìn)行中的此類嘗試，包括持續(xù)學(xué)習(xí)、自主學(xué)習(xí)等。

梁文鋒還在 2025 年招募了一些神經(jīng)科學(xué)和腦科學(xué)背景的顧問，想探索更接近人腦的學(xué)習(xí)機(jī)制。

而同期，外部 AI 環(huán)境在 2025 年至今急劇變化，最受關(guān)注的競爭主線有兩條：

一是以 coding 能力為基礎(chǔ)的 Agentic 模型和應(yīng)用。這是 Anthropic 和 OpenAI 目前競爭最激烈的主戰(zhàn)場，形成了 Opus 4.6 vs GPT-5.4 兩個(gè)最新模型，和 Claude Code vs Codex 兩個(gè)產(chǎn)品的對(duì)陣。年初至今爆火的 OpenClaw 小龍蝦也是 Agentic 應(yīng)用的最新形態(tài)。

二是多模態(tài)生成，這個(gè)領(lǐng)域因 “魔法效果” 屢次出圈：2025 年春天的 OpenAI GPT-4o ，秋天的 Google NanoBanana，再到 2026 年春節(jié)前的字節(jié) Seedance 2.0。而視頻生成也與一個(gè)更前沿的方向有關(guān)，即 “世界模型”。

DeepSeek 首先沒怎么投入多模態(tài)生成，因?yàn)榱何匿h認(rèn)為多模態(tài)生成不是智能的主線。

在 Agent 方向上，DeepSeek-V3.2 強(qiáng)化了 Agent 能力，但 DeepSeek 的整體迭代頻次低于 R1 之后一度深感焦慮其它小虎。

2025 年初至今，智譜、MiniMax、Kimi 分別已更新了 5 版、4 版和 3 版模型，針對(duì) Agent 或 coding 強(qiáng)化。

據(jù) OpenRouter 數(shù)據(jù)，過去 30 天（2 月 24 日-3 月 26 日），通過 OpenRouter 調(diào)用的 OpenClaw 應(yīng)用的模型 token 消耗前 10 中，6 個(gè)模型來自中國，DeepSeek-V3.2 排在第 12。（注：OpenRouter 更反映個(gè)人和中小開發(fā)者的使用情況，只能作為整體 Token 消耗的參考。）

DeepSeek 的目標(biāo)不是最主流的，有人離開、有人留下

DeepSeek 的 “特立獨(dú)行”，和梁文鋒認(rèn)同的 AGI 目標(biāo)有關(guān)，除了追求大模型的智能上限外，他認(rèn)為還有兩個(gè)很重要的工作：

一是基于國產(chǎn)生態(tài)來做大模型。

DeepSeek 會(huì)投入對(duì)國產(chǎn) GPU 的適配，以解決高性能 GPU 供給受限的現(xiàn)實(shí)。比如他們在去年 8 月更新 V3.1 后提及，DeepSeek 采用的 UE8M0 FP8——這是一種數(shù)據(jù)壓縮格式——“是針對(duì)下一代國產(chǎn)芯片設(shè)計(jì)”。前文提到的用國產(chǎn)開源的 TileLang 替代 Triton 也是這類工作，能在基礎(chǔ)層更有主動(dòng)權(quán)。

在與 AI 從業(yè)者交流時(shí)，梁文鋒也曾提過這樣的假設(shè)：“能不能用現(xiàn)存的一部分算力，就實(shí)現(xiàn)現(xiàn)在所有的智能？”

二是 “原創(chuàng)式創(chuàng)新”，做一些大廠或其它創(chuàng)業(yè)公司不會(huì)去試，不愿去試的方向。

比如 2024 年下半年，DeepSeek 就開始了 Janus 系列，嘗試統(tǒng)一多模態(tài)的理解和生成。DeepSeek 也做過 Prover 系列，探索形式化證明。還有 25 年的 OCR，以及內(nèi)部在繼續(xù)做的持續(xù)學(xué)習(xí)和仿生人腦的探索。

作為創(chuàng)始人，梁文鋒最在意的，不僅是模型效果本身，也包括追求效果的路上那些更本質(zhì)、原創(chuàng)的發(fā)現(xiàn)。

但這與外界現(xiàn)在對(duì) DeepSeek 的部分期待并不匹配：一些人希望 DeepSeek 每次出手都像 R1 那樣石破天驚，這有些強(qiáng)人所難，也不符合技術(shù)規(guī)律。

梁文鋒可以不在意外部期待，但他必須面對(duì)和處理內(nèi)部期待。

對(duì)更多年輕的研究員來說，做更多前沿研究，也需要承擔(dān)更多不確定性。更保險(xiǎn)的路，是持續(xù)參與業(yè)界最強(qiáng)模型，在那些被關(guān)注的技術(shù)報(bào)告上署名，以及能有豐富的 GPU 資源支撐實(shí)驗(yàn)和探索。

除了榮譽(yù)和影響力，外界對(duì) DeepSeek 成員的吸引力還有高額的財(cái)富承諾。

DeepSeek 的絕對(duì)薪資不低，但外面給的更高。一些獵頭告訴我們，競爭對(duì)手開出了 “難以拒絕的數(shù)字”，“翻 2 到 3 倍問題不大”，“其他公司開出 8 位數(shù)（算股票或期權(quán)）總包”。

新變化還有，MiniMax 和智譜上市、股價(jià)高漲，階躍、Kimi 的 IPO 也提上日程。這也讓一些 DeepSeek 成員對(duì)手中那份沒有明確標(biāo)價(jià)的期權(quán)產(chǎn)生更多疑問。

面對(duì)巨額邀約，更多人選擇留下。他們認(rèn)可梁文鋒追求 AGI 的方式，愿意做并非競爭驅(qū)動(dòng)的探索；也習(xí)慣了 DeepSeek 相對(duì)寬松、從容的研究氛圍。

近期外界的一些傳聞并不準(zhǔn)確，DeepSeek 團(tuán)隊(duì)雖有變化，但并沒有成組流失。

“留下的人多少還是有些理想的。” 有接近 DeepSeek 的人士說，梁文鋒覺得在提升模型效率和性能的主線外，需要做一些當(dāng)下回報(bào)不明確的方向，因?yàn)?“國外那些算力更多的公司，如 Google、OpenAI，內(nèi)部肯定在試各種方向”。

至今，DeepSeek 相對(duì)小的團(tuán)隊(duì)和成立以來的透明、扁平的氛圍，讓成員之間依然可以自然分工：有時(shí)開始一個(gè)新方向，就是因?yàn)橛腥鍌€(gè)人都覺得一個(gè) idea 不錯(cuò)，然后就一起做了。

這與梁文鋒 2024 年接受《暗涌》采訪時(shí)的描述相呼應(yīng)：“我們一般不前置分工”，“每個(gè)人有自己獨(dú)特的成長經(jīng)歷，都是自帶想法的，不需要 push 他……不過當(dāng)一個(gè) idea 顯示出潛力，我們也會(huì)自上而下地去調(diào)配資源。”

“DeepSeek 是一個(gè)真心想做研究的人，在國內(nèi)，甚至是全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。

改變世界，也被世界改變

對(duì) AGI 目標(biāo)的獨(dú)特認(rèn)知和拆解，是 DeepSeek 的可貴之處，也是它如今面臨內(nèi)部張力的原因。因?yàn)榱何匿h看重的生態(tài)建設(shè)和原創(chuàng)探索，與業(yè)界普遍把 “保持最強(qiáng)” 視為第一優(yōu)先級(jí)，是重合但并非完全一致的目標(biāo)。

而且大模型發(fā)展到今天，“強(qiáng)” 和 “原創(chuàng)性” 的標(biāo)準(zhǔn)越來越模糊而主觀。

Benchmark 分?jǐn)?shù)已不能完全衡量模型水平。尤其進(jìn)入 Agentic 模型競爭后，產(chǎn)品觸手及其帶來的長尾使用案例與多樣化數(shù)據(jù)變得更重要了，這恰恰是專注于模型研發(fā)的 DeepSeek 此前沒有太多投入的地方。

即將發(fā)布的 V4，大概率仍是開源最強(qiáng)模型，但很難是碾壓級(jí)的強(qiáng)。因?yàn)楝F(xiàn)在不同場景的不同開發(fā)者和用戶對(duì) “強(qiáng)” 的標(biāo)準(zhǔn)和體感已越來越多元。

什么是原創(chuàng)的、有價(jià)值的新探索，則向來眾說紛紜，取決于不同研究者的經(jīng)驗(yàn)、判斷和直覺，所謂 “技術(shù)品味”。

驗(yàn)證品味的方式是實(shí)驗(yàn)，而實(shí)驗(yàn)的數(shù)量和規(guī)模又受限于 GPU 資源。相對(duì)于同行，DeepSeek 并沒有那么多算力。

最后，不管是大模型的生態(tài)基礎(chǔ)，還是在追求模型效果的過程中，探索其它團(tuán)隊(duì)不一定會(huì)試的方向，這些梁文鋒看重的工作的回報(bào)都極不明確。

前沿研究本該承擔(dān)這種不確定性，但它與算力資源有限的事實(shí)，與外界對(duì) DeepSeek 能持續(xù)驚艷甚至 “碾壓” 的期待不完全匹配。

梁文鋒意識(shí)到了要改變，近期他開始想辦法給公司估值，給團(tuán)隊(duì)成員更多確定的預(yù)期。

DeepSeek 也將更多投入產(chǎn)品。我們梳理了 DeepSeek 一位 HR 在社交媒體上從 2024 年 12 月至今發(fā)布的所有招聘啟示，在今年 3 月中旬的最新招聘中，DeepSeek 第一次提及其它具體產(chǎn)品的名稱，要招募 Agent 方向 “模型策略產(chǎn)品經(jīng)理”：

持續(xù)跟蹤行業(yè)前沿，熟悉并深度使用過 Claude Code、OpenClaw、Manus 等知名 agent……

接下來，肯定會(huì)看到 DeepSeek 在 Agent 產(chǎn)品上的更多動(dòng)作。

2025 年初，DeepSeek 以慷慨的開源精神和以小博大的奇跡，震撼了中國和世界，也改變了世界：讓一批同行投入更多精力到模型技術(shù)本身，啟發(fā)了 Kimi K2 和 K2-thinking 等后續(xù)模型，也直接催生了一些新團(tuán)隊(duì)，如陳天橋出資支持的 MiroMind。

奇跡之所以是奇跡，就是因?yàn)樗怀０l(fā)生，是小概率事件。在中國這個(gè)崇尚競爭和結(jié)果說話的環(huán)境里，敢于追求獨(dú)特目標(biāo)的 DeepSeek 的存在本身，是一個(gè)令人驚喜的小概率事件。

接觸梁文鋒的人評(píng)價(jià)：“他是一個(gè)特別抗噪音的人。”

2025 年 R1 爆火后，梁文鋒顯示了對(duì)追捧的淡然。而現(xiàn)在，他面臨另一種情形的考驗(yàn)：在外部競爭加劇時(shí)，分辨噪音與信號(hào)，堅(jiān)持該堅(jiān)持的，改變要改變的。

“低頭做事的人也許不一定能在浮躁的市場洪流里笑到最后，但是只有更多 DeepSeek 這樣的公司出現(xiàn)，中國科技才有從 ‘復(fù)刻’ 到領(lǐng)跑的可能。” 一位從業(yè)者說。

這是屬于梁文鋒和 DeepSeek 的工作。而曾被這家公司震動(dòng)過的更多人，能做的很簡單：卸下爽文敘事，用更多平常心去看待一家公司和技術(shù)創(chuàng)新。

題圖來源：14 Peaks: Nothing Is Impossible

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.