![]()
有人離開,更多人留下。
文丨程曼祺
編輯丨宋瑋
DeepSeek 正處在一個(gè)變化的關(guān)口,從 2025 年下半年至今,明確已離開、找到新去處的 DeepSeek 成員有:
- 去年底被騰訊姚順雨挖走的王炳宣,他是 DeepSeek LLM(DeepSeek 第一代大語言模型)的核心作者,此后參與歷代模型訓(xùn)練。
- 約在春節(jié)前后離開的魏浩然,他是 DeepSeek-OCR 系列的核心作者,可能會(huì)入職某大廠。
- 近期正式離職的郭達(dá)雅,他是 DeepSeek-R1 的核心作者,可能會(huì)入職某大廠。
- 以及 2025 年早些時(shí)候離職進(jìn)入退休狀態(tài)的阮翀,他在今年 1 月官宣加入自動(dòng)駕駛創(chuàng)業(yè)公司元戎啟行;阮翀是從幻方時(shí)期就加入的老成員,是 Janus-Pro 等 DeepSeek 多模態(tài)成果的核心貢獻(xiàn)者。
DeepSeek 此前并未融資,沒有明確的公司估值。當(dāng)其它 AI 公司市值或估值高漲,梁文鋒正在想辦法回答團(tuán)隊(duì)成員的疑問:公司到底值多少錢?這關(guān)系著員工簽的期權(quán)協(xié)議到底價(jià)值幾何。
從 2025 年秋天起,梁文鋒也開始更多提產(chǎn)品化和商業(yè)化。DeepSeek 已有小數(shù)十人的產(chǎn)品團(tuán)隊(duì),但尚未涉足 AI 編程、通用 Agent 等熱門應(yīng)用方向,在 C 端仍只有典型的 Chatbot 產(chǎn)品。
梁文鋒的新課題還有管理規(guī)模。DeepSeek 的人數(shù)已超過幻方,是他管過的最大的組織。
籠罩以上多重變化的是,DeepSeek V4 仍未正式發(fā)布。
其實(shí)在 26 年 1 月左右,V4 的一個(gè)小參數(shù)版本已給到了一些開源框架社區(qū)開始做適配。按此前相對(duì)樂觀的預(yù)期,大參數(shù)版的 V4 原本可能在 2 月中旬春節(jié)前后發(fā)布和開源。據(jù)了解,DeepSeek V4 有可能會(huì)在 4 月發(fā)布。
有人離開,更多人選擇留下。DeepSeek 在調(diào)整,但也有諸多不變的特質(zhì)。
它是全球僅有的 “不卷” 的核心 AI Lab。當(dāng) Google、OpenAI、xAI、字節(jié)跳動(dòng)等中美公司的核心 AI 開發(fā)人員每周工作 70~80 小時(shí)時(shí),平日里 DeepSeek 的多數(shù)員工會(huì)在下午 6 點(diǎn)~7 點(diǎn)左右離開公司,他們早上也不打卡。
梁文鋒認(rèn)為,一個(gè)人一天能高質(zhì)量輸出的時(shí)間很難超過 6~8 小時(shí)。
DeepSeek 沒有明確的績效考核和 DDL(截止時(shí)間)。這個(gè)精簡而人才密度極高的組織依然延續(xù) “自然分工”,研究員可自由組隊(duì)或獨(dú)自鉆研一些新想法。
“除了主線之外,DeepSeek 也有人在做一些可能一年都不會(huì)有成效的長期研究。”“DeepSeek 是一個(gè)真心想做研究的人,在國內(nèi),甚至全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。
當(dāng)然,DeepSeek 還有一個(gè)特點(diǎn):神秘。尤其 2025 年之后,除了公開發(fā)布技術(shù)報(bào)告外,從創(chuàng)始人梁文鋒到團(tuán)隊(duì)成員集體 “沉默”,在 AI 從業(yè)者活躍的社交媒體或社區(qū)里很難聽到他們的聲音。
這篇報(bào)道里,我們呈現(xiàn)了從各種渠道了解到的 DeepSeek 的特點(diǎn)、工作重心、組織運(yùn)轉(zhuǎn)方式,和這個(gè)不到 200 人的組織正在發(fā)生的變化。這一切的源頭,都是梁文鋒為 DeepSeek 設(shè)立的獨(dú)特目標(biāo)。
梁文鋒其人:做少數(shù)事,做到極致
梁文鋒的 AI 目標(biāo)遠(yuǎn)早于 DeepSeek 成立的 2023 年。
2016 年,AGI 的提出者、DeepMind 創(chuàng)始人哈薩比斯曾組建量化交易團(tuán)隊(duì),試圖給當(dāng)時(shí)想從 Google 獨(dú)立的 DeepMind 創(chuàng)收,結(jié)果沒賺到錢。
同一年,浙大本碩畢業(yè)的梁文鋒做量化投資已經(jīng) 8 年。他在 2015 年創(chuàng)立幻方,2016 年開始用 GPU 跑深度學(xué)習(xí)實(shí)盤交易,在 2017 年底實(shí)現(xiàn) “幾乎所有交易策略 AI 化”,在 2019 年開始建立幻方的第一個(gè)算力集群,有 1100 張 GPU 的 “螢火 1 號(hào)”。
也是 2019 年,幻方 AI(幻方人工智能基礎(chǔ)研究有限公司)正式注冊成立。現(xiàn)在在小米負(fù)責(zé) AI 的羅福莉和近期加入元戎的阮翀都是在這之后加入幻方,后在 2023 年轉(zhuǎn)入 DeepSeek。
作為一個(gè)不到 30 歲就財(cái)富自由的人,梁文鋒的生活簡單而神秘。
在周圍人的印象中,他會(huì)好多天穿同一件衣服。他在杭州曾長期住酒店,在多數(shù) DeepSeek 研發(fā)人員所在的北京則租房住。他身材精瘦、有運(yùn)動(dòng)習(xí)慣,被人所知的愛好是徒步等戶外運(yùn)動(dòng)。
黃仁勛會(huì)邀請(qǐng)英偉達(dá)員工去家里做客,喝小酒、聊家常,開心地展示跑車。而梁文鋒不參與季度團(tuán)建活動(dòng),很少和成員聚餐,年底大團(tuán)建也只在講話時(shí)露面,不會(huì)參與全程。
2022 年,幻方一位員工 “一只平凡的小豬” 個(gè)人向慈善機(jī)構(gòu)捐助 1.38 億元。后來很多人猜這只小豬就是梁文鋒。幻方工作人員的回復(fù)是:“員工捐款均是匿名,公司內(nèi)部也不知道小豬的真實(shí)身份。”
在工作范疇里,梁文鋒只做少數(shù)事。他不做多數(shù)初創(chuàng)公司 CEO 做的一些事,如融資。
2023 年,梁文鋒小范圍見過一些投資人。但據(jù)我們了解,他提出了一個(gè)不常規(guī)的要求:類似 OpenAI 與微軟的投資協(xié)議,梁文鋒希望投資方接受一個(gè)回報(bào)上限。這一輪見下來,沒有機(jī)構(gòu)投資 DeepSeek。
之后兩年,中國大模型融資洶涌,頻現(xiàn)數(shù)億美元大單輪,梁文鋒卻不再見投資人了,甚至不建立新的聯(lián)系。即使不在融資窗口,大部分創(chuàng)始人也不會(huì)拒絕認(rèn)識(shí)一下一線機(jī)構(gòu)合伙人,而梁文鋒拒絕了多數(shù)此類請(qǐng)求。
梁文鋒幾乎把所有時(shí)間投入到他認(rèn)為應(yīng)該聚焦的少數(shù)事上,做得細(xì)致、做到極致。
DeepSeek 此前成功的關(guān)鍵之一是 “力出一孔”,明確以語言模型為更高優(yōu)先級(jí),沒有做多模態(tài)生成等熱門方向。
在選定的主線上,梁文鋒會(huì) “hands on” 地深入細(xì)節(jié)。他從不同背景的團(tuán)隊(duì)成員身上學(xué)習(xí)算法、架構(gòu)、Infra、數(shù)據(jù)的知識(shí),會(huì)自己參與模型和產(chǎn)品的細(xì)節(jié)討論。
見過梁文鋒的不少人提到,他沒有 CEO 或所謂天才的 “氣場”,更像一個(gè)研究員,他和人談?wù)撟疃嗟氖蔷唧w技術(shù)問題。
綠洲資本創(chuàng)始合伙人張津劍曾在《那些活出來的人中》分享了一個(gè)小故事,他問自己投資的 MiniMax 創(chuàng)始人閆俊杰:“有比你更專注的人嗎?” 閆俊杰說有一次約一位沒見過的朋友吃飯,到早了,看到一位穿 T 恤的小哥,以為是助理。對(duì)方開始沒有自我介紹,問了閆俊杰很多技術(shù)問題。過了半小時(shí),閆俊杰說:“梁總什么時(shí)候來?” 對(duì)方說:“我就是梁文鋒”。
DeepSeek 組織:扁平、交叉分工、不加班
與梁文鋒的風(fēng)格相應(yīng),DeepSeek 的組織極其扁平、各環(huán)節(jié)交叉分工、謹(jǐn)慎擴(kuò)張規(guī)模、不加班。
創(chuàng)立幻方時(shí),梁文鋒有合伙人,而 DeepSeek 沒有二把手,尤其在研究團(tuán)隊(duì),只有梁文鋒和其他研究員兩個(gè)層級(jí)。梁文鋒做重大決定,承擔(dān)最多結(jié)果。
這部分研究團(tuán)隊(duì)現(xiàn)在約有 100 多人,它像一個(gè)大型實(shí)驗(yàn)室。主要在 2000 年前后出生的 DeepSeek 研究員們習(xí)慣稱 1985 年出生的梁文鋒為 “梁老板”。這個(gè)老板更接近導(dǎo)師:組織研發(fā)、協(xié)調(diào)資源,也做具體研究,在共同成果上署名為通訊作者。
梁文鋒本人參與最多的是基模架構(gòu)團(tuán)隊(duì),會(huì)與團(tuán)隊(duì)深入討論后確定每一代基模的架構(gòu)定版。這個(gè)團(tuán)隊(duì)有小幾十人,他們是預(yù)訓(xùn)練的主力。
與基模架構(gòu)密切相關(guān)的是 Infra 和數(shù)據(jù)團(tuán)隊(duì),各有小幾十人。Infra 團(tuán)隊(duì)在一些公司里更像完成算法需求的 “內(nèi)部乙方”, 而 DeepSeek 的 Infra 團(tuán)隊(duì)會(huì)在模型訓(xùn)練前的定版階段就參與討論、給出建議。
這幾個(gè)模塊間的緊密合作使 DeepSeek 的團(tuán)隊(duì)界限沒那么涇渭分明,形成了 “交叉分工”。這其實(shí)是最符合模型訓(xùn)練特點(diǎn)的協(xié)作形式,因?yàn)樵谀P蛯?shí)驗(yàn)和定版階段,就要考慮數(shù)據(jù)選擇和 Infra 實(shí)現(xiàn)。
梁文鋒是串起這些不同模塊的探測器和粘合劑,他會(huì)出席每一個(gè)團(tuán)隊(duì)各自的會(huì)議,了解全局進(jìn)度和卡點(diǎn)。DeepSeek 大部分團(tuán)隊(duì)的周會(huì)也向其它團(tuán)隊(duì)的人開放,可跨組參會(huì)。
深入細(xì)節(jié)的一號(hào)位風(fēng)格和自發(fā)形成的緊密協(xié)作都很難在大組織里實(shí)現(xiàn)。所以 DeepSeek 會(huì)很謹(jǐn)慎地?cái)U(kuò)大核心研發(fā)團(tuán)隊(duì)的規(guī)模。
在全球 AI 圈都非常特異的一點(diǎn)是,DeepSeek 不加班。他們不打卡、沒有明確的績效考核,平日多數(shù)成員會(huì)在 6 點(diǎn)~7 點(diǎn)左右離開公司。DeepSeek 給員工免費(fèi)提供一些下班后福利,如球類課程、運(yùn)動(dòng)場地報(bào)銷等。
梁文鋒認(rèn)為:一個(gè)人每天能高質(zhì)量工作的時(shí)間很難超過 6~8 小時(shí)。加班疲勞下的昏庸判斷反而會(huì)浪費(fèi)寶貴的算力資源,得不償失。
在人員構(gòu)成上,DeepSeek 此前幾乎不社招,以應(yīng)屆生和實(shí)習(xí)生留任為主。2025 年初,《晚點(diǎn)》曾梳理當(dāng)時(shí)參與過 DeepSeek 三代模型(LLM、V2、V3&R1)的 172 名研究者(包括實(shí)習(xí)生),并找到了其中 84 人的履歷:超 7 成的人是本科生和碩士生,超 7 成的人小于 30 歲。
在 V3 和 R1 之前,DeepSeek 是以大廠約 1/10 的人數(shù),約 1/2 的人均工作時(shí)間,以極高的專注和聚焦,躋身全球大模型第一梯隊(duì)。
但隨著觸達(dá)頂尖 AI 能力需要探索的方向越來越多,繼續(xù)保持這種組織規(guī)模、溝通方式和協(xié)作氛圍已越來越難。
過去 15 個(gè)月,DeepSeek 繼續(xù)做自己,而外部世界急劇變化
2025 年初 V3 和 R1 爆火后,DeepSeek 并沒有乘勝追擊放大招,而是沿著他們專注的方向繼續(xù)研發(fā),已經(jīng)公開的成果大致有三類:
一是效率優(yōu)化:極致壓榨 GPU 算力,提高單位算力能產(chǎn)出的智能。這包括 DeepSeek 在 2025 年初的開源周釋放的一整套訓(xùn)練與推理 Infra,涵蓋推理 kernel、通信庫、矩陣乘法庫和數(shù)據(jù)處理框架。(注:kernel 是在 GPU 上執(zhí)行最底層計(jì)算的代碼,用來實(shí)現(xiàn)矩陣乘法等核心運(yùn)算。)
還有對(duì) “注意力機(jī)制” 的持續(xù)改進(jìn):如 25 年初的 NSA(原生稀疏注意力)和后續(xù)的 DSA(動(dòng)態(tài)稀疏注意力)。加上更早時(shí) V2 中的 MLA(多頭潛在注意力),它們的共同目標(biāo),是在不大幅增加算力的前提下處理更長的上下文。
從 25 年 9 月底更新的 DeepSeek-V3.2 中還可以看到,DeepSeek 甚至把底層的算子庫從主流的 CUDA 和 Triton 語言換成了 TileLang。CUDA 是英偉達(dá)提供的最底層語言,Triton 由 OpenAI 開源,TileLang 則是北京大學(xué)楊智團(tuán)隊(duì)發(fā)起的開源項(xiàng)目。
二是模型架構(gòu)改進(jìn),如 26 年初發(fā)布的 mHC(流行約束超連接),旨在提升大規(guī)模訓(xùn)練中的穩(wěn)定性;和在模型之外構(gòu)建長期記憶的 Engram。外界普遍認(rèn)為,mHC 會(huì)被用到 V4 的訓(xùn)練中。
三是一些 “非主流” 探索,如把文本轉(zhuǎn)成圖片,再輸入給模型的 DeepSeek-OCR,這個(gè)思路是讓模型按更接近人類 “看文字” 的方式理解段落與層級(jí),提升對(duì)復(fù)雜文檔的理解力。
在 DeepSeek 內(nèi)部,還有更多進(jìn)行中的此類嘗試,包括持續(xù)學(xué)習(xí)、自主學(xué)習(xí)等。
梁文鋒還在 2025 年招募了一些神經(jīng)科學(xué)和腦科學(xué)背景的顧問,想探索更接近人腦的學(xué)習(xí)機(jī)制。
而同期,外部 AI 環(huán)境在 2025 年至今急劇變化,最受關(guān)注的競爭主線有兩條:
一是以 coding 能力為基礎(chǔ)的 Agentic 模型和應(yīng)用。這是 Anthropic 和 OpenAI 目前競爭最激烈的主戰(zhàn)場,形成了 Opus 4.6 vs GPT-5.4 兩個(gè)最新模型,和 Claude Code vs Codex 兩個(gè)產(chǎn)品的對(duì)陣。年初至今爆火的 OpenClaw 小龍蝦也是 Agentic 應(yīng)用的最新形態(tài)。
二是多模態(tài)生成,這個(gè)領(lǐng)域因 “魔法效果” 屢次出圈:2025 年春天的 OpenAI GPT-4o ,秋天的 Google NanoBanana,再到 2026 年春節(jié)前的字節(jié) Seedance 2.0。而視頻生成也與一個(gè)更前沿的方向有關(guān),即 “世界模型”。
DeepSeek 首先沒怎么投入多模態(tài)生成,因?yàn)榱何匿h認(rèn)為多模態(tài)生成不是智能的主線。
在 Agent 方向上,DeepSeek-V3.2 強(qiáng)化了 Agent 能力,但 DeepSeek 的整體迭代頻次低于 R1 之后一度深感焦慮其它小虎。
2025 年初至今,智譜、MiniMax、Kimi 分別已更新了 5 版、4 版和 3 版模型,針對(duì) Agent 或 coding 強(qiáng)化。
據(jù) OpenRouter 數(shù)據(jù),過去 30 天(2 月 24 日-3 月 26 日),通過 OpenRouter 調(diào)用的 OpenClaw 應(yīng)用的模型 token 消耗前 10 中,6 個(gè)模型來自中國,DeepSeek-V3.2 排在第 12。(注:OpenRouter 更反映個(gè)人和中小開發(fā)者的使用情況,只能作為整體 Token 消耗的參考。)
![]()
DeepSeek 的目標(biāo)不是最主流的,有人離開、有人留下
DeepSeek 的 “特立獨(dú)行”,和梁文鋒認(rèn)同的 AGI 目標(biāo)有關(guān),除了追求大模型的智能上限外,他認(rèn)為還有兩個(gè)很重要的工作:
一是基于國產(chǎn)生態(tài)來做大模型。
DeepSeek 會(huì)投入對(duì)國產(chǎn) GPU 的適配,以解決高性能 GPU 供給受限的現(xiàn)實(shí)。比如他們在去年 8 月更新 V3.1 后提及,DeepSeek 采用的 UE8M0 FP8——這是一種數(shù)據(jù)壓縮格式——“是針對(duì)下一代國產(chǎn)芯片設(shè)計(jì)”。前文提到的用國產(chǎn)開源的 TileLang 替代 Triton 也是這類工作,能在基礎(chǔ)層更有主動(dòng)權(quán)。
在與 AI 從業(yè)者交流時(shí),梁文鋒也曾提過這樣的假設(shè):“能不能用現(xiàn)存的一部分算力,就實(shí)現(xiàn)現(xiàn)在所有的智能?”
二是 “原創(chuàng)式創(chuàng)新”,做一些大廠或其它創(chuàng)業(yè)公司不會(huì)去試,不愿去試的方向。
比如 2024 年下半年,DeepSeek 就開始了 Janus 系列,嘗試統(tǒng)一多模態(tài)的理解和生成。DeepSeek 也做過 Prover 系列,探索形式化證明。還有 25 年的 OCR,以及內(nèi)部在繼續(xù)做的持續(xù)學(xué)習(xí)和仿生人腦的探索。
作為創(chuàng)始人,梁文鋒最在意的,不僅是模型效果本身,也包括追求效果的路上那些更本質(zhì)、原創(chuàng)的發(fā)現(xiàn)。
但這與外界現(xiàn)在對(duì) DeepSeek 的部分期待并不匹配:一些人希望 DeepSeek 每次出手都像 R1 那樣石破天驚,這有些強(qiáng)人所難,也不符合技術(shù)規(guī)律。
梁文鋒可以不在意外部期待,但他必須面對(duì)和處理內(nèi)部期待。
對(duì)更多年輕的研究員來說,做更多前沿研究,也需要承擔(dān)更多不確定性。更保險(xiǎn)的路,是持續(xù)參與業(yè)界最強(qiáng)模型,在那些被關(guān)注的技術(shù)報(bào)告上署名,以及能有豐富的 GPU 資源支撐實(shí)驗(yàn)和探索。
除了榮譽(yù)和影響力,外界對(duì) DeepSeek 成員的吸引力還有高額的財(cái)富承諾。
DeepSeek 的絕對(duì)薪資不低,但外面給的更高。一些獵頭告訴我們,競爭對(duì)手開出了 “難以拒絕的數(shù)字”,“翻 2 到 3 倍問題不大”,“其他公司開出 8 位數(shù)(算股票或期權(quán))總包”。
新變化還有,MiniMax 和智譜上市、股價(jià)高漲,階躍、Kimi 的 IPO 也提上日程。這也讓一些 DeepSeek 成員對(duì)手中那份沒有明確標(biāo)價(jià)的期權(quán)產(chǎn)生更多疑問。
面對(duì)巨額邀約,更多人選擇留下。他們認(rèn)可梁文鋒追求 AGI 的方式,愿意做并非競爭驅(qū)動(dòng)的探索;也習(xí)慣了 DeepSeek 相對(duì)寬松、從容的研究氛圍。
近期外界的一些傳聞并不準(zhǔn)確,DeepSeek 團(tuán)隊(duì)雖有變化,但并沒有成組流失。
“留下的人多少還是有些理想的。” 有接近 DeepSeek 的人士說,梁文鋒覺得在提升模型效率和性能的主線外,需要做一些當(dāng)下回報(bào)不明確的方向,因?yàn)?“國外那些算力更多的公司,如 Google、OpenAI,內(nèi)部肯定在試各種方向”。
至今,DeepSeek 相對(duì)小的團(tuán)隊(duì)和成立以來的透明、扁平的氛圍,讓成員之間依然可以自然分工:有時(shí)開始一個(gè)新方向,就是因?yàn)橛腥鍌€(gè)人都覺得一個(gè) idea 不錯(cuò),然后就一起做了。
這與梁文鋒 2024 年接受《暗涌》采訪時(shí)的描述相呼應(yīng):“我們一般不前置分工”,“每個(gè)人有自己獨(dú)特的成長經(jīng)歷,都是自帶想法的,不需要 push 他……不過當(dāng)一個(gè) idea 顯示出潛力,我們也會(huì)自上而下地去調(diào)配資源。”
“DeepSeek 是一個(gè)真心想做研究的人,在國內(nèi),甚至是全球能找到的最好的地方。” 有接近 DeepSeek 的人士說。
改變世界,也被世界改變
對(duì) AGI 目標(biāo)的獨(dú)特認(rèn)知和拆解,是 DeepSeek 的可貴之處,也是它如今面臨內(nèi)部張力的原因。因?yàn)榱何匿h看重的生態(tài)建設(shè)和原創(chuàng)探索,與業(yè)界普遍把 “保持最強(qiáng)” 視為第一優(yōu)先級(jí),是重合但并非完全一致的目標(biāo)。
而且大模型發(fā)展到今天,“強(qiáng)” 和 “原創(chuàng)性” 的標(biāo)準(zhǔn)越來越模糊而主觀。
Benchmark 分?jǐn)?shù)已不能完全衡量模型水平。尤其進(jìn)入 Agentic 模型競爭后,產(chǎn)品觸手及其帶來的長尾使用案例與多樣化數(shù)據(jù)變得更重要了,這恰恰是專注于模型研發(fā)的 DeepSeek 此前沒有太多投入的地方。
即將發(fā)布的 V4,大概率仍是開源最強(qiáng)模型,但很難是碾壓級(jí)的強(qiáng)。因?yàn)楝F(xiàn)在不同場景的不同開發(fā)者和用戶對(duì) “強(qiáng)” 的標(biāo)準(zhǔn)和體感已越來越多元。
什么是原創(chuàng)的、有價(jià)值的新探索,則向來眾說紛紜,取決于不同研究者的經(jīng)驗(yàn)、判斷和直覺,所謂 “技術(shù)品味”。
驗(yàn)證品味的方式是實(shí)驗(yàn),而實(shí)驗(yàn)的數(shù)量和規(guī)模又受限于 GPU 資源。相對(duì)于同行,DeepSeek 并沒有那么多算力。
最后,不管是大模型的生態(tài)基礎(chǔ),還是在追求模型效果的過程中,探索其它團(tuán)隊(duì)不一定會(huì)試的方向,這些梁文鋒看重的工作的回報(bào)都極不明確。
前沿研究本該承擔(dān)這種不確定性,但它與算力資源有限的事實(shí),與外界對(duì) DeepSeek 能持續(xù)驚艷甚至 “碾壓” 的期待不完全匹配。
梁文鋒意識(shí)到了要改變,近期他開始想辦法給公司估值,給團(tuán)隊(duì)成員更多確定的預(yù)期。
DeepSeek 也將更多投入產(chǎn)品。我們梳理了 DeepSeek 一位 HR 在社交媒體上從 2024 年 12 月至今發(fā)布的所有招聘啟示,在今年 3 月中旬的最新招聘中,DeepSeek 第一次提及其它具體產(chǎn)品的名稱,要招募 Agent 方向 “模型策略產(chǎn)品經(jīng)理”:
持續(xù)跟蹤行業(yè)前沿,熟悉并深度使用過 Claude Code、OpenClaw、Manus 等知名 agent……
接下來,肯定會(huì)看到 DeepSeek 在 Agent 產(chǎn)品上的更多動(dòng)作。
2025 年初,DeepSeek 以慷慨的開源精神和以小博大的奇跡,震撼了中國和世界,也改變了世界:讓一批同行投入更多精力到模型技術(shù)本身,啟發(fā)了 Kimi K2 和 K2-thinking 等后續(xù)模型,也直接催生了一些新團(tuán)隊(duì),如陳天橋出資支持的 MiroMind。
奇跡之所以是奇跡,就是因?yàn)樗怀0l(fā)生,是小概率事件。在中國這個(gè)崇尚競爭和結(jié)果說話的環(huán)境里,敢于追求獨(dú)特目標(biāo)的 DeepSeek 的存在本身,是一個(gè)令人驚喜的小概率事件。
接觸梁文鋒的人評(píng)價(jià):“他是一個(gè)特別抗噪音的人。”
2025 年 R1 爆火后,梁文鋒顯示了對(duì)追捧的淡然。而現(xiàn)在,他面臨另一種情形的考驗(yàn):在外部競爭加劇時(shí),分辨噪音與信號(hào),堅(jiān)持該堅(jiān)持的,改變要改變的。
“低頭做事的人也許不一定能在浮躁的市場洪流里笑到最后,但是只有更多 DeepSeek 這樣的公司出現(xiàn),中國科技才有從 ‘復(fù)刻’ 到領(lǐng)跑的可能。” 一位從業(yè)者說。
這是屬于梁文鋒和 DeepSeek 的工作。而曾被這家公司震動(dòng)過的更多人,能做的很簡單:卸下爽文敘事,用更多平常心去看待一家公司和技術(shù)創(chuàng)新。
題圖來源:14 Peaks: Nothing Is Impossible
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.