免責聲明:本網發布此文章,旨在為讀者提供更多信息資訊。文章觀點僅供參考,所涉及內容不構成投資、消費建議。為提高文章流暢性,文章可能存在故事編譯,讀者請自行辯解!如事實如有疑問,請與有關方核實。
東方AI神秘力量登場
2025年初,DeepSeek突然火了。
美國開發者在論壇里刷屏求邀請碼,蘋果應用商店下載量三天就超過了ChatGPT。
《黑神話:悟空》制作人馮驥發朋友圈說這是“國運級科技成果”,連硅谷的工程師都在猜背后是誰。
誰也想不到,這個讓OpenAI連夜開會的AI,不是出自谷歌或Meta,而是曾靠炒股賺了千億的私募大佬梁文鋒搞出來的。
![]()
出租屋走出千億量化天王
85后湛江小伙梁文鋒,數學拔尖的浙大高材生,2008年放著大廠offer不要,揣著8萬塊跑到成都出租屋搞量化投資。
別人炒股靠感覺,他靠數學模型算K線規律,硬是把幾萬塊滾到5個億。
2015年創辦幻方量化,2021年管理規模就破了千億,成國內量化私募“四大天王”之一。
2019年還砸2億建了AI超算“螢火一號”,悄悄給AI布局埋下伏筆。
![]()
轉型AI顛覆炒股邏輯
2019年他悄悄砸了2億建AI超算“螢火一號”,當時沒人知道這是在為AI鋪路。
2023年突然宣布成立DeepSeek,把量化那套思維直接搬了過來:用模型抓語言規律就像抓市場規律,像摳炒股成本一樣砍AI成本。
別人拼參數堆算力,他偏要搞架構創新,說“參數不是萬能的,規律才是”,把在股市里練出的“找規律、控成本”本事全用在了AI上。
![]()
AI界拼多多成本砍十分之一
梁文鋒把量化里“精準計算每一分成本”的本事用到了AI上。
DeepSeek搞出的“混合專家架構(MoE)”,就像公司只在需要時請對口專家干活,平時不用養閑人——模型里藏著8個“專家模塊”,輸入不同問題只激活2個,算力浪費直接砍到八分之一。
就靠這招,DeepSeek-V3訓練成本壓到557萬美元,僅是GPT-4的二十分之一;API價格更狠,每百萬token只要1塊錢,是GPT-4的百分之一。
![]()
最離譜的是性能,2025年1月發布的R1模型,推理能力跟OpenAI的o1打得有來有回,成本卻只有對方十分之一。
硅谷工程師扒代碼時發現,他們連訓練時的顯卡利用率都算到小數點后兩位,網友笑稱這哪是搞AI,分明是“用炒股的摳門勁兒干科技”,活脫脫成了“AI界拼多多”。
![]()
開源讓貴族技術變白菜價
不光把模型代碼、訓練細節全開源,還搞出手機能跑的mini版——以前只有大廠砸幾百萬才能玩的AI技術,現在個人開發者下載個壓縮包,用筆記本就能調參。
《黑神話:悟空》團隊直接拿DeepSeek跑游戲劇情生成,馮驥在行業會上說這是“知識平權”,把AI從“技術貴族”的玻璃柜里拽出來,變成程序員桌面上的“白菜價工具”。
連國外大學實驗室都在轉發他們的開源文檔,說“第一次不用求著大廠要API額度了”。
![]()
中國年輕人的團隊密碼
DeepSeek的139人團隊里,沒有一個海外AI大佬,全是90后、95后應屆生。
梁文鋒給的工資比大廠高30%,公司里沒KPI沒層級,工位隨便坐,開會不用舉手。
他自己每天泡在代碼里,跟應屆生一起讀論文改模型,說“經驗是包袱,創新得靠沒被框住的年輕人”。
這群沒出過國的中國年輕人,用國產算力跑模型,靠本土數學人才優化架構,硬是把技術做到了全球頂尖,打破了“中國AI只會模仿”的老偏見。
![]()
中國科技的別樣未來
梁文鋒現在身家330億,DeepSeek估值早破千億,他用這套打法證明:中國團隊不用跟著歐美砸錢追參數,靠數學挖規律、成本控差異、開源推平權,照樣能站到全球AI第一梯隊。
以前AI是大廠專利,現在個人開發者用手機跑mini版就能調參,國內大廠不得不跟著降價,AI技術門檻一下被拉低了。
他說要“讓AI像水電一樣便宜”,現在看來,這不是口號——把技術貴族拉下神壇,靠本土算力和中國年輕人,真的能讓科技普惠照進現實。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.