網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek模型免費，底座也免費嗎？

2025-04-13 11:12:04　來源: 親愛的數(shù)據(jù)

北京舉報

分享至

圖文原創(chuàng)：親愛的數(shù)據(jù)

開源好，真是好，

DeepSeek現(xiàn)在在各個行業(yè)落地（做推理），

我們直奔重點，

推理（Inference）的時候，

下面的底座重要嗎？

底座是一整套系統(tǒng)軟件，是幕后英雄，

我們距離這個底座最近的那次是，

DeepSeek開源七天大放送。

開源出來一堆英文名，

好多人一看不知道具體干啥，

這些，都是“底座”的核心組件。

DeepEP、3FS、DualPipe……

這不是炫技，是一個現(xiàn)代AI云，

所需的基礎設施能力棧。

大模型要跑得好，

光有算力（私有化部署，公有云）還不夠，

要能“跑得快，還“吞吐量大”，

這就靠“底座”了。

這玩意有多重要呢？

如果不開源，

所有的云廠商都關(guān)起門，自己建設自己的。

為啥呀？核心競爭力。

反正云廠商就兩條路：

套著自己馬車（模型）賺錢，

套著別人馬車（開源模型）賺錢，

無論哪條路，都要推理（inference）系統(tǒng)好。

說到DeepSeek開源，還有個“內(nèi)部笑話”

一開始，沒說會把底座里的哪幾個重要組件開源，

于是，有實力的云廠商，

注意，還得是有實力，

立馬埋頭苦干。

那些沒實力的廠商，只能干瞪眼。

結(jié)果，抓馬了，那些有實力的團隊一頓忙活，

白受累了，DeepSeek開源了。

這次輪到?jīng)]實力的廠商笑彎腰了，

直接撿便宜了。

所有人全部回到起點。

其實勤奮的研發(fā)同學不白做，

在認知上肯定有提高，

說到這，無論誰想把DeepSeek玩好，

底座就非常重要了，

說俗一點，只要這種底層軟件厲害，

云計算的服務就可以賣上價了。

因為這個軟件可以和模型，

和算力一起賣，利潤高，很賺錢。

這種軟件是推理（Inference）的基礎軟件。

DeepSeek之后，

大廠把重點工作進一步向模型的推理能力傾斜，

如何支持推理那就太重要了。

這種系統(tǒng)軟件主要有兩個重點，

穩(wěn)定和容錯。

談到賺錢，這部分服務成本有兩部分構(gòu)成：

第一基礎軟件人力成本，

沒錯，就是一幫技術(shù)扎實，頭腦聰明的人，

沒日沒夜加班干出來的，

于是，阿里字節(jié)百度的辦公大樓里，

凌晨的燈光，

少不了是基礎軟件團隊在熬夜加班。

第二，英偉達芯片的使用成本，

也粗說就是機器成本。

這是成本是固定的，

沒有什么讓利和打折的空間。

當然，我們拋開政府部門補貼，

別人家老舊機型而省下來的錢。

如果你是國產(chǎn)芯片，那就另說。

有位大神舉了個例子。

如果有個電廠燒錢免費讓你用他家的電，

為了價格優(yōu)惠，電廠必然虧本，客戶來了不少。

過一段時間，你就對這家電廠有忠誠度了么？

不，因為電是標品。

AI基礎軟件也是標品，

A云廠商有，B云廠商有，C云廠商也有。

所以，第一步，先成為標品，

不要虧本的標品，

在標品的市場上，因為技術(shù)差，

成本就會高，利潤就少了。

下一步，拉著模型賺錢。

閉源模型厲害，開源就是落后生產(chǎn)力，

開源模型厲害，閉源就是落后生產(chǎn)力，

落不落后，不看性格，不看基因，

只看生產(chǎn)力先進與否。

閉源的出發(fā)點就是想把底層算力，

中層模型綁在一起賣。

出發(fā)點沒錯，任何一個理性經(jīng)濟主體都這么思考，

難點在于競爭太激烈，俗稱，太卷了。

開源項目（如Llama，DeepSeek），

不斷挑戰(zhàn)閉源商業(yè)模型。

一旦開源社區(qū)拿下了性能和成本的制高點，

閉源廠商壓力巨大。

都這樣了，就積極擁抱吧。

那如何賺錢呢？

這是云廠商要思考的問題，

我的觀察是，

云廠商想通過通用模型本身筑就壁壘幾乎不可能。

但是，當下，

可以筑就“模型+底座軟件”的壁壘。

這也是DeepSeek的打法，

模型本身開源了，不是壁壘，

加上底座就有壁壘了。

因為底座是為模型設計的。

如果模型自己的，底座軟件自己的，

連芯片也是自己的，

那真的就是太好了，

譚老師我已經(jīng)在你辦公室門口了，開門啊。

這類廠商想把DeepSeek推理的吞吐做大，好難。

模型即服務明顯利潤更高，

即便是這個模型不是你的。

這件事的早期，考驗云廠商什么呢？

考驗造出一套適配DeepSeek的底座軟件的能力。

我都不說這套系統(tǒng)有多好，

你得先有。

后面，大家就都有了，而且誰也不會差。

還有一個問題，以前的底座不能繼續(xù)用嗎？

DeepSeek和之前以Llama系列，

通義千問72B為代表的模型架構(gòu)不同，

怎么不同呢？打個并不貼切的比喻，

一個是直升飛機，一個是固定翼飛機。

你之前不是有停機坪能支持直升飛機起降嗎？

能支持固定翼飛機起降嗎？

輕輕柔柔一句話，

能支持，就是要再鋪一條跑道。

只有真正干“底座”的人，

才知道這句話的份量有多重。

那些跑在英偉達GPU上的云廠商基礎軟件團隊，

無奈背過臉輕輕擦去臉上的淚水，

那些非英偉達AI芯片吞吐量想做大就更累了。

因為DeepSeek是在英偉達上訓練出來的模型，

如果你也把模型部署在英偉達GPU上，

大可以抄作業(yè)，

相反，就沒有作業(yè)可抄。

不過，好消息是，非英偉達AI芯片才有壁壘。

大家都知道，

固定翼飛機要一定長度的跑道起降。

那些之前都是玩直升機的云廠商，

相當于只有停機坪，沒有跑道，

需要提供DeepSeek的API接口給客戶用，

就得從頭開始鋪跑道。

那么啥也憋說了，趕緊造吧。

在這個值得紀念的，2025年的蛇年春節(jié)，

所有的云廠商AI基礎軟件團隊都在瘋狂加班，

原因就是這個。

而且，這個破班到現(xiàn)在，

到4月第一周了，都沒有加完。

一位在百度干這個活的小哥哥發(fā)的朋友圈說，

史上最夸張的加班。

為什么呢？因為難，因為還在猛干提高。

頭部云廠商的AI基礎設施團隊，都是一流團隊。

弄了這么久只有一個原因，就是難。

美國硅谷AI芯片創(chuàng)業(yè)團隊的核心研發(fā)給我說，

他要做一個輕版本，盡快給客戶用，

還要再做一套重版本，把每一個細節(jié)都設計好。

為什么要這樣呢？

他告訴我的原話是：

“難度陡然提升的原因是，

DeepSeek模型的思路和其它開源模型不一樣。

需要打破以前的慣例，

為他量身定制一套部署。

若還是Llama老路倒簡單了。”

要知道，推理速度快和打滿是兩個技術(shù)路線，

勛章屬于“能在吞吐量上打敗所有人的英雄”。

云廠商的基礎軟件團隊不是吃白飯的，

這個時期，要有一套基礎軟件，能夠媲美，

甚至超過DeepSeek原裝那套。

只有這樣才能賺錢。

如果價格比DeepSeek低，

你的成本還比它高，那就慘了。

這個時候的性價比，就和技術(shù)大大的相關(guān)了，

這里是云廠商AI的正面戰(zhàn)場，

請享受這無可回避的痛苦。

說個有意思的，

老讀者都知道譚老師很喜歡和CTO對暗號。

如果你想顯示你很懂DeepSeek，

那有一個數(shù)據(jù)必須脫口而出，

說實話，譚老師我見到大神CTO的時候，

報出的暗號就是14.8K。

只要能報出這個數(shù)字，那就是自己人了。

要不知道這個數(shù)字，

那咱們就不再是朋友了。

技術(shù)濃度最高的部分就要來了。

14.8K是什么呢？是一個標桿速度，

輸出吞吐約14.8ktokens/s，

也就是大模型一秒鐘吐出大約吐出15萬個詞元。

為什么DeepSeek做到了？

這就說明它在基礎軟件（PD分離調(diào)度、批量吞吐調(diào)優(yōu)、算力利用率、KV Cache管理等）多個方面都非常頂，非常頂。

只追趕14.8K這一個指標就夠了嗎？當然不夠。

因為不同客戶，不同場景的要求不同，

要做定制化調(diào)整，

比如，對話客服機器人，

用戶只說了幾句話，

然后模型要連續(xù)生成很多回答的內(nèi)容，

生成工作量大，速度不能慢；

而搜索增強生成（RAG）或如法律合同分析則不然，常常是輸入量大。

技術(shù)語是Prefill和Decode分離，俗稱PD分離，

速度是分開優(yōu)化的，

當然，錢也得分開算的。

Prefill的成本是多少，Decode的成本又是多少。

換句話說，只要做到這個數(shù)，

利潤率基本接近DeepSeek原廠的了。

那天去海淀區(qū)上地奎科大廈喝奶茶，

百度智能云的技術(shù)小哥哥和我說，

他們已經(jīng)很接近這個數(shù)了，

為了證明這件事的真實性，

我和他繼續(xù)聊細節(jié)，我們討論了賺錢的套路：

DeepSeek R1標價是每一百萬個詞元：

輸入4塊，輸出16塊；

他認為DeepSeek R1成本是輸入三毛，

輸出1塊7毛。

很顯然，DeepSeek R1很賺錢。

假設每個廠商都有數(shù)量和型號相同的芯片，

誰的系統(tǒng)的總吞吐量最高，誰就最賺錢。

前段時間，

美國硅谷那邊的技術(shù)小哥哥和我聊了聊。

技術(shù)方面，對比DeepSeek和一眾友商的吞吐，DeepSeek高了10倍。

怎么做到的？

第一，改動自注意力和FFN計算順序，

內(nèi)存瓶頸轉(zhuǎn)為通信瓶頸，節(jié)省時間2倍。

第二，KVCache 占比30%，batchsize可以變大，提升2倍，

第三，TP轉(zhuǎn)EP，提升2.5倍。“

這就是10倍的由來。

當使用DeepSeek的需求激增，

好的AI全鏈路軟件是云廠商AI業(yè)務的生命線。

另外，吞吐量是各家都一直在努力提高的，

屬于動態(tài)數(shù)據(jù)，

咱們誰也別刻舟求劍。

云廠商如果徹底跟不上DeepSeek，

自家的AI全鏈路軟件就等著落后，

開源大模型默認不適配任何一家云廠商的底層軟硬件或優(yōu)化路徑，苦干是唯一的選擇。

這也是為什么你會看到，

阿里、騰訊、字節(jié)、百度，

都在投入專屬系統(tǒng)，

做的其實和 DeepSeek 非常類似。

推理基礎設施必須自建嗎？或者能“白嫖”嗎？

可以這樣說：

如果你是云廠商，不搭一套推理基礎設施，

就像搞電商不建物流系統(tǒng)。

模型可以不是自己原創(chuàng)的，

只要別人好就上別人的。

云廠商本質(zhì)是水電煤氣基礎設施提供商，

只是模型如果是自己的，整套賣那就更賺錢，

而且模型是打磨底座的利器，

沒有好模型，云廠商出去賣底座，

都會被人質(zhì)疑“零經(jīng)驗”。

但要想用開源模型“量大，穩(wěn)定且掙錢”，

這套底座，少得了嗎？

（完）

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

美方已救出被擊落F-15E戰(zhàn)機上的第二名飛行員

央視新聞客戶端 2026-04-05 12:17:39
81016 跟貼 81016
媒體：4億美元橋梁被炸F-15墜毀沖突代價已遠超預估

中國新聞周刊 2026-04-05 18:06:30
7945 跟貼 7945

霍爾木茲海峽七天通航量創(chuàng)戰(zhàn)后之最首艘法國船只穿行

財聯(lián)社 2026-04-05 07:58:06
9398 跟貼 9398

小區(qū)樓棟加裝電梯只到1個樓層！這家住戶有實力？真相出人意料，網(wǎng)友：是個省錢思路

重慶晨報 2026-04-05 08:10:00
55 跟貼 55
珠海：廿年“電雞”禁令可否適時“松綁”？

中國能源網(wǎng) 2026-04-05 10:12:05
154 跟貼 154

重慶銅梁龍繼續(xù)不敗！客場1：0擊敗浙江綠城，李鎮(zhèn)全遭惡意犯規(guī)

上游新聞 2026-04-05 18:27:09
73 跟貼 73

毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2307 跟貼 2307
張雪深夜發(fā)視頻回應“一個子兒都沒有”言論：當時說實話想裝一下……政府只需要把舞臺搭好就很棒了

都市快報橙柿互動 2026-04-05 09:20:56
10193 跟貼 10193

確定了！江蘇又有新假期！

泰州微視聽 2026-04-05 19:41:00
56 跟貼 56
徐州“公廁版瑞幸”火出圈，景區(qū)工作人員回應：曾是游客服務點而非公廁

現(xiàn)代快報 2026-04-04 15:00:11
1209 跟貼 1209
知名連鎖餐飲門口宣傳板寫“3元自助早餐”，兩人買單45元被告知“僅粥飲自助”

新聞晨報隨申Hi 2026-04-02 18:36:05
934 跟貼 934
扎哈羅娃：俄羅斯目前在三條戰(zhàn)線上同時作戰(zhàn)

環(huán)球網(wǎng)資訊 2026-04-05 11:48:11
898 跟貼 898
男子挪吧臺碰倒酒壇損失120斤白酒愣住：想扶扶不住了

星視頻 2026-04-05 13:30:00
162 跟貼 162
郴州小伙清明爬多座山祭祀16位先祖，花了一天時間：根在這里，祈求祖先保佑

瀟湘晨報 2026-04-05 19:55:19
65 跟貼 65
從航母到繞月飛船：美國今年為何總栽在馬桶上

國是直通車 2026-04-05 16:26:05
231 跟貼 231
歷史課被“棄選”引熱議，怎么看？

上觀新聞 2026-04-05 06:53:04
200 跟貼 200
沒了“手打”，今麥郎還有“1桶半”“1袋半”“1.5倍”

中國能源網(wǎng) 2026-04-05 10:12:05
177 跟貼 177
趙心童闖入斯諾克巡回錦標賽決賽

環(huán)球網(wǎng)資訊 2026-04-05 07:55:53
142 跟貼 142
賞花正當時全國踏青適宜度地圖出爐

大象新聞 2026-04-04 12:48:08
185 跟貼 185
國內(nèi)燃油附加費調(diào)整 800公里以上收120元

界面新聞 2026-04-05 07:54:48
404 跟貼 404
阿森納1-2南安普頓無緣足總杯四強

上游新聞 2026-04-05 08:33:27
95 跟貼 95
重慶廣陽島飛行器墜落致2傷后續(xù)，受傷小女孩狀態(tài)堪憂

九方魚論 2026-04-06 02:53:01
0 跟貼 0
河南網(wǎng)紅阿陽陪朋友半夜結(jié)婚出狀況，下雨出租屋都進水了

九方魚論 2026-04-06 02:14:50
0 跟貼 0

盧比奧下令驅(qū)逐蘇萊曼尼侄女全家，“應以歐洲為戒”

移光幻影

2026-04-05 12:04:48

厲害！美軍深入伊朗境內(nèi)300多公里，強行著陸搶出第2名飛行員

Ck的蜜糖

2026-04-06 02:38:49

羅永浩為什么罵趙曉卉？從“正能量天使”與“流量之王”的并存

歪歌社團

2026-04-05 18:22:36

美伊沖突，已經(jīng)出現(xiàn)了3個贏家，10個輸家，都是誰？

七號說三國

2026-03-25 21:11:29

張雪深夜回應“一個子兒都沒有”言論

第一財經(jīng)資訊

2026-04-05 13:47:04

不止是輸球：山東泰山連敗根源，派系暗戰(zhàn)與體系崩塌的雙向絞殺

中場陰謀家

2026-04-06 00:15:57

超級巨大失誤！薛慶浩黃油手送禮，基萊斯門線補射，馬鎮(zhèn)機會來了

奧拜爾

2026-04-05 21:02:55

地球?qū)⒃?026年8月12日“失重7秒”死4000萬人？謠言！！！

大道微言

2026-04-03 12:22:13

FBI點名3類中國App：1條權(quán)限能扒光你通訊錄

我是一個粉刷匠2

2026-04-03 22:29:41

超大單！英偉達220萬張、華為81.2萬張、阿里26.5萬張

最通信

2026-04-05 20:57:07

國家觸發(fā)一級戰(zhàn)備時，普通人千萬要牢記這3條！保命切記別去搶購

健身狂人

2026-04-05 12:39:10

前英超球星納斯里逃稅翻車！一年212次巴黎外賣出賣了他

仰臥撐FTUer

2026-04-05 13:00:06

廣西高考扁擔女孩劉燕最后歸宿塵埃落定——廣西科技師范學院

手工制作阿愛

2026-04-05 12:52:12

山西一小吃店3人死亡，店主夫婦和小姨子凌晨加工“碗禿”時遇難

青梅侃史啊

2026-04-05 16:44:33

熱搜第2！郭艾倫出事了，被騙近千萬，2年白干，趙探長說得很透徹

萌蘭聊個球

2026-04-05 21:52:07

遼寧106-64大勝四川球員評價：8人優(yōu)秀，3人及格，鄢手騏崩盤

籃球資訊達人

2026-04-05 21:47:24

浙江溫州一住戶窗玻璃被“白鳳凰”白鷴撞破，房主：它在室內(nèi)留下糞便后飛走了

臺州交通廣播

2026-04-05 21:10:16

美元兌人民幣將貶值到1美元換5.5元人民幣，或許只需要5到10年？

丁丁鯉史紀

2026-04-03 11:50:43

好消息、壞消息與真相

老頭和你隨便聊聊

2026-03-30 12:57:42

復活節(jié)最暖場面！查爾斯、威廉凱特證明夏洛特公主的家庭地位

夢在深巷qw

2026-04-05 23:44:10

親愛的數(shù)據(jù)

《我看見了風暴：人工智能基建革命》一書作者

693文章數(shù) 219913關(guān)注度

往期回顧全部

科技要聞

花200薅5千算力，Claude冷血斷供“龍蝦”

頭條要聞

伊朗官員提開放霍爾木茲海峽條件

頭條要聞

伊朗官員提開放霍爾木茲海峽條件

體育要聞

CBA最老球員，身價7500萬美元

娛樂要聞

王燦兮否認婆媳不和曬與杜淳媽合影

財經(jīng)要聞

誰造出了優(yōu)思益這頭“怪物”？

汽車要聞

家用SUV沒駕駛樂趣?極氪8X第一個不同意

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

時尚

教育

旅游

公開課

本地新聞

跟著歌聲游安徽，聽古村回響

伊姐清明熱推：電視劇《暴鋒雨》；電影《我，許可》......

教育要聞

高考地理中的束水攻沙

旅游要聞

文明旅游｜清明出游請注意！莫讓這些不文明行為煞風景！

公開課

手機 / 數(shù)碼

房產(chǎn) / 家居

DeepSeek模型免費，底座也免費嗎？

花200薅5千算力，Claude冷血斷供“龍蝦”

伊朗官員提開放霍爾木茲海峽條件

伊朗官員提開放霍爾木茲海峽條件

CBA最老球員，身價7500萬美元

王燦兮否認婆媳不和 曬與杜淳媽合影

誰造出了優(yōu)思益這頭“怪物”？

家用SUV沒駕駛樂趣?極氪8X第一個不同意

態(tài)度原創(chuàng)

跟著歌聲游安徽，聽古村回響

伊姐清明熱推：電視劇《暴鋒雨》；電影《我，許可》......

高考地理中的束水攻沙

文明旅游｜清明出游請注意！莫讓這些不文明行為煞風景！

王燦兮否認婆媳不和曬與杜淳媽合影