Deepseek-V4預(yù)覽版本發(fā)布,與華為昇騰芯片深度適配燃爆全網(wǎng),黃仁勛擔心的事情終歸是發(fā)生了。
Deepseek-V4預(yù)覽版的模型能力,并不是全球最強的,在開源模型中屬于領(lǐng)跑者,但是仍落后閉源模型GPT-5.4和Gemini-3.1-Pro。但是這不重要,因為這個版本的價值不是為了證明Deepseek的模型有多牛,而是告訴這個世界:中國已經(jīng)有能力在AI領(lǐng)域構(gòu)建一個中國標準下的新生態(tài),從現(xiàn)在開始我們要建自己的草原了,放牛牧馬任由我們馳騁!
我們從三個角度出發(fā),盡量用大白話給大家講明白,DeepSeekV4到底是如何構(gòu)建了大模型的中國生態(tài),分別是:芯片適配、開源基礎(chǔ)設(shè)施、壓低算力成本。
1.芯片適配:模型層和芯片層實現(xiàn)完全同步
DeepSeekV4版本與華為昇騰實現(xiàn)了深度協(xié)同。V4是大模型,昇騰是芯片,模型的算力都來自芯片,但是模型和芯片想要配合得好并不容易。深度協(xié)同的意思是:DeepSeek-V4可以毫無障礙的跑在昇騰芯片上。
以前大模型出新版本通常是直接適配英偉達的卡,然后再等一段時間出個“打補丁”的版本適配國產(chǎn)卡;但是這一次不一樣,從最初構(gòu)建模型的時候,DS就充分考慮并利用了昇騰芯片的硬件特性,你會在新聞中聽到——“原生級優(yōu)化”、 “深度適配”——這樣的詞來形容這場合作有多么緊密。
這是什么意思:
你可以把大模型想象成一個頂級賽車手,芯片想象成賽車。一個賽車手當然可以開不同的車,但是總有車開的順手,有的開的不順手。現(xiàn)在是從準備比賽的第一天,就根據(jù)賽車手身高、體重、駕駛習(xí)慣來量身定做賽車,同時讓賽車手深度理解這臺車的優(yōu)勢和劣勢,這樣模型和芯片就能無障礙配合,這就是 “原生級優(yōu)化”。
有了車之后,就讓賽車手在不同的跑道上測試各種極限狀態(tài),發(fā)現(xiàn)問題,解決問題,把狀態(tài)調(diào)整到最佳,這就是“深度適配”。
注意,DeepSeek這種深度協(xié)同不僅局限于華為的昇騰卡,今天寒武紀在V4發(fā)布后的第一時間就完成了Day 0適配,這意味著DeepSeek模型的設(shè)計階段已經(jīng)把寒武紀的硬件特性考慮進去了。中國AI的模型層和芯片層,第一次實現(xiàn)了“完全同步”。
![]()
芯片適配是生態(tài)中關(guān)鍵的部分,但不是全部,DeepSeek考慮的要比這個長遠。DeepSeek的戰(zhàn)略已經(jīng)從“開源模型”轉(zhuǎn)向了“開源AI基礎(chǔ)設(shè)施”, 目的是打破當前全球?qū)τミ_CUDA生態(tài)的依賴
2.開源基礎(chǔ)設(shè)施:建中國人自己的標準
DeepSeek從2025年2月啟動 “開源周”開始,明確轉(zhuǎn)向開源系統(tǒng)級基礎(chǔ)設(shè)施,當前的V4版本也進一步強化了這個路徑。
從開源模型走向“開源基礎(chǔ)設(shè)施”是什么意思?
如果,閉源模型是一道做好的菜,那么開源模型就把配菜單子給你了,但是真正做出這道菜只看這個不夠用,你得知道火候、配料、工具等等。否則就會出現(xiàn)換口鍋(芯片)炒出來的菜就不是一個味道了。如果我把做菜的全過程都告訴你,你就知道換口鍋(芯片)之后,要把火開大,才能保證味道不變。
黃仁勛無數(shù)次表達過,英偉達最核心的競爭力不是芯片,而是CUDA生態(tài),CUDA生態(tài)就是一套“底層基建”就包含了AI模型訓(xùn)練中所需要的工具、系統(tǒng)、語言。如果你只是開源了模型的權(quán)重,那么大家做模型的時候,都還要綁定英偉達的這口鍋。但是如果你開放了生態(tài),大家就可以自己做排列組合,用自己家的鍋炒自家的菜了。
所以,“開源基礎(chǔ)設(shè)施”的核心,就是通過分享最底層的生產(chǎn)工具,來吸引更多人加入自己的技術(shù)體系,從而建立一個更長遠、更穩(wěn)固的競爭優(yōu)勢,建立中國自己的 AI 標準。
當然,無論是標準建立,還是生態(tài)遷移,推進起來都是困難重重的。沒有天大的好處,我為什么要費這個功夫呢?絕妙的地方來了,DeepSeek-V4版本給大家展示了一個:好用又便宜的國產(chǎn)算力方案。
3.成本優(yōu)勢:把算力的價格打下來
![]()
V4版本發(fā)布后,開發(fā)者們最興奮的不是模型有哪些能力上的優(yōu)化,而是這個模型真便宜,DeepSeek V4-pro的推理成本壓到GPT-5.5 Pro的約1/52,V4 Flash比Opus便宜99%”。最近用小龍蝦的朋友們絕對能明白這意味著什么?在智能體瘋狂吞噬算力的時候,便宜才是大模型最大的優(yōu)點。
現(xiàn)在,DeepSeek攜手華為給了大家一個在非CUDA平臺上:可用、好用、用得起的可以商業(yè)化的方案。
這是很有說服力的,它證明了擺脫CUDA依賴的現(xiàn)實可行性,這個時候再跟大家談標準適配,生態(tài)遷移,大家自然都樂意。現(xiàn)在是推動中國本土的大模型公司要把生態(tài)從英偉達遷移到國產(chǎn)芯片上,未來我們可以走出國門,全世界的AI還是一片藍海。
不久前黃仁勛接受印度裔科技博主采訪時頻頻破防。
當時這位00后的博主引用業(yè)界的觀點“把高端AI芯片賣給中國”類比于“波音公司把核武器賣給朝鮮”,又提出黃仁勛之所以著急給中國賣芯片是擔心“中國在中國正在搞全棧自研、去CUDA化”,黃仁勛在回應(yīng)中表達了難以掩飾的憤怒。
現(xiàn)在明白老黃為什么怒了?因為博主的提問就是典型的“兩頭堵”:
他一方面指出了英偉達的命脈CUDA生態(tài)正在遭遇危機,避免危機的方式就是給中國輸送芯片,讓中國人無法建立自身的生態(tài)。但是他同時又把英偉達賣芯片給中國定義為 “危害國家安全” 的行為。賣芯片也不行,不賣也不行,難怪老黃會生氣,可生氣也沒用啊,V4都出來了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.