<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V4,需要一次重估

      0
      分享至

      24日,DeepSeek-V4 的“突然”發布,沒有再次驚嚇華爾街。

      當晚,英偉達股價上漲超過 4%,市值穩穩站上5萬億美元。而在15個月前,DeepSeek-R1曾讓它單日暴跌17%。

      市場的平靜宣告了,從推理時代到智能體時代,中國與美國,已經形成兩套不同的“token經濟學”與AI敘事。一種圍繞圍繞成本效率擴展,受算力約束;另一種盯著能力上限定價,以稀缺為前提。雙方各自走上了一條無法輕易掉頭的路——

      真的如此嗎?

      落后3-6個月

      DeepSeek將這次發布稱為“預覽”。在技術報告中,團隊自稱目前的架構,仍然不夠優雅,還有很多積極探索并沒有來得及融入進來。

      “預覽版”包括兩款, “性能比肩頂級閉源模型”的DeepSeek-V4-Pro,為1.6T總參數、49B激活參數;“更快捷高效的經濟之選”的DeepSeek-V4-Flash,為284B總參數、13B激活參數。兩者均原生支持百萬token上下文,但仍然不支持多模態。

      僅從參數規模而言,DeepSeek-V4就仍然明顯落后于當前最前沿的閉源模型。DeepSeek自己也承認,演進軌跡落后美國前沿3-6個月,Agentic Coding的實際體驗,優于Sonnet 4.5,但距離Opus 4.6思考模式存在差距。

      在通用基準日漸飽和,個人測評相對主觀的環境下,DeepSeek團隊在技術報告的最后,點名感謝了DollyDeng的測評意見。后者認為V4-Pro在編程上的特點在于,廣泛的編程知識、長上下文的低幻覺、偶發性的注意力失焦、不講究的架構與UI;V4 Pro的max和high檔位,都有著相當高的可用性。

      而海外研究機構semianalysis在測評后,也仍然稱其為“卓越的工程版本”,緊貼SOTA水平,將成為閉源模型的最低成本替代方案。


      相較于上一代模型,DeepSeek-V4在“工程”領域的核心進步,在于上下文窗口的擴展。在百萬 token上下文場景下,V4-Pro的單token推理FLOPs,僅為DeepSeek-V3.2的27%,KV緩存大小僅為10%;V4-Flash的效率提升更為激進,FLOPs僅為 10%,KV緩存僅為7%。這比上個月市場熱炒的谷歌TurboQuant論文,影響更為深遠。

      DeepSeek將“邁向高效百萬token上下文智能”,視為當下最迫切解決的問題。它為高效處理超長序列的能力開啟了測試時擴展的新前沿,為深入研究長時任務鋪平了道路,并為探索在線學習等未來范式奠定了必要基礎。

      但是,隨著上下文長度達到極端規模,注意力機制的計算瓶頸問題愈發凸顯。由于客觀上的算力約束,優化注意力機制,長期以來都是DeepSeek等中國開源模型廠商的關鍵任務。這次,DeepSeek-V4在繼承了此前DSA與mHC創新的基礎上,吸收了月之暗面對Muon優化器的驗證,進一步提出了CSA(壓縮稀疏注意力)與HCA(重壓縮注意力)等的混合注意力機制。

      2026/01/14 完整閱讀 >

      簡言之,CSA以4:1的壓縮率將KV緩存壓縮成一個條目,隨后采用稀疏注意力加速;而HCA則將壓縮率大幅提升至128:1,但壓縮后的KV緩存,全部參與后續計算。兩種機制交替進行,既保證全局感知,又保證精細檢索。

      按照DeepSeek的規劃,未來,團隊將在DeepSeek-V4的基礎上,除了更“稀疏”的專家和注意力架構外,還將在更多維度上探索模型的稀疏性,包括Engram所要解決的“記憶”的稀疏化,后者相當于模型內部的“存算解耦”,有效繞過了GPU的HBM限制,為激進的參數擴展鋪平了道路。DeepSeek還在努力將多模態能力融入模型。

      昇騰Day 0適配

      在DeepSeek-V4發布后,華為與寒武紀第一時間宣布實現了Day 0支持。這意味著至少在推理協同上,它已與國產芯片深度協同優化。

      到目前為止,中國開源模型仍然選擇兼顧英偉達與國產芯片。據semianalysis分析,這款模型的參數設計,剛好能容納在8塊H20在FP4精度下的內存容量之內。而H20在中國的存量規模足夠龐大,短期內仍是推理主力。盡管如此,該機構還是相信,該模型的推理服務,“相當可觀的一部分”將由昇騰(Ascend)來承載。

      2026/04/05 完整閱讀 >

      據昇騰CANN的介紹,基于16卡昇騰950DT的算力基礎設施,DeepSeek-V4-Pro在多并發吞吐下,可以在單請求延遲20ms的情況下,實現388TPS(tokens per second)的吞吐速度。DeepSeek-V4-Flash更是高達4722TPS。昇騰950DT將于下半年全面上市,這是一款兼顧推理Decode階段與訓練的芯片。


      在技術報告的正文中,DeepSeek一共提及華為(Huawei)1次,英偉達(Nvidia)2次。最關鍵的一句話是“我們在 英偉達GPU和華為昇騰NPU平臺上對細粒度EP方案進行了驗證。”這實際上指向MegaMoE核心算子與MXFP4低精度數據路徑的適配能力。

      這都是DeepSeek-V4在正式開源前一周,已經悄悄向社區開源的。MegaMoE的核心在于對專家并行(MoE)中的計算與通信進行更細粒度的重排,兩者重疊(overlap)以在執行過程中“隱藏”通信延遲,從而緩解互連帶寬帶來的瓶頸。而向FP4精度要效率,將大幅降低降低數據搬運成本,提升計算單元利用率并逼近理論峰值性能。

      一度,市場也因此懷疑,DeepSeek-V4就是在英偉達的Blackwell架構上訓練的。此前,英偉達為Hopper架構引入創新的NVFP8精度格式,Blackwell則進一步推出NVFP4。英偉達對未來需求的主動預見,是代際性領先的。早在2024年,黃仁勛介紹Blackwell的時候,市場仍將FP4視為一種營銷手段。其他AI芯片公司,后來才對需求做出反應。

      但是,向低精度要效率,已是行業趨勢。谷歌第八代TPU也在嘗試原生FP4訓練與推理,而去年華為發布昇騰950系列,也早已預告了支持業界標準FP8/MXFP8/MXFP4。不過,報告指出,在訓練階段,仍然是“無縫復用現有的FP8混合精度框架”。

      現在,DeepSeek正在扮演對未來需求做出指引的關鍵角色。技術報告鼓勵,在下一代硬件設計可以更多地考慮計算-通信比(C-C Ratio)、功率預算(Power Budget)、通信原語(Communication Primitives)與激活函數(Activation Function)。尤其是基于MegaMoE工程實踐,得出每1GBps互聯帶寬足以支撐6.1 TFLOP/s計算的判斷,可能是整篇論文產業影響最深遠的數據點。

      AGI屬于每個人

      軟硬件協同的方向,指向算力自由,也指向AI普惠。DeepSeek-V4發布當天,DeepSeek研究員陳德里在社交媒體平臺X上,“謙卑”、“始終”地表態,AGI屬于每個人。

      一旦今年下半年昇騰950超節點規模上線,以及DeepSeek-V4的持續優化,它的單位token成本還會持續下降。團隊還進一步指出,該模型采用的FP4×FP8運算,盡管在現有硬件上,只能跑出與FP8×FP8相同的峰值FLOPS,但是理論上,未來的硬件可以進一步實現1/3的效率提升。

      而美國對于AGI的敘事,在經歷去年對“泡沫”的恐慌后,現在幾乎已經被Anthropic所主導。AI即將吃掉軟件,并由此通往吃掉全世界的AGI。誰占有越多最先進的算力,就越有可能研發出最高智能的前沿模型(及其智能體執行環境),進而匹配最高的價格,因為它在解決最有價值的任務。而Mythos強到只能由Anthropic指定極少數使用者。

      2026/04/25 完整閱讀 >

      英偉達、亞馬遜、谷歌,以及OpenAI與xAI,都開始被這一AI敘事所俘獲。這是一條自我強化的路徑。模型變得越來越昂貴,但仍然有人爭先恐后地買單;Anthropic推出哪一個垂直領域的智能體工具,那些上市公司的股價就開始狂跌。自從用上了Claude Code,Uber今年的全年AI預算,短短4個月就已經耗盡。

      但是,即使在美國,這套敘事也并非完美。大多數生產工作負載,都不會觸及智能的上限;而正在恐慌式嘗試智能體的軟件企業,它的AI投入能否在終端市場轉化為規模擴展持續性收入,也仍有待驗證。

      云廠商CloudFlare就認為,個人智能體和編碼智能體的興起,意味著成本不再是次要問題,這是擴展規模的主要障礙。編碼軟件公司Replit首席執行官Amjad Masad也說,中國研究者實際上公開分享了真正的人工智能突破,惠及所有人,包括小型(甚至可能是大型)美國實驗室。HuggingFace的CEO在下面表示認同。編碼軟件公司Cline創始人Saoud Rizwan則調侃說,如果把這筆預算分配給DeepSeek-V4-Pro,就足夠燒84個月。


      黃仁勛的破防

      即使再過3-6個月,中國開源模型也無法追平閉源模型的水平。差距客觀存在。年初,EpochAI統計顯示,自2023年以來,中國模型平均落后美國7個月,最小差距4個月,最大差距14個月。

      DeepSeek曾承認,訓練算力約束了旗艦模型在世界知識上的覆蓋廣度。DeepSeek-V4同時跑在華為與英偉達芯片上,相當于在為未來的切換做“基準測試”。畢竟,英偉達用十幾年建起的CUDA生態,不是一朝一夕就能超越的。

      這也不是單純的技術追趕。美國艾倫實驗室的研究員Nathan Lambert認為,數據與訓練環境是真正的護城河。而在當前AI敘事聚焦于智能體,尤其是編程智能體的時候,美國的閉源模型擁有壓倒性的優勢。中國的軟件行業仍然缺乏積累,這是蒸餾所無法替代的;中國金融、法律與醫療行業,也缺乏美國這樣如此慷慨的支付能力。

      但這種優勢,并非不可動搖。不同能力方向,對應著完全不同的訓練數據與后訓練方式。Nathan Lambert總結道,AI敘事的重點大約每12–18個月就會發生一次轉移。從對話到推理再到智能體,如果下一個強化學習環境恰好是中國積累最深的領域,杠桿就在中國這邊。DeepMind創始人哈薩比斯也相信,AGI還需要幾個Transformer級的重大發現,在5-10年之后才有可能實現。窗口期依然存在。

      2026/04/17 完整閱讀 >

      Android并非因為優于iOS而勝出。而是因為其更低的門檻與更廣的可及性。前者代表高價值與高溢價能力,后者則代表規模與普及。目前,DeepSeek-V4針對FP4的推理優化,客觀上有利于這些美國創業者在英偉達芯片上低成本嵌入中國開源模型。

      但更深的長期邏輯在于,隨著英偉達下一代Rubin系列,受到愈發嚴苛的供應鏈管制,DeepSeek將越來越難以針對性地放大英偉達GPU的性能優勢。除了美國最有錢的那批企業,更多的應用開發者將繼續跑在中國開源模型的船上;然后,中國算力硬件在性能逐步提升的情況下,深度參與協同優化,一塊塊替換掉底層的美國技術棧。等船靠岸時,可能沒有一塊板子是原來的英偉達了,而船上的人,從未離開。

      很多人,仍然沒有在這個意義上,真正理解黃仁勛面對芯片管制時的破防。

      DeepSeek的壓力在于,如何在更低單位token價格的情況下,讓自己堅持走到“AGI普惠”的目的地。這也意味著,它必須在一條更慢、更難、也更不被資本市場即時獎勵的道路上前行。這也是為何在發布DeepSeek-V4時,團隊以“不誘于譽,不恐于誹,率道而行,端然正己”作結。

      如今,DeepSeek終于不再否認融資傳聞。希望它的投資人,也能理解這句話的分量。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

      廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

      南方都市報
      2026-04-26 20:40:18
      哎!居然是跟腱斷裂!!

      哎!居然是跟腱斷裂!!

      柚子說球
      2026-04-27 12:34:08
      日本網友瘋換中文手機界面,直呼清爽十倍,中國文化悄悄出圈!

      日本網友瘋換中文手機界面,直呼清爽十倍,中國文化悄悄出圈!

      行者聊官
      2026-04-24 20:48:30
      中國石化完成DeepSeek-V4私有化部署

      中國石化完成DeepSeek-V4私有化部署

      每日經濟新聞
      2026-04-27 16:40:48
      社保嚴查全面收緊!無數中小企業,正在為十年前的小聰明買單

      社保嚴查全面收緊!無數中小企業,正在為十年前的小聰明買單

      芳姐侃社會
      2026-04-25 18:32:12
      血管堵塞的6個信號,別等堵死才發現!錯過可能拖成大病

      血管堵塞的6個信號,別等堵死才發現!錯過可能拖成大病

      孟大夫之家1
      2026-04-27 13:20:05
      一個向左一個向右:凱恩在拜仁圓夢,阿爾瓦雷斯卻失去了冠軍圣體

      一個向左一個向右:凱恩在拜仁圓夢,阿爾瓦雷斯卻失去了冠軍圣體

      里芃芃體育
      2026-04-27 00:10:03
      2859.2克黃金制品被警方扣押三十年 最新進展:雙方約定見面溝通賠償事宜 代理律師:和解的可能性很大

      2859.2克黃金制品被警方扣押三十年 最新進展:雙方約定見面溝通賠償事宜 代理律師:和解的可能性很大

      每日經濟新聞
      2026-04-27 18:05:32
      13-9!斯諾克世錦賽:8強決出4人,吳宜澤領先塞爾比,希金斯追近奧沙利文

      13-9!斯諾克世錦賽:8強決出4人,吳宜澤領先塞爾比,希金斯追近奧沙利文

      林子說事
      2026-04-27 17:22:42
      不留情面!皇馬前主帥安切洛蒂公開問責皇馬,直指姆巴佩拖垮球隊

      不留情面!皇馬前主帥安切洛蒂公開問責皇馬,直指姆巴佩拖垮球隊

      體育閑話說
      2026-04-27 10:32:57
      朝鮮獲贈德國“豹2”、美國M1A1坦克,這下朝鮮又有好東西山寨了

      朝鮮獲贈德國“豹2”、美國M1A1坦克,這下朝鮮又有好東西山寨了

      藍星雜談
      2026-04-27 17:33:21
      開始清算,不許3件事發生!30國代表離開東京,中方開打反擊戰

      開始清算,不許3件事發生!30國代表離開東京,中方開打反擊戰

      藍色海邊
      2026-04-27 17:32:45
      悲催!杭州一女子嫌國企丈夫沒本事,攜42萬存款離婚,雞飛蛋打了

      悲催!杭州一女子嫌國企丈夫沒本事,攜42萬存款離婚,雞飛蛋打了

      火山詩話
      2026-04-27 06:40:09
      從武大碩士到商場導購:誣告學弟性騷擾的楊景媛,終于付出了代價

      從武大碩士到商場導購:誣告學弟性騷擾的楊景媛,終于付出了代價

      地理三體說
      2026-04-25 22:06:06
      注意!中老年男性有性生活和沒性生活,差別居然這么大?

      注意!中老年男性有性生活和沒性生活,差別居然這么大?

      皓皓情感說
      2026-04-22 08:20:32
      “國產GPU第一股”摩爾線程,開盤666!

      “國產GPU第一股”摩爾線程,開盤666!

      新浪財經
      2026-04-27 10:35:43
      26歲女子因常年腳冷,習慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

      26歲女子因常年腳冷,習慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

      觀威海
      2026-04-24 09:12:16
      英媒:戰爭催生伊朗空前凝聚力

      英媒:戰爭催生伊朗空前凝聚力

      參考消息
      2026-04-26 19:19:38
      67歲遲志強現狀:出獄37年后,定居黑龍江,兒子工作令人淚目

      67歲遲志強現狀:出獄37年后,定居黑龍江,兒子工作令人淚目

      蹲坑看世界
      2026-04-25 19:10:38
      4月27日人民幣對美元中間價調升95個基點

      4月27日人民幣對美元中間價調升95個基點

      證券時報
      2026-04-27 09:44:06
      2026-04-27 21:20:49
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      365文章數 63關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實測出來了

      頭條要聞

      上海男子開啟輔助駕駛超速行駛 撞上2名道路養護工人

      頭條要聞

      上海男子開啟輔助駕駛超速行駛 撞上2名道路養護工人

      體育要聞

      最抽象的天才,正在改變瓜迪奧拉

      娛樂要聞

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

      財經要聞

      Meta 140億收購Manus遭中國發改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態度原創

      游戲
      家居
      健康
      親子
      教育

      山水絕景隨心拼 休閑建造游戲《千里山河錄》Steam商店頁公開

      家居要聞

      江景風格 流動的秩序

      干細胞如何讓燒燙傷皮膚"再生"?

      親子要聞

      小小的身影甜甜的舞姿,一場即興表演,解鎖專屬溫暖瞬間

      教育要聞

      文科大撤退,歷史首當其沖

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 97久人人做人人妻人人玩精品| 阿克| 亚洲日本乱码熟妇色精品| 91乱子伦国产乱子伦海的味道| 无码人妻精品一区二区三区温州 | 亚洲avav| 宜良县| 国产又粗又猛又爽视频| 精品国产乱| 99精品在线| 少妇无码一区二区三区免费 | 铁岭县| 99久久99久久加热有精品| 欧美喷白浆| 97无码人妻福利免费公开在线视频| 九九精品99久久久香蕉| 国产一区二区三区精品综合| 国产在线资源| 久久精品国产只有精品96| 一区二区三区偷拍系列| 亚洲综合香蕉| 亚洲精品久久久久午夜福禁果tⅴ 免费看美女被靠到爽的视频 | 国产高清在线精品一区二区三区| 国产人妻人伦精品一区二区| 人妻在卧室被老板疯狂进入| 99精品国产兔费观看久久99| 美女成人网站| 在丈前下药侵犯人妻在线| 欧美色资源| 成人妇女免费播放久久久| 日日干夜夜干| 亚洲日韩精品一区二区三区无码| 亚洲精品国产av一区二区| 婷婷综合视频| 日韩OL丝袜无码AV啪啪| 尹人香蕉久久99天天拍| 高清毛片aaaaaaaaa片| 久久天天色| 人妻夜夜添夜夜无码av| 九九热视频在线免费观看| 人妻系列中文字幕精品|