<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      海外評測DeepSeek-V4:智能體任務排名開源第一,幻覺率上升,Token消耗大

      0
      分享至

      4月24日, DeepSeek-V4預覽版正式發布并同步開源,號稱在Agent能力、世界知識與推理性能三大維度達到國內及開源領域領先水平。

      DeepSeek-V4分為Pro與Flash兩個版本,均支持百萬(1M)token超長上下文。

      兩個版本均大幅降低了對計算和顯存的需求,將每個標記的推理FLOP降低 73%,并將KV緩存內存占用降低90%。


      4月24日,全球最大AI模型應用程序編程接口聚合平臺OpenRouter的數據顯示,V4-Flash的調用量達270億Token,V4-Pro為47.9億Token,但沒有登上排行榜。


      DeepSeek-V4發布后,主流評測平臺進行了能力測試和排名。

      Artificial Analysis對DeepSeek-V4進行了推理能力專項測評。結果顯示,V4-Pro在人工分析智能指數中斬獲52分,相較V3.2版本的42分實現10分躍升,成為僅次于Kimi K2.6的全球第二大開源推理模型。

      V4-Flash得分47分,性能弱于V4-Pro,但顯著超越DeepSeek-V3.2,綜合智能水平對標Claude Sonnet 4.6(全力版),介于頂尖閉源模型與主流中端模型之間。


      在智能體任務表現方面,V4-Pro在真實場景智能體工作任務中,性能位居所有開源權重模型首位,得分1554,超越Kimi K2.6(1484)、GLM-5.1(1535)、GLM-5(1402)以及MiniMax-M2.7(1514)。


      DeepSeek-V4知識儲備升級,但幻覺發生率上升。V4-Pro在全知綜合評測指標(AA-Omniscience)中得分為-10,較V3.2推理版提升11分,核心得益于知識回答準確率的顯著優化。V4-Flash得分為-23,整體水平與V3.2基本持平。


      相較于V3.2的幻覺率(82%),V4兩款模型的幻覺問題突出:V4-Pro幻覺率為94%、V4-Flash幻覺率為96%,意味著模型在未知問題場景下,幾乎都會強行生成答案。


      DeepSeek-V4的運行成本低于頂級閉源模型,高于主流開源模型,較前代大幅上漲。完成全套人工分析智能指數測評,V4-Pro的運行成本為1071美元,僅不到Claude Opus 4.7(4811 美元)的四分之一;但對比同類開源模型仍偏高,高于Kimi K2.6(948 美元)、GLM-5.1(544美元)、DeepSeek-V3.2(71美元)、gpt-oss-120B(67 美元)。DeepSeek-V4-Flash運行成本僅約113美元,成本優勢顯著。


      完成標準測評流程,V4-Pro輸出Token消耗量達1.9億,屬于本次測評中Token消耗最高的模型之一;V4-Flash消耗進一步攀升至2.4億Token。即便定價偏低,高額的Token消耗仍是V4-Pro綜合使用成本高于其他開源模型的核心原因。


      在其他評測中,大模型競技場Arena.ai將DeepSeek-V4-Pro定性為“相較DeepSeek-V3.2的重大飛躍”,在其代碼競技場中位列開源模型第3位、綜合第14位。DeepSeek-V4-Pro在智能體網頁開發任務中與GPT-5.4-high和Gemini-3.1-Pro處于同一水平。在其文本競技場中,DeepSeek-V4-Pro位列開源模型排名第2、綜合第14,與Kimi-2.6持平。DeepSeek-V4-Flash位列開源模型排名第10、綜合第14。


      另一家測評方Vals AI稱,DeepSeek-V4在其Vibe Code Benchmark(氛圍代碼基準)中以“壓倒性優勢”拿下開源權重模型榜首,較上代V3.2實現約10倍性能躍升,甚至擊敗了像Gemini 3.1 Pro這樣的頂尖閉源模型。DeepSeek-V4也是唯一一個在Vibe Code Benchmar上突破40%的開源權重模型。


      相較于DeepSeek-V4的能力,海外更加關注DeepSeek與華為的合作。

      在DeepSeek-V4公布API價格信息的最下方,官方特別標注指出:“受限于高端算力,目前Pro的服務吞吐量十分有限,預計下半年昇騰(Ascend)950超節點批量上市后,Pro的價格會大幅下調。”


      DeepSeek在技術報告中稱,V4已在NVIDIA GPU和華為昇騰NPUs平臺上驗證了精細粒度的EP(專家并行)方案,相較于強大的非融合基線,其在通用推理任務上可實現1.50~1.73倍的加速效果,而在對時延敏感的場景(如RL推演和高速代理服務)中則可達到1.96倍的加速效果。

      而在V4發布后,華為昇騰也同步宣布“超節點全系列產品支持DeepSeek-V4系列模型”。據悉,昇騰950通過融合kernel和多流并行技術降低Attention計算和訪存開銷,大幅提升推理性能,結合多種量化算法,實現了高吞吐、低時延的DeepSeek-V4模型推理部署。

      對于DeepSeek此次與華為合作,市場研究機構Omdia半導體研究主管何輝表示:“這對中國人工智能行業而言意義重大。”

      他進一步說道:“華為昇騰芯片是中國自研水平最高、可替代英偉達的產品。DeepSeek-V4大模型適配搭載華為芯片,標志著中國頂級大模型如今已能夠實現國產化硬件落地運行。

      高盛分析師Christopher Moniz點評稱,DeepSeek-V4預覽版發布后,GPU及國產芯片板塊應聲走強。核心關注點之一是支撐V4模型的芯片底層架構:包括模型訓練所使用的芯片,以及推理階段搭載的硬件設備。華為搭載昇騰AI處理器的新一代人工智能計算集群,可適配運行DeepSeek-V4模型。這也意味著,中國自研AI硬件生態,正在為DeepSeek持續迭代前沿大模型提供算力支撐。

      DeepSeek此次技術路線轉向,也印證了英偉達首席執行官黃仁勛此前的擔憂:英偉達正面臨失去中國開發者生態的風險。

      本月上旬,英偉達創始人黃仁勛在接受Dwarkesh Patel專訪時曾言:“如果DeepSeek先在華為平臺上發布,那對美國來說將是災難性的。”在黃仁勛看來,雖然DeepSeek是一款開源模型,同樣可被用于英偉達產品上,但如果DeepSeek專門針對華為算力進行優化,在高端算力采購受限等局限下,英偉達將處于劣勢。

      與DeepSeek-R1不同,DeepSeek-V4并沒有引發美國科技股大跌。晨星高級股票分析師Ivan Su表示,DeepSeek-V4很難復刻推理模型R1當初的市場影響力,因為交易市場早已充分消化了預期:中國人工智能技術具備競爭力,且使用成本更低。

      Ivan Su還稱,DeepSeek此次全新的產品定位,將國內其他開源大模型直接劃入競品行列。

      布魯金斯學會研究員Kyle Chan表示,DeepSeek-V4令人印象深刻,因為它是一個接近最先進水平的模型,具有高效的100萬Token上下文長度,并且可以在華為的新芯片上運行。DeepSeek-V4沒有復制“DeepSeek-R1時刻”,因為外界對中國AI能力的期望值要比以往高得多。

      免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特斯拉接入豆包:汽車產品定義權,又東移了一點點

      特斯拉接入豆包:汽車產品定義權,又東移了一點點

      科工力量
      2026-04-23 20:43:48
      楊樂樂后悔全職帶娃落淚,在婚姻中不快樂,汪涵:為什么要和我比

      楊樂樂后悔全職帶娃落淚,在婚姻中不快樂,汪涵:為什么要和我比

      童叔不飆車
      2026-04-23 22:38:35
      女子20元買一舊肚兜,幾年后去鑒寶,專家聞了聞,一句話讓她傻眼

      女子20元買一舊肚兜,幾年后去鑒寶,專家聞了聞,一句話讓她傻眼

      燦爛夏天
      2025-03-12 22:44:55
      不到48小時,法媒、國臺辦接連“點名”張凌赫,鄭麗文果真沒說錯

      不到48小時,法媒、國臺辦接連“點名”張凌赫,鄭麗文果真沒說錯

      阿握聊事
      2026-04-24 19:38:21
      沉痛!10歲男孩因被罰與同桌互打50次,老師全程拍照,墜樓身亡

      沉痛!10歲男孩因被罰與同桌互打50次,老師全程拍照,墜樓身亡

      番外行
      2026-04-24 09:03:42
      烏克蘭清除全部庫皮揚斯克俄軍部隊!摧毀紅軍村通訊系統

      烏克蘭清除全部庫皮揚斯克俄軍部隊!摧毀紅軍村通訊系統

      項鵬飛
      2026-04-24 12:48:43
      補丁老頭掛專家號被嫌臟,次日院長晨檢看清長相瞬間哽咽

      補丁老頭掛專家號被嫌臟,次日院長晨檢看清長相瞬間哽咽

      星星會墜落
      2026-04-25 20:02:10
      難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

      難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

      科學發掘
      2026-04-23 08:35:50
      關曉彤最新官宣,已與鹿晗無關

      關曉彤最新官宣,已與鹿晗無關

      泠泠說史
      2026-04-25 20:47:20
      才播了三期,就說他倆一定會離?

      才播了三期,就說他倆一定會離?

      橘子娛樂
      2026-04-24 21:14:22
      美方將派代表團訪華,特朗普提前打出兩手牌,兩只大熊貓將赴美

      美方將派代表團訪華,特朗普提前打出兩手牌,兩只大熊貓將赴美

      深析古今
      2026-04-25 23:34:04
      湖人3比0領先還有意外收獲,布朗尼季后賽得分碾壓鵜鶘狀元郎錫安

      湖人3比0領先還有意外收獲,布朗尼季后賽得分碾壓鵜鶘狀元郎錫安

      姜大叔侃球
      2026-04-25 12:47:47
      哈里王子突訪烏克蘭,就戰爭發表強硬講話,督促普京停止戰爭

      哈里王子突訪烏克蘭,就戰爭發表強硬講話,督促普京停止戰爭

      新時代精神
      2026-04-25 16:48:28
      第一集就全裸出鏡,女神新劇太生猛了

      第一集就全裸出鏡,女神新劇太生猛了

      來看美劇
      2026-04-24 22:03:11
      萬科長公主沒有選擇萬科

      萬科長公主沒有選擇萬科

      地產微資訊
      2026-04-24 19:33:52
      小米SU7自動泊車時撞上懸空墻體;車主:以后不再用了;廠家:懸空障礙物會影響到泊車輔助功能

      小米SU7自動泊車時撞上懸空墻體;車主:以后不再用了;廠家:懸空障礙物會影響到泊車輔助功能

      大風新聞
      2026-04-23 15:47:14
      倫敦租房廣告涉嫌“公然歧視非穆斯林”

      倫敦租房廣告涉嫌“公然歧視非穆斯林”

      名人茍或
      2026-04-25 07:04:08
      紅綠燈讀秒要取消了,到路口該沖還是該停?看完這些才不會犯錯

      紅綠燈讀秒要取消了,到路口該沖還是該停?看完這些才不會犯錯

      復轉這些年
      2026-04-25 23:28:53
      87年,我帶著父親當兵的照片入伍,誰知女首長看到照片后差點暈過去

      87年,我帶著父親當兵的照片入伍,誰知女首長看到照片后差點暈過去

      紅豆講堂
      2025-03-23 10:39:32
      歷史上有五個毒計,聽后讓人頭皮發麻,最后一個堪稱不世出的毒計

      歷史上有五個毒計,聽后讓人頭皮發麻,最后一個堪稱不世出的毒計

      日落于西
      2026-04-24 12:21:03
      2026-04-26 00:12:49
      每日經濟新聞 incentive-icons
      每日經濟新聞
      中國主流財經全媒體平臺。
      1550450文章數 2725521關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4發布!黃仁勛預言的"災難"降臨

      頭條要聞

      媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

      頭條要聞

      媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

      體育要聞

      那一刻開始,兩支球隊的命運悄然改變了

      娛樂要聞

      《我們的爸爸2》第一季完美爸爸翻車了

      財經要聞

      90%訂單消失,中東旺季沒了

      汽車要聞

      2026款樂道L90亮相北京車展 樂道L80正式官宣

      態度原創

      親子
      房產
      藝術
      公開課
      軍事航空

      親子要聞

      發生率僅十萬分之一!這種稀有血型跨省緊急調配,只為守護母嬰安全

      房產要聞

      新一輪教育大爆發來了!海口,開始瘋狂建學校!

      藝術要聞

      蓬皮杜中心的韓國分館,6月4日開幕!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美防長:戰事不會“沒完沒了”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 万全县| 又大又硬又爽免费视频| 99久久久精品免费观看国产| 国产jizzjizz视频| 人妻[21p]大胆| 亚洲中文字幕乱码av波多ji| 国产地址二永久伊甸园| 中文字幕一区二区三区乱码| 亚洲精品国产suv一区| 久久精品午夜一区二区福利| 国产成人精品日本亚洲网站| 99视频在线播放| 日韩精品人妻在线| 欧美A视频| 激情欧美精品一区二区| 99热精品久久只有精品| 久久永久免费人妻精品| 中文有码无码人妻在线| 天全县| 牲欲强的熟妇农村老妇女视频| 国产精品免费无遮挡无码永久视频 | 精品一区二区三区在线成人| 亚洲一区二区无码偷拍| 新绛县| 少妇人妻互换不带套| 乱伦日屄| 免费网站看sm调教视频| 3P视频免费在线观看| 亚洲无码| 无码中文字幕av免费放| 亚洲欧美综合人成在线| 中文字幕久久精品波多野结| 亚洲变态另类天堂AV手机版| 小罗莉无套内谢2020| 久久久综合香蕉尹人综合网| 精品无码专区毛片| 性男女做视频观看网站| 国精品无码人妻一区二区三区| 日韩第四页| 久久久久人妻一区二区三区 | 一本加勒比hezyo无码人妻|