<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      終于發了!DeepSeek發布并開源V3.1,迄今為止最強大的開放AI

      0
      分享至

      DeepSee k宣布推出新一代開源大語言模型DeepSeek-V3.1,并將其權重和代碼在 GitHub等平臺上開放。

      這一模型延續了DeepSeek-V3的強大能力,并在多個關鍵方面進行了升級。


      01|模型參數與架構

      DeepSeek-V3.1采用了改進的Transformer架構,總參數規模達到約6850億。

      其中采用了Mixture-of-Experts(MoE)稀疏專家方案,每個token推理時激活約370億參數。

      值得一提的是,DeepSeek-V3.1取消了傳統MoE所需的負載均衡損失,避免了額外開銷。

      同時引入多token預測訓練目標,進一步增強模型性能。

      在訓練過程中,DeepSeek團隊使用了FP8混合精度和自研的DualPipe流水線并行算法,在2048張NVIDIA H800 GPU上完成了14.8萬億token的預訓練,整個過程穩定高效,沒有出現不可恢復的損失激增。



      02|上下?窗?擴展

      DeepSeek-V3.1最大的改進在于上下文長度的顯著擴展。

      新版本將模型的上下文窗口提升到128K tokens(約相當于300頁文本)。

      這意味著模型在一次交互中可以處理和記憶遠超以往的信息量,能夠支持更長的對話和更大規模的文檔分析。

      為了實現超長上下文,DeepSeek采用了名為YaRN(Yet another Random Noise)的位置編碼擴展方案。

      通過在長上下文訓練中引入隨機噪聲擾動,模型在保持長程依賴建模能力的同時,有效緩解了長序列訓練的不穩定問題。

      實際測試顯示,DeepSeek-V3.1在不同長度上下文下表現穩健,即使輸入長達128K tokens時依然能夠準確定位關鍵信息。

      03|性能表現

      憑借更大的參數規模和優化的訓練策略,DeepSeek-V3.1在各項基準測試中表現優異。

      綜合評估顯示,它不僅超越了此前所有開源模型的水平,而且在許多任務上達到了與領先閉源模型相當的性能。


      例如, 在知識問答和推理測試(MMLU-Pro等) 上, DeepSeek-V3.1的準確率達到75.9%。

      在數學和代碼領域,該模型更是展現出強大實力:在MATH數學題基準上準確率超過90%。

      在Codeforces編程競賽評測中,其解題能力達到前51.6百分位,大幅領先其他開源模型。

      在長文檔理解的“大海撈針”(NeedleInAHaystack)測試中,DeepSeek-V3.1在不同長度上下文下均能保持高準確率,展現了擴展至128K后的穩健表現。

      總體而言,DeepSeek-V3.1被認為是目前最強大的開源大模型。



      04|開源與獲取?式

      DeepSeek-V3.1延續了DeepSeek一貫的開放策略,將模型權重和代碼完全開源發布。

      開發者可以在GitHub、Hugging Face等平臺獲取模型權重及推理代碼。

      DeepSeek官方還提供了多種本地部署方案和推理工具,包括輕量級的FP8/BF16推理演示、社區優化的推理框架(如LMDeploy、 vLLM等)以及分布式推理實現。

      對于不具備大規模算力的用戶,DeepSeek在其官方平臺上提供了在線體驗和API接口。用戶現在可以通過網頁端、對V3.1模型進行使用。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      胡金秋27+9爆發!衛冕冠軍廣廈滅廣州止連敗 袁照耀20+5三分

      胡金秋27+9爆發!衛冕冠軍廣廈滅廣州止連敗 袁照耀20+5三分

      醉臥浮生
      2026-04-06 21:27:12
      美伊巴代表徹夜談停火!特朗普發帖:打開那該死的海峽 伊朗:不會為臨時停火重開

      美伊巴代表徹夜談停火!特朗普發帖:打開那該死的海峽 伊朗:不會為臨時停火重開

      紅星新聞
      2026-04-06 18:18:25
      上海市委統戰部副部長張峰,任市工商聯黨組書記

      上海市委統戰部副部長張峰,任市工商聯黨組書記

      黃河新聞網呂梁
      2026-04-06 17:13:31
      伊朗發動第98波行動,襲擊美“的黎波里”號軍艦!以空襲伊最大石化設施,打死“圣城旅”特種部隊指揮官!美媒:停火“依然渺茫”

      伊朗發動第98波行動,襲擊美“的黎波里”號軍艦!以空襲伊最大石化設施,打死“圣城旅”特種部隊指揮官!美媒:停火“依然渺茫”

      每日經濟新聞
      2026-04-06 21:04:04
      無罪!無罪!無罪!這才是老百姓要的正義!

      無罪!無罪!無罪!這才是老百姓要的正義!

      胖胖說他不胖
      2026-04-06 09:00:47
      5萬贊助張雪?東鵬特飲獨家回應

      5萬贊助張雪?東鵬特飲獨家回應

      中國新聞周刊
      2026-04-06 17:14:54
      因上墳太“瘋”火遍全國!川渝人的清明,笑著把祖先敬了

      因上墳太“瘋”火遍全國!川渝人的清明,笑著把祖先敬了

      匹夫來搞笑
      2026-04-06 17:58:17
      觸目驚心!陜西女教師案:5人背景強硬、串通毀證,正義不容遮掩

      觸目驚心!陜西女教師案:5人背景強硬、串通毀證,正義不容遮掩

      奇思妙想草葉君
      2026-04-03 21:18:12
      伊朗稱正審閱最新停火提案!外媒:美副總統萬斯和伊朗外長等徹夜交流,停火協議或將立即生效,霍爾木茲海峽重新開放

      伊朗稱正審閱最新停火提案!外媒:美副總統萬斯和伊朗外長等徹夜交流,停火協議或將立即生效,霍爾木茲海峽重新開放

      每日經濟新聞
      2026-04-06 15:51:15
      沙特阿拉伯、俄羅斯、伊拉克、阿聯酋、科威特、哈薩克斯坦、阿爾及利亞和阿曼等8個主要產油國決定5月日均增產原油20.6萬桶

      沙特阿拉伯、俄羅斯、伊拉克、阿聯酋、科威特、哈薩克斯坦、阿爾及利亞和阿曼等8個主要產油國決定5月日均增產原油20.6萬桶

      瀟湘晨報
      2026-04-06 08:53:09
      快訊!臺灣地區前領導人蔡英文發表聲明了!

      快訊!臺灣地區前領導人蔡英文發表聲明了!

      達文西看世界
      2026-04-06 09:13:17
      全紅嬋陳芋汐微信群事件:全紅嬋被爆遭遇集體霸凌,多名跳水界業內人士牽涉其中。

      全紅嬋陳芋汐微信群事件:全紅嬋被爆遭遇集體霸凌,多名跳水界業內人士牽涉其中。

      貼小君
      2026-04-05 08:44:50
      2020年,長沙女子癌癥晚期,爭奪女兒40萬學費,直言:我只想活著

      2020年,長沙女子癌癥晚期,爭奪女兒40萬學費,直言:我只想活著

      大魚簡科
      2026-04-06 11:33:07
      美媒稱美伊停火可能性“依然渺茫”

      美媒稱美伊停火可能性“依然渺茫”

      新華社
      2026-04-06 19:36:03
      震驚!約在星巴克見面,女生喝冰咖啡后在廁所報警,懷疑男方下藥

      震驚!約在星巴克見面,女生喝冰咖啡后在廁所報警,懷疑男方下藥

      火山詩話
      2026-04-06 07:26:53
      手機頂部出現這4個圖標,馬上關機!已經被人遠程控制了

      手機頂部出現這4個圖標,馬上關機!已經被人遠程控制了

      Thurman在昆明
      2026-04-06 14:09:43
      張紀中刮掉三十年白胡子,全家沒人認出他

      張紀中刮掉三十年白胡子,全家沒人認出他

      歪歌社團
      2026-04-06 15:58:32
      6歲女童走失后續:有新發現、奶茶店主做出回應,知情人透內幕

      6歲女童走失后續:有新發現、奶茶店主做出回應,知情人透內幕

      潮鹿逐夢
      2026-04-06 10:17:16
      109萬桶!委內瑞拉石油出口創4年新高,中國采購卻突降至零!

      109萬桶!委內瑞拉石油出口創4年新高,中國采購卻突降至零!

      聚焦真實瞬間
      2026-04-06 16:49:42
      和稀泥終于引起公憤了!

      和稀泥終于引起公憤了!

      胖胖說他不胖
      2026-04-06 09:00:47
      2026-04-06 23:44:49
      AI變革 incentive-icons
      AI變革
      AI時代的變革,無論你主不主動,都與你有關
      142文章數 16關注度
      往期回顧 全部

      科技要聞

      折疊屏iPhone要來了,富士康已在試產!

      頭條要聞

      外媒:美國副總統萬斯和伊朗外長等人徹夜交流

      頭條要聞

      外媒:美國副總統萬斯和伊朗外長等人徹夜交流

      體育要聞

      官方:中國女足球員邵子欽加盟本菲卡

      娛樂要聞

      唐嫣羅晉新加坡遛娃,6歲女兒身高搶鏡

      財經要聞

      史詩級暴跌"一周年" A股接下來如何走?

      汽車要聞

      阿維塔06T快上市了 旅行車還能這么玩?

      態度原創

      教育
      房產
      藝術
      旅游
      數碼

      教育要聞

      國內有錢人為什么都喜歡送孩子去英國留學?

      房產要聞

      小陽春全面啟動!現房,才是這波行情里最穩的上車票

      藝術要聞

      印度這棟樓刷屏了!屋頂做成9000人的聚會場

      旅游要聞

      新疆以花為媒,繪旅游新圖景

      數碼要聞

      微星泰坦18 Ultra 2026游戲本上市,頂配售價47999元

      無障礙瀏覽 進入關懷版