<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<sub id="slrdq"></sub>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

終于發了！DeepSeek發布并開源V3.1，迄今為止最強大的開放AI

2025-08-20 23:21:50　來源: AI變革

黑龍江舉報

0

分享至

DeepSee k宣布推出新一代開源大語言模型DeepSeek-V3.1，并將其權重和代碼在 GitHub等平臺上開放。

這一模型延續了DeepSeek-V3的強大能力，并在多個關鍵方面進行了升級。

01｜模型參數與架構

DeepSeek-V3.1采用了改進的Transformer架構，總參數規模達到約6850億。

其中采用了Mixture-of-Experts（MoE）稀疏專家方案，每個token推理時激活約370億參數。

值得一提的是，DeepSeek-V3.1取消了傳統MoE所需的負載均衡損失，避免了額外開銷。

同時引入多token預測訓練目標，進一步增強模型性能。

在訓練過程中，DeepSeek團隊使用了FP8混合精度和自研的DualPipe流水線并行算法，在2048張NVIDIA H800 GPU上完成了14.8萬億token的預訓練，整個過程穩定高效，沒有出現不可恢復的損失激增。

02｜上下?窗?擴展

DeepSeek-V3.1最大的改進在于上下文長度的顯著擴展。

新版本將模型的上下文窗口提升到128K tokens（約相當于300頁文本）。

這意味著模型在一次交互中可以處理和記憶遠超以往的信息量，能夠支持更長的對話和更大規模的文檔分析。

為了實現超長上下文，DeepSeek采用了名為YaRN（Yet another Random Noise）的位置編碼擴展方案。

通過在長上下文訓練中引入隨機噪聲擾動，模型在保持長程依賴建模能力的同時，有效緩解了長序列訓練的不穩定問題。

實際測試顯示，DeepSeek-V3.1在不同長度上下文下表現穩健，即使輸入長達128K tokens時依然能夠準確定位關鍵信息。

03｜性能表現

憑借更大的參數規模和優化的訓練策略，DeepSeek-V3.1在各項基準測試中表現優異。

綜合評估顯示，它不僅超越了此前所有開源模型的水平，而且在許多任務上達到了與領先閉源模型相當的性能。

例如，在知識問答和推理測試（MMLU-Pro等）上， DeepSeek-V3.1的準確率達到75.9%。

在數學和代碼領域，該模型更是展現出強大實力：在MATH數學題基準上準確率超過90%。

在Codeforces編程競賽評測中，其解題能力達到前51.6百分位，大幅領先其他開源模型。

在長文檔理解的“大海撈針”（NeedleInAHaystack）測試中，DeepSeek-V3.1在不同長度上下文下均能保持高準確率，展現了擴展至128K后的穩健表現。

總體而言，DeepSeek-V3.1被認為是目前最強大的開源大模型。

04｜開源與獲取?式

DeepSeek-V3.1延續了DeepSeek一貫的開放策略，將模型權重和代碼完全開源發布。

開發者可以在GitHub、Hugging Face等平臺獲取模型權重及推理代碼。

DeepSeek官方還提供了多種本地部署方案和推理工具，包括輕量級的FP8/BF16推理演示、社區優化的推理框架（如LMDeploy、 vLLM等）以及分布式推理實現。

對于不具備大規模算力的用戶，DeepSeek在其官方平臺上提供了在線體驗和API接口。用戶現在可以通過網頁端、對V3.1模型進行使用。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

「AI殺死Git」？前GitHub掌門人開啟AI原生操作系統

新智元 2026-04-05 10:43:35
7 跟貼 7
AI創業，已經沒有“出海”這個詞了丨量子位沙龍

量子位 2026-04-06 13:00:41
0 跟貼 0

智能體上線就翻車？AWS 這款 “質檢神器”，幫你把 Agent 穩穩送上生產線

鈦媒體APP 2026-04-06 08:38:20
0 跟貼 0

讓離線強化學習從「局部描摹」變「全局布局」丨ICLR'26

量子位 2026-04-06 13:33:32
0 跟貼 0
OpenAI新模型不是GPTX！全新預訓練“土豆”曝光

量子位 2026-04-05 17:09:09
0 跟貼 0

能賺超額收益的3個AI賽道

虎嗅APP 2026-04-06 04:12:13
1 跟貼 1

5小時眾籌破百萬美金，Tiiny AI為什么能賣爆

虎嗅APP 2026-04-04 23:09:16
2 跟貼 2
靠7個員工和1只貓，年入2500萬美元！這可能是AI時代最好的模板

DeepTech深科技 2026-04-06 20:33:49
0 跟貼 0

2010美股閃崩預演! Claude黑進底層，谷歌預警: AI將血洗人類萬億財富

新智元 2026-04-06 19:58:03
0 跟貼 0
科氪 | 榮耀與京東簽訂戰略合作協議推進AI、機器人、C2M共創合作

36氪 2026-04-06 17:56:42
1 跟貼 1
毫秒級搜索10億生物序列！騰訊×浙大合作推出最強生物序列搜索AI工具——ERAST

生物世界 2026-04-06 15:07:19
0 跟貼 0
逼AI當山頂洞人！Claude防話癆插件爆火，網友：受夠了AI廢話

新智元 2026-04-06 17:13:12
1 跟貼 1
人在養蝦，蝦在選人

經濟觀察報 2026-03-13 13:52:06
0 跟貼 0
讓多模態檢索超越SOTA！ReCALL框架化解生成式與判別式的范式沖突

量子位 2026-04-06 23:28:00
0 跟貼 0
AI算力擴容的新瓶頸竟是銅纜，英偉達押注光互連

DeepTech深科技 2026-04-06 20:59:51
0 跟貼 0
男子理發付款，魔鬼算法把老板娘繞進去，最后竟然還賺錢了

企鵝愛聊生活 2026-04-04 09:15:52
0 跟貼 0
Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
0 跟貼 0
陳光標賣勞斯萊斯捐了1000萬元:張雪未來見面提車

都市快報橙柿互動 2026-04-05 16:58:33
6404 跟貼 6404
為了不跟龍蝦搶電腦用，有人開始造Agent專屬的“三無”硬件

量子位 2026-04-05 10:16:52
4 跟貼 4
這啥算法

一只小太陽 2026-04-06 03:07:55
0 跟貼 0
1020的代碼

表弟看車 2026-04-06 18:12:51
0 跟貼 0
堵死中國所有后門！美國兩黨深夜發新規，聯手日荷絞殺AI芯片制造

安珈使者啊 2026-04-06 14:41:17
3 跟貼 3
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2639 跟貼 2639
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
2026京津冀（廊坊）算力算法大賽倒計時2天

新浪財經 2026-04-06 12:27:09
0 跟貼 0
上海人山人海！排隊3公里，等候長達380分鐘！各大地標又爆了，上海名場面再現外灘；多地景區宣布，限流、停止售票

上觀新聞 2026-04-06 06:16:28
187 跟貼 187
中國披露054B型護衛艦新細節，人工智能算法幾乎消除防空盲區

星星跌入夢里中 2026-04-05 03:35:07
0 跟貼 0
046中考數學真題，求一個令分數表達式為整數的參數值，整除問題

我服子佩 2026-04-06 13:39:49
1 跟貼 1
4月1日移動資費大調整！家中有老人抓緊辦這4件事，每月省不少錢

復轉這些年 2026-04-06 23:07:48
1 跟貼 1
徐州“公廁版瑞幸”火出圈，景區工作人員回應：曾是游客服務點而非公廁

現代快報 2026-04-04 15:00:11
1207 跟貼 1207
在極限環境中就需要使用極限策略

趣知小故事 2026-04-04 11:30:41
1 跟貼 1
知名連鎖餐飲門口宣傳板寫“3元自助早餐”，兩人買單45元被告知“僅粥飲自助”

新聞晨報隨申Hi 2026-04-02 18:36:05
887 跟貼 887
Claude Code Harness+龍蝦科研團來了！金字塔分層架構+多智能體

量子位 2026-04-06 14:30:03
0 跟貼 0
5萬贊助張雪？東鵬特飲獨家回應

中國新聞周刊 2026-04-06 17:14:54
1 跟貼 1
當地文旅否認施壓爆火雞煲店開門營業:已提供支持措施

杭州日報 2026-04-06 16:55:15
291 跟貼 291
不止055！神秘水泥模型曝光，中國2萬噸巨艦要來了？

因果 2026-04-06 20:39:40
0 跟貼 0
核磁測量EF值少了10%？別怕，心臟沒萎縮

心血管前沿 2026-04-06 07:36:33
0 跟貼 0
堵！堵！堵！排隊26公里

無錫博報 2026-04-06 18:07:47
1 跟貼 1
最新數據！中金合并東興、信達后，營收或排第三，凈利有望居第四

證券時報 2026-04-06 20:10:03
13 跟貼 13

胡金秋27+9爆發！衛冕冠軍廣廈滅廣州止連敗袁照耀20+5三分

胡金秋27+9爆發！衛冕冠軍廣廈滅廣州止連敗袁照耀20+5三分

醉臥浮生

2026-04-06 21:27:12

美伊巴代表徹夜談停火！特朗普發帖：打開那該死的海峽伊朗：不會為臨時停火重開

美伊巴代表徹夜談停火！特朗普發帖：打開那該死的海峽伊朗：不會為臨時停火重開

紅星新聞

2026-04-06 18:18:25

上海市委統戰部副部長張峰，任市工商聯黨組書記

上海市委統戰部副部長張峰，任市工商聯黨組書記

黃河新聞網呂梁

2026-04-06 17:13:31

伊朗發動第98波行動，襲擊美“的黎波里”號軍艦！以空襲伊最大石化設施，打死“圣城旅”特種部隊指揮官！美媒：停火“依然渺茫”

伊朗發動第98波行動，襲擊美“的黎波里”號軍艦！以空襲伊最大石化設施，打死“圣城旅”特種部隊指揮官！美媒：停火“依然渺茫”

每日經濟新聞

2026-04-06 21:04:04

無罪！無罪！無罪！這才是老百姓要的正義！

無罪！無罪！無罪！這才是老百姓要的正義！

胖胖說他不胖

2026-04-06 09:00:47

5萬贊助張雪？東鵬特飲獨家回應

5萬贊助張雪？東鵬特飲獨家回應

中國新聞周刊

2026-04-06 17:14:54

因上墳太“瘋”火遍全國！川渝人的清明，笑著把祖先敬了

因上墳太“瘋”火遍全國！川渝人的清明，笑著把祖先敬了

匹夫來搞笑

2026-04-06 17:58:17

觸目驚心！陜西女教師案：5人背景強硬、串通毀證，正義不容遮掩

觸目驚心！陜西女教師案：5人背景強硬、串通毀證，正義不容遮掩

奇思妙想草葉君

2026-04-03 21:18:12

伊朗稱正審閱最新停火提案！外媒：美副總統萬斯和伊朗外長等徹夜交流，停火協議或將立即生效，霍爾木茲海峽重新開放

伊朗稱正審閱最新停火提案！外媒：美副總統萬斯和伊朗外長等徹夜交流，停火協議或將立即生效，霍爾木茲海峽重新開放

每日經濟新聞

2026-04-06 15:51:15

沙特阿拉伯、俄羅斯、伊拉克、阿聯酋、科威特、哈薩克斯坦、阿爾及利亞和阿曼等8個主要產油國決定5月日均增產原油20.6萬桶

沙特阿拉伯、俄羅斯、伊拉克、阿聯酋、科威特、哈薩克斯坦、阿爾及利亞和阿曼等8個主要產油國決定5月日均增產原油20.6萬桶

瀟湘晨報

2026-04-06 08:53:09

快訊！臺灣地區前領導人蔡英文發表聲明了！

快訊！臺灣地區前領導人蔡英文發表聲明了！

達文西看世界

2026-04-06 09:13:17

全紅嬋陳芋汐微信群事件：全紅嬋被爆遭遇集體霸凌，多名跳水界業內人士牽涉其中。

全紅嬋陳芋汐微信群事件：全紅嬋被爆遭遇集體霸凌，多名跳水界業內人士牽涉其中。

貼小君

2026-04-05 08:44:50

2020年，長沙女子癌癥晚期，爭奪女兒40萬學費，直言：我只想活著

2020年，長沙女子癌癥晚期，爭奪女兒40萬學費，直言：我只想活著

大魚簡科

2026-04-06 11:33:07

美媒稱美伊停火可能性“依然渺茫”

美媒稱美伊停火可能性“依然渺茫”

新華社

2026-04-06 19:36:03

震驚！約在星巴克見面，女生喝冰咖啡后在廁所報警，懷疑男方下藥

震驚！約在星巴克見面，女生喝冰咖啡后在廁所報警，懷疑男方下藥

火山詩話

2026-04-06 07:26:53

手機頂部出現這4個圖標，馬上關機！已經被人遠程控制了

手機頂部出現這4個圖標，馬上關機！已經被人遠程控制了

Thurman在昆明

2026-04-06 14:09:43

張紀中刮掉三十年白胡子，全家沒人認出他

張紀中刮掉三十年白胡子，全家沒人認出他

歪歌社團

2026-04-06 15:58:32

6歲女童走失后續：有新發現、奶茶店主做出回應，知情人透內幕

6歲女童走失后續：有新發現、奶茶店主做出回應，知情人透內幕

潮鹿逐夢

2026-04-06 10:17:16

109萬桶！委內瑞拉石油出口創4年新高，中國采購卻突降至零！

109萬桶！委內瑞拉石油出口創4年新高，中國采購卻突降至零！

聚焦真實瞬間

2026-04-06 16:49:42

和稀泥終于引起公憤了！

胖胖說他不胖

2026-04-06 09:00:47

AI時代的變革，無論你主不主動，都與你有關

142文章數 16關注度

往期回顧全部

科技要聞

折疊屏iPhone要來了，富士康已在試產！

頭條要聞

外媒：美國副總統萬斯和伊朗外長等人徹夜交流

頭條要聞

外媒：美國副總統萬斯和伊朗外長等人徹夜交流

體育要聞

官方：中國女足球員邵子欽加盟本菲卡

娛樂要聞

唐嫣羅晉新加坡遛娃，6歲女兒身高搶鏡

財經要聞

史詩級暴跌"一周年" A股接下來如何走？

汽車要聞

阿維塔06T快上市了旅行車還能這么玩？

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

房產

藝術

旅游

數碼

教育要聞

國內有錢人為什么都喜歡送孩子去英國留學？

房產要聞

小陽春全面啟動！現房，才是這波行情里最穩的上車票

藝術要聞

印度這棟樓刷屏了！屋頂做成9000人的聚會場

旅游要聞

新疆以花為媒，繪旅游新圖景

數碼要聞

微星泰坦18 Ultra 2026游戲本上市，頂配售價47999元

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<center id="xyfde"><i id="xyfde"></i></center>

<thead id="xyfde"><rt id="xyfde"></rt></thead>

<sub id="xyfde"></sub>