<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<em id="gyp6y"><b id="gyp6y"></b></em>

<menuitem id="gyp6y"></menuitem>

<big id="gyp6y"><font id="gyp6y"><meter id="gyp6y"></meter></font></big>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

代碼泄密！DeepSeek下一代“王炸”模型架構曝光

2026-01-21 13:06:16　來源: 智東西

北京舉報

0

分享至

智東西
作者江宇
編輯冰倩

智東西1月21日報道，DeepSeek-R1發布一周年之際，來自DeepSeek的神秘新模型“MODEL1”悄然現身GitHub代碼庫。

多位社區開發者推測，MODEL1很可能正是DeepSeek內測中的V3終極版本（V4模型），也有人猜測它可能代表一個完全獨立于V系列的新模型。

▲海外開發者在X平臺討論MODEL1身份

近日，DeepSeek向其核心推理內核FlashMLA推送了一系列更新，而在這些提交中，一個此前從未公開亮相的模型命名引發了社區的高度關注——MODEL1。

▲DeepSeek代碼庫出現MODEL1相關（圖源：X）

這一名稱不僅出現在SM90架構相關的.cu內核實例化文件中，還貫穿在多個針對FP8稀疏解碼路徑的模板定義與內存布局注釋里。

更關鍵的是，據海外開發者推測，MODEL1的背后將是一整套新的推理機制、算子結構與底層內存配置，會與DeepSeek現有V3.2模型呈現出完全不同的技術路徑。

在相關代碼文件中可以看到，MODEL1被用于核心解碼函數的多個實例中，顯式適配了頭維度為64和128的場景，并專門部署在SM90和SM100架構上。

▲DeepSeek FlashMLA源碼截圖（圖源：GItHub）

代碼中多處調用了“ModelType::MODEL1”，與其對應的還有一套獨立的持久化內核。這些文件與V32版本的持久化內核文件并行存在，這顯示出DeepSeek或許已為該模型設計了與V3系列完全不同的編譯路徑與執行邏輯。

▲DeepSeek FlashMLA源碼文件樹（圖源：GItHub）

更值得注意的是，在代碼中，有一條特別注釋寫道：對于F3架構（即SM90平臺）下的MODEL1模型，其KV緩存的內存stride必須是576B的整數倍。

▲海外網友推文截圖（目前該條注釋已于代碼庫內刪除）

這一配置區別于V3.2的656B，暗示著MODEL1對底層內存對齊和調度有更為嚴格的要求，可能與其更復雜的運行時行為與動態緩存機制有關。

一位海外網友也對這部分代碼進行了深入解讀，他認為，MODEL1在整體結構上展現出更強的實驗性特征，支持動態Top-K稀疏推理邏輯，還引入了額外的KV緩存區。

▲海外開發者的分析（圖源：X）

前者通過引入一個可變的topk_length指針，允許模型在推理時根據token或請求動態決定參與計算的key數量，提升了計算資源的精細調度能力；后者則通過extra_kv緩沖區，提供了將系統提示與用戶上下文分離存儲的可能，為Agent架構或多段上下文場景提供支持。

據社區開發者分析，MODEL1在同步邏輯與邊界控制上可能比V3.2更加復雜。其中RoPE與NoPE維度在雙GEMM運算中耦合更緊，可能意味著其在位置編碼與張量路徑調度上做出了顯著調整。

分析還提到，MODEL1引入了運行時邊界檢查機制，旨在規避動態Top-K推理中潛在的非法內存訪問。

此外，盡管官方注釋中標明MODEL1的stride應為576B，但據社區開發者基于代碼結構估算，其實際內存分配邏輯可能接近584B。這種細微差異被認為反映出該分支仍處于調試或快速迭代階段。

在更早的1月9日，外媒援引知情人士稱，DeepSeek將于2月中旬，也就是春節前后發布其下一代模型，主打編程能力，并在內部測試中已經在多個基準上超越了Claude與GPT系列。

結合目前模型文件結構已覆蓋64和128兩個頭維度、FP8稀疏解碼路徑已完成適配、內存規范已強制定義等跡象來看，MODEL1很可能已接近訓練完成或推理部署階段，正等待最終的權重凍結和測試驗證。

在海外社交平臺上，不少用戶對MODEL1的曝光反應熱烈。一位用戶調侃道：“我已經能聽見‘新模型將帶來99.97%成本下降’了。”

而另一位開發者則認為，如果DeepSeek再次開放權重，勢必將對閉源巨頭形成壓力，推動前沿模型進一步走向開放。

恰逢DeepSeek R1發布一周年，Hugging Face官方博客也發布了特別文章《One Year Since the “DeepSeek Moment”》，系統回顧了過去一年中國開源社區的集體爆發，明確提及DeepSeek的開源策略已從一次事件演化為生態策略。

▲Hugging Face官方博客：One Year Since the “DeepSeek Moment”

文章稱，R1模型的開源不僅降低了推理技術、生產部署與心理三個門檻，更推動了國內公司在開源方向上形成非協同但高度一致的戰略走向。

從百度、字節跳動到月之暗面、智譜AI，各大機構在過去一年中陸續加入Hugging Face并發布高質量模型，在社區下載、點贊與引用榜單上頻頻登頂。

與此同時，越來越多西方開源模型的底座也開始使用DeepSeek系列做微調，DeepSeek-V3更是成為Cogito v2.1等海外模型的底層基座。

結語：一年之后，DeepSeek再次站在開源演進的起點

如今，距離R1發布僅一年，DeepSeek的“MODEL1”很有可能在系統架構、執行路徑與推理機制上展現出全面超越V3.2的能力。

如果接下來如傳聞所述在春節前后正式發布，DeepSeek或許將再次改寫國內開源格局，也可能為全球前沿開源模型樹立新的標桿。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

R1一周年，DeepSeek Model 1悄然現身

機器之心Pro 2026-01-21 10:11:16
1 跟貼 1
DeepSeek-R2要來了？

新智元 2026-01-21 09:57:59
57 跟貼 57

馬斯克罕見低頭：開源推薦算法，自嘲“很爛”不過未來月更

量子位 2026-01-21 12:30:26
1 跟貼 1

碼農只剩6個月？Anthropic CEO斷言AI接管一切代碼，爆沖諾獎級智能！

新智元 2026-01-21 13:17:15
22 跟貼 22
大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0

MiniMax把自家“實習生”放出來了！

量子位 2026-01-20 21:25:26
0 跟貼 0

這些新型騙局太可怕了

主持人楊震 2026-01-21 09:50:35
0 跟貼 0
Node.js之父官宣：人類手寫代碼時代真的結束了！

新智元 2026-01-21 13:16:35
24 跟貼 24

央視曝光串珠兼職騙局，騙子專盯居家婦女騙了460萬，女子花40余萬元訂購材料包后被拉黑，犯罪嫌疑人網上購買原材料每斤僅幾元

音樂下午茶官方 2026-01-19 00:04:20
4 跟貼 4
存錢也會出事？最新騙局曝光，提醒家人警惕！

貓meme團子 2026-01-19 03:21:23
0 跟貼 0
AI視頻迎來了它的DeepSeek時刻

經濟觀察報 2026-01-21 14:41:22
0 跟貼 0
馮德萊恩:歐盟決定永久凍結俄羅斯資產并保留使用權利

央視新聞客戶端 2026-01-20 18:45:02
25392 跟貼 25392
開發者透露D加密機制：虛擬機反復混淆加劇CPU計算壓力

電玩迷 2026-01-21 15:01:42
0 跟貼 0
開源AI編程工具CoStrict，GitHub星標3K+

量子位 2025-12-09 01:52:08
0 跟貼 0
零代碼才是程序開發的未來

畫小二 2026-01-20 22:11:19
1 跟貼 1
嚴肅版AI編程助手 GitHub星標3k+

量子位 2025-12-08 15:29:06
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
后續大結局《解鎖人生新劇情》68集完整版

云朵剪紙一起來 2026-01-21 11:03:16
0 跟貼 0
從呂梁山到世界舞臺：九個山里娃的“代碼”突圍

山西廣播電視臺融媒體 2026-01-20 17:29:42
0 跟貼 0
開源鴻蒙重寫世界，從一行微小的代碼開始

量子位 2025-12-31 01:50:02
0 跟貼 0
字節Seed團隊發布循環語言模型Ouro，在預訓練階段直接「思考」

機器之心Pro 2025-11-04 11:58:36
0 跟貼 0
機器人做手術超越所有醫生？心外科專家不服，輸了直播吃心臟模型

曾博士 2026-01-18 21:02:00
23 跟貼 23
這邏輯滿分

憨憨愛影視 2026-01-18 00:36:00
0 跟貼 0
非Transformer架構新突破，液態神經網絡推理小模型只用900M內存

機器之心Pro 2026-01-21 18:08:27
0 跟貼 0
大哥忘記銀行卡密碼，突然開始唱歌，柜員不敢打斷

搞笑事務所 2026-01-20 11:13:30
1 跟貼 1
豆包再向C端猛沖

華爾街見聞官方 2026-01-21 19:38:09
0 跟貼 0
揭露幾個高發騙術，別再給騙子發紅包了！

常青Dx 2026-01-20 05:18:12
0 跟貼 0
賺了一百萬的外賣員

中國青年報 2026-01-21 07:14:51
0 跟貼 0
近期，無錫持續嚴查！

江南晚報 2026-01-21 20:13:35
0 跟貼 0
xAI工程師播客聊太嗨，馬斯克解雇了他

量子位 2026-01-21 18:10:26
0 跟貼 0
你“先買后付”了嗎？小心一鍵下單，背上隱形債！

梁瞠侃世界 2026-01-20 10:28:49
1 跟貼 1
江敦濤，被罷免

新京報政事兒 2026-01-21 09:13:31
155 跟貼 155
哈里王子控訴媒體黑幕：記者竟然花錢買隱私信息？

精彩一網打盡 2026-01-21 04:10:38
0 跟貼 0
男子停用手機號后未解綁微信，10萬元資金差點丟失。警方提醒

河南都市頻道 2026-01-20 11:04:30
0 跟貼 0
拒絕智能手機，炮轟ChatGPT，沒有他就沒有今天的互聯網

DeepTech深科技 2025-12-26 18:07:26
0 跟貼 0
丹麥養老基金將退出美國國債投資

財聯社 2026-01-20 21:40:18
3039 跟貼 3039
大媽輕信“優質男友” 出資10余萬欲投資

8099999街頭巷尾 2026-01-19 20:44:57
0 跟貼 0
阿里云重新定義AI時代數據庫

華爾街見聞官方 2026-01-21 18:15:01
0 跟貼 0
淮南警方致全體師生及家長反詐宣傳的一封信

淮南發布 2026-01-21 20:24:56
0 跟貼 0
驚險！灞橋公安火線攔截52.8萬元黃金

陽光報陽光網 2026-01-21 20:31:04
0 跟貼 0

參加遵義會議的三個軍團政委，為何只有一人在建國后未獲重用？

參加遵義會議的三個軍團政委，為何只有一人在建國后未獲重用？

抽象派大師

2025-12-01 11:55:18

印度首富的小兒子：減200多斤又變胖，妻子是高種姓出身的白富美

印度首富的小兒子：減200多斤又變胖，妻子是高種姓出身的白富美

小書生吃瓜

2026-01-20 17:26:45

毛主席表兄參加國慶觀禮憤然離席，毛主席得知原因后：我不是皇帝

毛主席表兄參加國慶觀禮憤然離席，毛主席得知原因后：我不是皇帝

大運河時空

2026-01-20 12:25:02

“安徽馬拉松一姐”姚玉舟：你有你的，我有我的方向

“安徽馬拉松一姐”姚玉舟：你有你的，我有我的方向

極目新聞

2026-01-21 20:26:44

特朗普深知中國統一勢不可擋，爭分奪秒從臺灣提走5千億美元

特朗普深知中國統一勢不可擋，爭分奪秒從臺灣提走5千億美元

通文知史

2026-01-20 19:05:05

官方：狼堡簽下20歲日本中場鹽貝健人；據悉轉會費900萬歐

官方：狼堡簽下20歲日本中場鹽貝健人；據悉轉會費900萬歐

懂球帝

2026-01-20 22:35:06

回顧：2013年成都一場上門女婿霸占岳母引發的荒唐倫理慘劇

回顧：2013年成都一場上門女婿霸占岳母引發的荒唐倫理慘劇

談史論天地

2026-01-21 14:45:03

河南小伙娶小18歲伊拉克媳婦，認識4天就結婚，彩禮花了3000萬！

河南小伙娶小18歲伊拉克媳婦，認識4天就結婚，彩禮花了3000萬！

凡知

2026-01-17 10:15:33

國乒已變天！王勵勤放棄潛規則，馬琳完成布局，用人告別人情世故

國乒已變天！王勵勤放棄潛規則，馬琳完成布局，用人告別人情世故

忠橙家族

2026-01-21 19:29:35

分手14年，釋小龍何潔境遇天差地別，一個身家過億，一個養不起娃

分手14年，釋小龍何潔境遇天差地別，一個身家過億，一個養不起娃

查爾菲的筆記

2026-01-09 22:17:44

他逝于1929年，他的家族影響到2026年

他逝于1929年，他的家族影響到2026年

最愛歷史

2026-01-20 19:47:12

丹麥想不通，自己舉國反華卻遭輕視，英媒給出答案：特朗普是中吹

丹麥想不通，自己舉國反華卻遭輕視，英媒給出答案：特朗普是中吹

科普100克克

2026-01-21 05:57:22

扶不起的阿斗：蘇聯養15年，中國養20多年，為何仍窮困至今？

扶不起的阿斗：蘇聯養15年，中國養20多年，為何仍窮困至今？

芳芳歷史燴

2026-01-21 13:07:49

四會富仕：目前已實現800G光模塊PCB的小批量交付

四會富仕：目前已實現800G光模塊PCB的小批量交付

新京報

2026-01-21 16:09:38

哇，交易開始，湖人熱鬧了！

體育新角度

2026-01-21 15:01:52

穩了！央視春晚首次聯排收官，釋放3大信號，趙本山含金量還在升

穩了！央視春晚首次聯排收官，釋放3大信號，趙本山含金量還在升

銀河史記

2026-01-21 17:10:13

奉勸大家：為了家人安全，別在廚房做這7件事，真的很危險！

奉勸大家：為了家人安全，別在廚房做這7件事，真的很危險！

Home范

2026-01-03 14:57:10

豪門恩怨大爆發！貝克漢姆長子布魯克林與父母徹底決裂

豪門恩怨大爆發！貝克漢姆長子布魯克林與父母徹底決裂

新民周刊

2026-01-20 20:40:15

孔令文：與父親關系沒傳說那么僵隔閡源于小時候他給的一筆零花錢

孔令文：與父親關系沒傳說那么僵隔閡源于小時候他給的一筆零花錢

勁爆體壇

2026-01-21 14:18:33

索尼，又造了個怪物

放毒

2026-01-21 15:27:39

聚焦智能變革，服務產業升級。

11100文章數 116943關注度

往期回顧全部

科技要聞

給機器人做仿真訓練這家創企年營收破億

頭條要聞

風波中的西貝股權發生變化新榮記張勇對賈國龍伸援手

頭條要聞

風波中的西貝股權發生變化新榮記張勇對賈國龍伸援手

體育要聞

只會防守反擊？不好意思，我們要踢決賽了

娛樂要聞

首位捐款的明星苗圃現身嫣然醫院捐款

財經要聞

丹麥打響第一槍歐洲用資本保衛格陵蘭島

汽車要聞

2026款上汽大眾朗逸正式上市售價12.09萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

旅游

藝術

健康

親子

教育要聞

初一成績穩不住，是心態出問題了

旅游要聞

免票！超值套票！伏羲山冰雪節全線優惠上線！

藝術要聞

一百多年前的中國，太雄偉震撼了！

打工人年終總結！健康通關=贏麻了

親子要聞

奶奶想蒸饅頭小孫子不同意？7條狗3個窩排成排，狗媽媽挨個檢查

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板： aⅴ精品无码无卡在线观看| 日本少妇被黑人xxxxx| 精品精品国产高清A毛片| 69精品国产久热在线观看| 国模一区二区三区白浆| 人妻互换一二三区激情视频| 亚洲自国产拍揄拍| 熟妇无码熟妇毛片| 毛片无遮挡高清免费| 四虎av| 河东区| 美女内射视频WWW网站午夜| 人妻97资源站| 欧洲熟妇色xxxxx欧美老妇伦| 少妇人妻偷人精品一区二区| 精品偷拍被偷拍在线观看| 国产美女无遮挡裸色视频| 亚洲无码免费在线观看| 女人的天堂av免费看| 国产亚洲精品??码| 狠狠五月激情六月丁香| 日韩av爽爽爽久久久久久| 国产精品日韩av在线播放| 超级碰在线视频| 国产免费午夜福利蜜芽无码| 淮南市| 夜夜高潮夜夜爽国产伦精品| 亚洲综合国产| 99精品久久久久久久婷婷| 亚洲国产精品高清久久久| 久久国产AV| 桑日县| 成全在线电影在线观看| 曾医生17分钟??下载| 狠狠88综合久久久久综合网| 欧美AA视频| 亚洲中文字幕av| 中文字幕佐山爱一区二区免费| 丝袜高潮流白浆潮喷在线播放| 久久国产欧美日韩精品图片| 亚洲精品无码永久在线观看你懂的 |

<blockquote id="tbax7"></blockquote>