網易首頁 > 網易號 > 正文申請入駐

開發者發現DeepSeek新模型線索，MODEL1標識符預示新一代大模型架構

2026-01-21 12:09:17　來源: PConline太平洋科技

廣東舉報

分享至

【太平洋科技快訊】1 月 21 日消息，據開發者近期在 GitHub 上的發現，DeepSeek 更新了一系列 FlashMLA 相關代碼。在涉及的 114 個文件中，有 28 處提到了未知的“MODEL1”大模型標識符，引發業界關注。

據悉，“MODEL1”標識符與已知的現有模型“V32”（即 DeepSeek-V3.2）被并列或區別提及。開發者分析認為，兩者在鍵值緩存布局、稀疏性處理方式以及對FP8數據格式的解碼支持等關鍵技術層面存在明顯區別，表明新架構可能在內存優化和計算效率上進行了針對性設計。

這一發現與近期的行業傳聞相互印證。The Information 本月早些時候爆料稱，DeepSeek 將在今年 2 月中旬農歷新年期間推出新一代旗艦 AI 模型——DeepSeek V4。據稱其代碼能力將顯著提升，內部測試顯示有望超越包括 GPT 和 Claude 在內的行業領先產品。

值得注意的是，DeepSeek 研究團隊此前陸續發表了兩篇重要技術論文：一篇介紹了名為“優化殘差連接（mHC）”的新訓練方法；另一篇提出了“條件記憶”新范式并開源相關記憶模塊 Engram。業界猜測，正在開發中的新模型很可能會整合這些研究成果。

打開APP，閱讀體驗更佳

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Cursor不香了？前0.01%大神倒戈Claude，萬字叛逃筆記爆火！

新智元 2026-01-24 17:03:52
0 跟貼 0
文心5.0正式版發布，霸榜LMArena的“最強文科生”到底強在哪？

智東西 2026-01-24 10:40:07
1 跟貼 1

把它「畫」進隱空間！新框架RoT探索大模型隱空間推理新范式

機器之心Pro 2026-01-23 17:21:24
0 跟貼 0

OpenAI絕地反擊！Codex大腦首曝，8億用戶極限架構硬剛Claude

新智元 2026-01-24 13:12:26
2 跟貼 2
俄羅斯一航班在我上空遇緊急狀態降落蘭州

北京日報 2026-01-23 18:55:29
22909 跟貼 22909

全網瘋轉，Claude Code之父神級代碼首次公開！10億美金秘密來了

新智元 2026-01-24 17:04:22
0 跟貼 0

當事人回應用SIM卡煉出191克黃金：網絡上部分數據存在表述不準確的情況

時拾影像 2026-01-24 00:00:30
0 跟貼 0
讓兩個大模型在線吵架，跑通全網95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0

印度男子冒充醫生，技術不到位沒關系，演技到位就行！

磨自明 2026-01-23 16:32:08
4 跟貼 4
如何為LLM智能體編寫工具？Anthropic官方教程來了

機器之心Pro 2025-09-12 21:50:08
0 跟貼 0
特斯拉出的高科技產品，每一款都是獨一無二，不服氣都不行

蛋蛋說笑 2026-01-21 16:15:02
19 跟貼 19
李亞鵬直播間涌入超10萬人，多款產品上線就被秒光

星視頻 2026-01-23 23:44:21
0 跟貼 0
1斤315元水果新“刺客”銷售暴漲產區多在山東四川

大象新聞 2026-01-21 13:45:03
781 跟貼 781
又一程序員猝死，代碼可以重寫，人生難以重啟

畫生筆記 2026-01-24 09:44:49
3 跟貼 3
AI開始指揮人類寫代碼，記憶也能永存了？全球頂級資本涌入

究竟視頻 2026-01-22 03:32:22
0 跟貼 0
32歲程序員倒在搶救室，工作群消息還在追問代碼

度看世界 2026-01-21 22:30:14
0 跟貼 0
屎山代碼改不動！曝《時之砂RE》90%由印度團隊開發

游民星空 2026-01-24 11:11:19
0 跟貼 0
特斯拉：購Model 3部分車型享8000元限時保險補貼

界面新聞 2026-01-24 15:55:18
0 跟貼 0
當真花卉紙杯蛋糕，好考驗裱花師技術，放在婚禮再合適不過！

搞怪趣星球 2026-01-24 10:06:14
1 跟貼 1
【DeepSeek談藝】張煉 | 在絲網疊印中織就傳統與當代的視覺詩學

文化視界網 2026-01-23 17:32:19
0 跟貼 0
開源鴻蒙重寫世界，從一行微小的代碼開始

量子位 2025-12-31 01:50:02
0 跟貼 0
嚴肅版AI編程助手 GitHub星標3k+

量子位 2025-12-08 15:29:06
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
程序員猝死當天5次訪問公司

嘻嘻笑 2026-01-23 05:05:13
0 跟貼 0
開源AI編程工具CoStrict，GitHub星標3K+

量子位 2025-12-09 01:52:08
0 跟貼 0
4600萬AI大單！火山引擎中

智東西 2026-01-23 14:45:16
0 跟貼 0
不能靶向也沒關系，這種療法的最新生存數據同樣令人驚喜

鄭于臻醫生 2026-01-24 14:12:01
0 跟貼 0
銀價猛漲！女子3年前買鉆戒送的足銀保溫杯，身價“反超”鉆戒

封面新聞 2026-01-24 00:47:11
1629 跟貼 1629
Get_right是一個技術全面的老六

沈萬基cs 2026-01-24 17:00:00
0 跟貼 0
Meta開年猛投算力，小扎親征籌建數十GW

量子位 2026-01-24 13:10:07
1 跟貼 1
華裔00后戳破頂會泡沫！NeurIPS 53篇論文曝AI造假，LeCun躺槍

新智元 2026-01-24 13:12:23
0 跟貼 0
實探“搶豬肉”風波中的株洲小村：村民否認搶豬肉，對背上罵名感到憋屈，組織方稱很內疚正配合調查

極目新聞 2026-01-24 10:56:06
532 跟貼 532
美國仿制藥的真相，記者探尋十年，揭露背后數據造假等亂象

知識圈 2026-01-21 20:23:20
10 跟貼 10
觀察｜越共十四大閉幕，越南小心確立“速度與克制”間平衡

澎湃新聞 2026-01-24 07:47:17
25 跟貼 25
高速公路遇車禍，新能源這次贏麻了，應急拋電池技術值得推廣！

歡樂聚集部 2026-01-24 14:50:34
1 跟貼 1
微軟發布醫療時序基座模型：4540億數據預訓練，解決不規則采樣

量子位 2026-01-24 13:16:13
0 跟貼 0
張維為戳破美式生活濾鏡體面背后盡是拮據日常

看看新聞Knews 2026-01-23 21:45:02
3120 跟貼 3120
我從中國買了艘迷你快艇，中國的產品就是給力！

小侯爺 2026-01-23 05:06:25
0 跟貼 0
新一輪降雪將至！山東這6市局部大雪

半島官網 2026-01-24 09:37:16
131 跟貼 131
剛上架就秒空，99元漲到396元！被戲稱為“打工治愈神器”，網友：到底是誰在買

環球網資訊 2026-01-24 08:57:16
18 跟貼 18

手機 / 數碼

房產 / 家居

開發者發現DeepSeek新模型線索，MODEL1標識符預示新一代大模型架構

特斯拉Cybercrab即將落地 每公里不到1塊錢

男子就醫從尿道取出圓筒狀、筆芯狀異物 存留長達20年

男子就醫從尿道取出圓筒狀、筆芯狀異物 存留長達20年

當家球星打替補，他們在故意擺爛？

李微漪更新：狼王格林去世，3字淚目

“百年老字號”張小泉遭60億債務壓頂

有增程和純電版可選 日產NX8或于3-4月間上市

態度原創

不一定能掀桌男主，但一定是個好演員！

成績公布！南京這兩所學校喜報刷屏！

“我們的節日——歡歡喜喜過大年” 2026春節主題文化和旅游活動即將啟幕，帶你一站式樂享皖韻新年

年底旗艦定位大洗牌：Pro拼性能，Ultra玩花活，Pro Max成全能王

《RE維羅妮卡》情報大匯總！你想看的都在這了

特斯拉Cybercrab即將落地每公里不到1塊錢

男子就醫從尿道取出圓筒狀、筆芯狀異物存留長達20年

男子就醫從尿道取出圓筒狀、筆芯狀異物存留長達20年

有增程和純電版可選日產NX8或于3-4月間上市