網易首頁 > 網易號 > 正文申請入駐

字節跳動vsDeepSeek，中國AI的開年雙王炸

2026-01-05 23:35:44　來源: 速途網

貴州舉報

分享至

作者｜周煒皓

編輯｜閆俊豪

2025年12月30日，字節跳動Seed團隊發布《Dynamic Large Concept Models》論文，挑戰了“Token是計算的原子單位”這一根深蒂固的假設，提出計算應當是分層、動態和抽象的。

一天之后，12月31日，DeepSeek提交了一篇有梁文鋒署名的論文，論文題目是《mHC：流形約束超連接》，這篇論文直指大模型訓練中的“信號爆炸”問題，用mHC架構為打造超大模型搭建起“腳手架”。

從打破“如何想得更快更深”的推理瓶頸，到解決“如何長得更大更穩”的現實困境，字節跳動和DeepSeek團隊分別從兩個方向，揭開了未來AI發展的圖景一隅。

讓AI學會“速讀”與“深思”

2011年，諾貝爾獎得主丹尼爾·卡尼曼在《思考，快與慢》中提出了System 1（快思考）和System 2（慢思考）的雙系統理論，常被用來類比AI的推理模式。

現有的 Transformer 模型，無論規模多大，本質上都在執行System 1式的直覺反應，基于統計規律快速預測下一個詞，缺乏System 2所具備的深思熟慮、規劃和概念抽象能力。字節跳動團隊則在論文中指出，語言模型不應受限于其輸入形式，而應具備在更高維度的“概念空間”進行操作的能力。

舉個例子，人類在理解“中華人民共和國”這個詞時，大腦激活的不僅僅是七個字的字面意義，而是一個包含政治、經濟、文化和歷史背景的語義網絡。DLCM 正是試圖在神經網絡中構建這種“概念”實體。

目前的 AI 模型存在一個通病，無論是處理無意義的虛詞，比如“的”、“是”，還是處理復雜的邏輯難題，消耗的計算資源是一樣的。這不僅效率低下，也限制了模型處理復雜任務的能力。DLCM通過引入“動態概念”機制，讓 AI 具備了類似人類的“速讀”和“慢思考”能力。

DLCM架構概述

這套機制將處理過程分為兩步，首先，模型不再逐字逐句看書，而是自動識別語義，將“今天天氣不錯”這樣簡單的一串詞瞬間打包成一個“概念”略過，不費腦力。其次，當遇到“相對論推導”這樣的硬骨頭時，模型會停下來，在壓縮后的“概念空間”里調動深層算力進行縝密推理。

用更容易理解的話說，過去AI就像個死板的經理，無論是審批買文具的 5 元發票，還是審批5個億的投資項目，都要花1個小時去審核。而引入DLCM后，這個經理就有了抓大放小的能力，審批文具發票只花1秒鐘，把節省下來的時間和精力，全部用來仔細研究那個5億的投資項目。

把好鋼用在了刀刃上，比起普通AI，DLCM在處理燒腦的邏輯推理題時更聰明，推理計算量減少了約34%，處理多步邏輯推理任務時，準確率反而平均提升了2.69%。對于擁有億級用戶的字節跳動來說，這意味著可以用更低的芯片成本，提供更聰明、反應更快的 AI 服務。

“音量守恒”魔咒

“信號爆炸”，是過去大模型訓練中的“地雷”。一旦踩中，不管你花了多少錢進行訓練，模型都可能瞬間崩潰，前功盡棄。

為了理解 DeepSeek 這項mHC技術的價值，我們可以把訓練大模型想象成一場幾百人參與的“傳話游戲”。

在這個游戲中，“人”就是神經網絡的層，“話”就是數據傳輸的信號或特征信息。在最早的深度網絡中，幾百人排成一列傳話。如果每個人都只靠“聽和說”，傳到第100個人時，消息往往已經面目全非或者變得極其夸張。

這就是早期深層網絡訓練困難的原因。過去，ResNet的解決方案是制定規則，讓每個人在傳話的同時，必須把上一給人給你的“原話”寫在小紙條上，原封不動地遞給下一個人。即使某個人腦子短路了，下一個人至少還能收到那張“小紙條”，保證了最基礎的信息不會丟，這就是恒等映射。

但問題在于，這是一條“單行道”，隨著模型越來越大，這張“小紙條”上寫的字越來越多，想在上面塞進更多的邏輯、語法和知識，變得越來越困難。

為了解決“單行道”擁擠的問題，字節跳動等研究者想出了一個辦法，從過去的一列隊伍改成多排幾列，并允許這幾列隊伍之間互相交流。新的問題出現了，由于沒有制定嚴格的“音量規則”，大家因為能互相交流變得非常興奮。

第一列的人喊了一嗓子，第二列的人覺得很重要，于是拿個大喇叭復述，第三列的人聽到了，又把聲音放大幾倍傳回去。就這么一團亂麻傳到最后，聲音被放大幾千倍，全是噪音，根本聽不清原本的消息，導致訓練直接崩潰，這就是HC導致的大模型訓練的困境。

結果表明，mHC 在損失和梯度范數方面都表現出更高的穩定性

在這個背景下，DeepSeek的研究員意識到，多列隊伍是好主意，但必須治理“噪音爆炸”。于是他們引入了數學上的流形約束，依然是多列隊伍并行，依然允許互相交流，但每個人面前放了一個分貝儀，如果你想聽其他列的消息，可以，但你從他們那里接收的“總音量”必須嚴格等于1。

你想多聽第一列的人在說什么，就得捂住另一只耳朵少聽其他列里的人說話，如果你要往后面傳話，你的聲音也必須是1分貝。這樣的好處在于，不管隊伍排多長，不管大家怎么互相傳八卦，整個房間的總音量始終控制在一個合理的范圍內。

這就是mHC最關鍵的作用，將深層網絡的信號增益從3000倍壓制到1.6倍左右，實現了3個數量級的穩定性提升。DeepSeek 利用 Sinkhorn-Knopp 算法強行“熨平”了所有的信號波動，無論模型有多大，內部結構都穩如泰山。

這項技術以僅增加 6.7% 訓練時間的微小代價，換來了極度的穩定性。

從“恐懼”到“貪婪”

這兩篇論文發布后，市場的反應也值得關注。

回想一年前的2025年1月27日，DeepSeek發布初代R1模型，全球資本市場曾陷入“算力通縮”的恐慌。當時，華爾街擔心中國廠商極高的算法效率會大幅減少對GPU的需求，導致英偉達股價單日暴跌17%，市值蒸發近5900億美元。

然而，2026 年1月2日，面對mHC和DLCM這兩項進一步大幅降低算力成本、提升模型效率的“王炸”級技術，資本市場卻表現出截然不同的態度。在兩篇論文發布后的首個交易日，英偉達股價并未因“需求減少”的邏輯而下跌，反而逆勢上揚1.26%，收于188.85 美元。

這種反差背后，是“杰文斯悖論”在發揮作用。早在工業革命時代，這位英國經濟學家就發現，當技術進步提高了使用資源的效率，但成本降低導致需求增加，會令資源消耗的速度不減反增。

比起“DeepSeek時刻”那會兒，市場擔心效率提升會導致顯卡需求下降，現在的投資者們想明白了一點，效率提升以后，還可以把AI塞進手機、眼鏡和汽車里，不僅不會少買，反而需要建設更龐大的推理集群來服務數十億用戶。

字節跳動的DLCM通過降低34%的推理成本，為AI落地應用掃清了障礙，DeepSeek的mHC則保證了未來更大規模模型的誕生，這兩者疊加，AI的蛋糕被做得更大了。

2026年開年的這兩篇論文，不僅是字節跳動和DeepSeek的技術秀，更是中國AI產業在高端芯片受限背景下走出的一條“不對稱競爭”之路。如果說過去兩年大家還在比拼誰的顯卡更多，那么從現在開始，比賽進入了比拼誰的腦子更快的新階段。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

字節跳動李航博士新作：AI智能體的通用框架

機器之心Pro 2026-01-29 12:18:43
0 跟貼 0
Agent學會“預測同伴”，神經網絡里涌現出了類社會位置細胞

DeepTech深科技 2026-01-29 11:20:03
0 跟貼 0

騰訊AI編程利器研發細節首次揭秘！9成代碼由AI生成，自家1.2萬工程師都在用

智東西 2026-01-29 19:45:35
0 跟貼 0

預測下一個像素還需要幾年？谷歌：五年夠了

機器之心Pro 2025-11-26 15:48:35
0 跟貼 0
未來世界，擁抱AI者，才能“復活”

葉檀財經 2026-01-29 18:11:24
3 跟貼 3

登頂行業SOTA的多模態視頻生成標桿，昆侖天工剛給開源了

量子位 2026-01-29 17:03:49
0 跟貼 0

我們要如何擁抱AI：積極學習，謹慎依賴

經濟觀察報 2026-01-29 20:55:11
0 跟貼 0
字節CEO梁汝波：豆包AI 2026年要“勇攀高峰” 薪酬和激勵要全球領先

財聯社 2026-01-29 21:02:07
0 跟貼 0

螞蟻開源世界模型叫板谷歌Genie3，一張圖生成10分鐘穩定長視頻

智東西 2026-01-29 19:08:50
0 跟貼 0
紫牛頭條|英國小伙騎行12000公里到中國：學會用不同的眼光看待世界

揚子晚報 2026-01-28 23:06:59
5979 跟貼 5979
騰訊混元圖像3.0圖生圖開源，LMArena躋身全球第一梯隊，開源最強

量子位 2026-01-28 16:21:50
0 跟貼 0
港大聯合字節跳動提出JoVA

機器之心Pro 2025-12-30 14:46:13
0 跟貼 0
曦望發布推理GPU S3：All-in推理的國產GPU，開始算單位Token成本

量子位 2026-01-27 22:38:53
0 跟貼 0
JustGRPO：擴散語言模型的極簡主義回歸

機器之心Pro 2026-01-29 12:09:40
0 跟貼 0
身體發出這六個信號，一定得注意了，或你的這個部位喊救命！

阿爾卡得生活 2026-01-28 08:53:28
0 跟貼 0
天干地支：古人的“宇宙代數”，3分鐘說清計算方法和底層邏輯

九江老渭 2026-01-27 15:49:08
23 跟貼 23
身體發出這些信號，千萬別忽視，都是大病！

漫漫街拍 2026-01-26 09:47:58
3 跟貼 3
數據不會說謊！小楊6分5板正負值+11全隊最高

咪咕體育 2026-01-28 10:39:52
18 跟貼 18
Karpathy盛贊，啥都沒有的創業公司剛融了1.8億美元

機器之心Pro 2026-01-29 19:04:12
0 跟貼 0
在未受污染的數學競賽中評估大語言模型

CreateAMind 2026-01-27 19:45:59
0 跟貼 0
以為一題都沒對，結果全對了，市面上實在是沒見過這么流暢的算法

中二探長 2026-01-27 14:39:30
0 跟貼 0
全網刷屏的山東“小飛哥”，又回河南了！

大象新聞 2026-01-29 20:45:09
2 跟貼 2
《生命樹》最大對手不是《太平年》，是約破200萬的古裝懸疑王炸

鋒哥與八卦哥 2026-01-29 19:44:42
3 跟貼 3
體壇聯播｜歐冠小組賽晉級球隊產生，又見穆里尼奧場邊狂奔

澎湃新聞 2026-01-29 08:15:29
156 跟貼 156
天神之眼5.0發布：全閉環端到端+強化學習

太平洋汽車 2026-01-29 12:12:12
5 跟貼 5
發生小中風？別忽視，出現5類信號，及時就醫是關鍵

快樂的小大夫 2026-01-29 19:10:25
0 跟貼 0
僅2小時！湖北“電波衛士”出擊，70余個通信基站恢復正常

極目新聞 2026-01-29 20:30:25
0 跟貼 0
現殺的新鮮牛肉，肉身居然在案板上不停“跳動”

九州新聞 2026-01-28 09:36:43
2 跟貼 2
算法向善，什么是善？

正見救世 2026-01-26 15:03:37
0 跟貼 0
蔚來世界模型新版發布，路測怎樣？

科技少幫主 2026-01-29 14:58:48
3 跟貼 3
婺劇討彩遇牛蛙打賞負責人稱圖熱鬧無傷大雅：牛蛙已被食用

新京報 2026-01-29 01:08:48
271 跟貼 271
四大天王之爭：數據與獎項之外的藝術多元與持久影響

泛舟碧波湖水 2026-01-25 04:52:03
0 跟貼 0
國產模型開源封神，谷歌Genie3緊急開源？螞蟻AGI撕開世界模型閉源防線

新智元 2026-01-29 19:40:20
0 跟貼 0
火箭隊輸球后，申京傷情確認，烏度卡直接下令，一數據聯盟最差

體壇大辣椒 2026-01-29 14:43:00
1 跟貼 1
格米萊遞表港交所

每日經濟新聞 2026-01-29 21:32:14
0 跟貼 0
羅云熙片場專注推理reaction

小夏娛樂圈嘮叨 2026-01-28 09:56:23
0 跟貼 0
“胖改”成效顯現步步高預計2025年扣非凈利潤減虧超八成|財報解讀

財聯社 2026-01-29 21:36:06
0 跟貼 0
量產L3+五座版泰山+法拉嵐+50萬級MPV，嵐圖2026的四款新車夠「王炸」嗎？

電動星球News 2026-01-29 19:20:58
0 跟貼 0
極狐L3自動駕駛二季度可預約體驗！

小南看車 2026-01-29 15:35:05
0 跟貼 0
Xbox真不管嗎？外媒曝平臺新游竟有40%是"刷分廢料"

游民星空 2026-01-29 21:38:06
0 跟貼 0

速途網

互聯網科技資訊

2295文章數 11427關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

本地

游戲

數碼

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最正宗的紋飾是什么？
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

字節跳動vsDeepSeek，中國AI的開年雙王炸

周亞輝的AI新賭局：國內太卷 出海另起爐灶

正部級孫紹騁被查 去年卸任內蒙古自治區黨委書記

正部級孫紹騁被查 去年卸任內蒙古自治區黨委書記

詹姆斯哭了！騎士視頻致敬41歲超巨

曝金晨涉嫌交通肇事逃逸 本人尚未回應

崔東樹：中國汽車未來年銷或達5000萬輛

車長超5米還帶后輪轉向 比亞迪海豹08/海獅08將亮相

態度原創

農村孩子早當家，姐姐給弟弟吃土瓜，姐弟情深讓人羨慕！

云游中國｜撥開云霧，巫山每幀都是航拍大片

春節肝不動？倩女端游這波春節減負福利直接讓你躺贏三界

機械革命無界14X輕薄本32G / 1T預售，首發價4199元僅一天

周亞輝的AI新賭局：國內太卷出海另起爐灶

正部級孫紹騁被查去年卸任內蒙古自治區黨委書記

正部級孫紹騁被查去年卸任內蒙古自治區黨委書記

曝金晨涉嫌交通肇事逃逸本人尚未回應

車長超5米還帶后輪轉向比亞迪海豹08/海獅08將亮相