<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<thead id="akttn"></thead>

<sub id="akttn"></sub>

<blockquote id="akttn"></blockquote><style id="akttn"></style>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

面壁智能SALA架構，正在拆掉Transformer的那堵墻

2026-02-13 15:33:07　來源: AI異類

北京舉報

0

分享至

這兩年，大模型圈子里真正卡住行業的點，已經從參數規模，轉向了推理效率。

模型越做越大，算力和顯存的壓力就越像一堵墻，橫在落地面前。

尤其當應用從簡單對話進入長文檔理解、代碼倉級分析、長周期智能體任務之后，傳統架構的瓶頸，越來越暴露了出來。

很多團隊都在優化訓練技巧、壓縮權重、做蒸餾，卻很少有人直接動底層注意力結構，因為那意味著要重新審視整個Transformer范式。

面壁智能，這次公開的 Linear-Sparse 混合注意力架構 SALA 和對應模型 MiniCPM-SALA，在核心結構層的技術路線上，給了不一樣的答案。

新模型能力提升現在不新鮮了，但如果是一次架構路線層面的重新定調呢？

馬上過年了，比起很多公司紅包的熱鬧和營銷的手段，我覺得，面壁智能這樣扎扎實實的技術推進，更值得被看見。

01. 長上下文需求爆發，正在倒逼注意力機制進化

大模型最早的商業場景集中在問答、寫作、摘要，這類任務上下文長度通常在幾千到幾萬 token 區間，傳統全注意力機制還能承受。

隨著應用形態變化，模型開始承擔代碼倉分析、合同審查、科研資料歸納、長鏈路 agent 任務規劃等工作……

輸入規模直接跳到幾十萬甚至百萬 token 級別，這類需求在企業端和端側同時增長。

企業側希望模型一次性讀取整個知識庫或代碼庫并保持一致理解，端側設備則存儲著大量用戶私有數據。

比如說，聊天記錄、歷史行為、位置軌跡，這些信息只有本地處理才符合隱私要求，所以端側長上下文能力逐漸變成剛需指標。

傳統 Transformer 的問題在這種場景下會被無限放大。

全注意力機制計算復雜度，隨序列長度平方增長，序列翻十倍，算力需求接近百倍級上升，同時 KV Cache 也同步膨脹。

推理階段顯存占用持續上漲，哪怕模型參數規模不變，只要上下文變長就會直接炸顯存，這就是很多工程團隊口中的 KV Cache 困局。

放之前，這幾個困局，就像一個「不可能三角」。

行業已經嘗試過多條路徑解決這個問題，例如線性注意力、狀態空間模型、稀疏注意力結構，各自都在某些維度表現出色，卻始終存在明顯短板。

線性注意力與 SSM 類方法將復雜度壓到線性級別，速度和資源消耗表現很理想，不過這種結構需要把歷史信息壓縮進固定容量狀態中，序列越長，早期信息權重就越低，在復雜推理或長鏈條邏輯場景中容易出現記憶衰減現象。

稀疏注意力走的是另一條路線。

通過只計算關鍵位置注意力來降低算力需求，推理速度提升明顯，不過歷史 KV 必須完整保存，否則無法回溯長距離依賴。

這導致顯存仍隨序列線性增長，存儲壓力沒有根本解決。

行業一直在尋找一種結構，既保留線性結構的效率，又具備稀疏結構的精準感知能力。

MiniCPM-SALA采用的Transformer-to-Hybrid低成本構建方法（HALO）

02. SALA的混合注意力架構

SALA 的核心設計思路很直接，將兩類注意力優勢拼接進同一架構體系，讓不同模塊負責不同任務。

整體結構中大約 75% 使用 Lightning Attention 線性模塊，負責局部關鍵語義捕捉；

剩余 25% 使用 InfLLM v2 稀疏注意力模塊，負責全局信息建模。

這種比例經過多輪實驗調優后確定，目標是找到效率與精度之間的穩定平衡點。

線性部分保證推理復雜度穩定增長，稀疏部分負責高價值信息精細建模，兩者共同構成完整上下文理解路徑。

這種設計真正解決的問題在于長序列任務的結構性矛盾。

純線性模型在序列極長時容易丟失細節，純稀疏模型在序列增長時顯存壓力持續擴大，SALA 把計算密度和信息密度拆分處理，讓計算資源集中在重要區域，同時保證全局狀態可追蹤。

換句話說，模型在處理百萬 token 輸入時不會同時對所有 token 做同等強度計算，而是自動分配算力權重，這使得資源利用效率明顯提高。

另一個關鍵創新來自訓練方法 HALO。

傳統混合架構如果從零訓練，成本會高得驚人，因為新結構需要重新學習全部語言知識與推理能力。

HALO 的策略是在已有全注意力模型基礎上進行結構轉換，再進行持續訓練，這種方式繼承原模型能力，同時讓新架構逐漸適應新的注意力模式。

工程層面看，這種路線可以把算力投入降低到可接受范圍，使混合注意力模型具備規模化訓練可行性，對整個行業具有現實參考價值。

如果把當前主流架構放在同一坐標系中觀察，可以看到一條明顯演化路徑：

全注意力模型提供穩定智能水平，線性模型提供極致效率，稀疏模型提供長序列能力，SALA 則嘗試把三條路線合并成統一解。

像 Kimi KDA、DeepSeek NSA、InfLLM v2 都在不同方向推進長上下文能力，SALA 的出現讓行業第一次看到統一結構實現多優勢疊加的可能性。

相關論文參考：

稀疏-線性混合注意力：https://arxiv.org/pdf/2601.22156
InfLLM v2：https://arxiv.org/pdf/2509.24663

03. MiniCPM-SALA 實測表現，驗證架構可行性

任何架構創新最終都要回到模型表現。

MiniCPM-SALA 作為首個基于該結構完成大規模訓練的文本模型，在多個維度給出了比較清晰的數據結果。

模型參數規模為 9B，體量處于輕量級區間，卻能夠支持百萬 token 上下文推理。

關鍵在于 KV Cache 控制在 6GB 以下，這意味著普通消費級 GPU 也能完成推理任務。對于開發者來說，這直接降低部署門檻，使長上下文模型從數據中心專屬能力進入個人硬件可運行階段。

在長文本評測中，該模型展現出穩定優勢，尤其在跨章節信息整合、長鏈推理、代碼結構理解等任務中表現突出。

更值得關注的是，它在知識問答、數學推理、代碼生成等常規能力測試中仍保持與同規模全注意力模型相近水平，沒有出現性能折損現象，這說明混合結構并沒有犧牲通用智能能力。

模型同時引入 HyPE 混合位置編碼機制，使短文本和長文本處理能力保持一致，不會出現短輸入性能下降的問題。

推理速度方面的數據，對工程落地很有價值。

在云端推理芯片測試中，當上下文長度達到 256K token 時，MiniCPM-SALA 推理速度達到同規模全注意力模型約 3.5 倍，而且測試沒有使用投機采樣或額外加速技巧，結果完全來自架構本身。

對于企業部署來說，這類性能提升意味著成本直接下降，因為單位時間可處理請求數明顯增加。

端側的表現，同樣不錯。

當前很多模型在 8B 規模下運行 256K 上下文就會觸及顯存極限，而 MiniCPM-SALA 在消費級 GPU 上完成百萬上下文推理，這為手機、車載系統、機器人等終端設備運行通用模型打開空間。

端側模型一旦具備長上下文能力，個人助理類產品就能持續讀取用戶歷史數據并維持長期記憶，體驗會發生質變，這也是行業普遍認為下一階段智能終端競爭的關鍵指標。

04. 架構路線之爭，正在成為大模型競爭核心變量

大模型行業早期競爭集中在參數規模和訓練數據量，隨后轉向推理成本和部署效率，現在焦點逐漸落在底層結構設計上。

誰能在架構層找到更優解，誰就能在同等算力條件下跑出更高性能。

SALA 的出現，也讓我看到一種新的可能性：未來模型競爭不只看誰的模型更大，還要看誰的結構更合理。

我在想，這種變化對行業格局，也許會產生多米諾骨牌一樣的連鎖反應。

有硬件適配邏輯的改變：

當模型顯存需求下降，部署環境選擇范圍會擴大，GPU 不再是唯一選擇，邊緣計算設備也能承擔更多任務。

進一步，也會帶來應用生態會被重新洗牌：

長上下文能力成熟后，大量原本依賴數據庫或檢索系統的應用可能直接由模型完成，因為模型可以一次讀取全部資料并生成結果。

以及說，訓練策略會發生變化，HALO 這類遷移訓練方法降低新架構實驗成本，使更多團隊具備嘗試底層創新的能力。

從技術趨勢觀察，注意力機制很可能進入混合化階段。

單一路線難以同時滿足效率、精度、可擴展性三項指標，多結構協同會成為主流設計方向。

未來模型可能根據任務動態切換注意力模式，復雜推理使用高精度模塊，大規模掃描使用高效率模塊，這類自適應結構將成為研究重點。

最后有個好消息：看到面壁、OpenBMB、SGLang 與 NVIDIA，聯合發起了一個比賽。

比賽名字就叫《SOAR 2026 稀疏算子加速大獎賽》，已經正式開放報名了。

賽事圍繞混合注意力架構推理性能優化展開，重點方向包括算子融合、編譯優化與硬件協同調度，目標是在消費級 GPU 上進一步壓縮資源占用并提升百萬 token 推理速度。

而且還是面向全球開發者開放，官網報名入口：

https://soar.openbmb.cn/

對于關注推理效率、系統優化和模型架構的工程團隊來說，這是一次直接參與下一代推理基線定義過程的機會。

特別懸賞獎的獎金，甚至高達28萬！

感興趣的朋友，真的可以試一試～

參考閱讀：

GitHub 鏈接：

https://github.com/openbmb/minicpm

HuggingFace 鏈接：

https://huggingface.co/openbmb/MiniCPM-SALA

Model Scope 鏈接：

https://www.modelscope.cn/models/OpenBMB/MiniCPM-SALA

GitCode 鏈接：

https://ai.gitcode.com/OpenBMB/MiniCPM-SALA

MiniCPM-SALA 技術報告：

https://github.com/OpenBMB/MiniCPM/blob/main/docs/MiniCPM_SALA.pdf

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

網易云音樂，卡在算法和活人之間

鈦媒體APP 2026-02-24 15:56:08
77 跟貼 77
3個月4位至親相繼離世！定格在83、81、78、76歲，浙江網友引熱議

火山詩話 2026-04-12 17:45:19
807 跟貼 807

大佬深度解析：Coding Agent的底層運行邏輯是什么？

機器之心Pro 2026-04-13 10:24:10
0 跟貼 0

兩頭雄獅正在爭奪的權利，剛要研究硬件軟化技術，鬣狗卻來了

動物趣談1 2026-04-11 09:09:27
1 跟貼 1
輕量高效，即插即用：Video-RAG為長視頻理解帶來新范式

機器之心Pro 2025-10-20 18:23:17
0 跟貼 0

YC掌門人開源他的第二大腦：13年記憶，15000份文件，可接入龍蝦

DeepTech深科技 2026-04-12 16:53:11
17 跟貼 17

人類首例“被恐龍咬傷事件”！男子把頭伸進恐龍模型里被卡住，當事人：沒想到它會不松口大家別跟我學 #

開屏新聞客戶端 2026-04-11 18:04:45
12 跟貼 12
30B參數超越GPT-5！REDSearcher讓深度搜索Agent做到低成本可擴展

機器之心Pro 2026-03-09 13:28:51
0 跟貼 0

山西聞喜一男子被狗咬傷輾轉兩接種點等待6小時才接種

封面新聞 2026-04-12 16:37:28
880 跟貼 880
CVPR 2026 | 20步也能穩住畫質，這個擴散加速方法不一樣

機器之心Pro 2026-04-10 18:40:17
0 跟貼 0
在納斯卡,一支團隊發現了一個違背邏輯的異

趣知小故事 2026-04-12 13:50:54
1 跟貼 1
擠干大模型高分水分!最強模型僅49分,南大傅朝友發布Video-MME-v2

機器之心Pro 2026-04-13 10:12:23
0 跟貼 0
外國人在中國用手勢比劃點餐，全障礙語言但無障礙溝通。網友：中文含量0%，溝通效率100%

中國日報網 2026-04-12 18:40:25
104 跟貼 104
驚險！男子餓暈在高空，工友死死扛住其身體等來救援

環球網資訊 2026-04-12 14:50:12
470 跟貼 470
組裝川崎忍者模型套件

制造科技 2026-04-09 19:07:20
41 跟貼 41
張凌赫190cm人間邁巴赫建模神雙頂奢加身，顏值演技智商封神

娛樂在一起668 2026-04-10 07:00:30
3 跟貼 3
面試官說Dijkstra寫不出來就滾，我用2個循環讓他閉嘴

閃存獵手 2026-04-12 08:42:24
0 跟貼 0
匈牙利蒂薩黨在國會選舉中獲勝

環球網資訊 2026-04-13 06:59:05
0 跟貼 0
林肯航海家與凱迪拉克XT5動力參數、駕駛感受全面橫評

逗比評車 2026-04-09 23:51:56
5 跟貼 5
大鯊魚是冠軍！上海男籃提前4輪奪得CBA常規賽冠軍

上觀新聞 2026-04-12 21:54:06
82 跟貼 82
第2課慧凈電子HL-Car STM32全功能智能小車主板銅柱安裝

星慈光 2026-04-11 17:45:33
0 跟貼 0
谷歌創始人布林：當年發完Transformer論文，我們太不當回事了

機器之心Pro 2025-12-15 10:18:00
0 跟貼 0
今天分享一期我偶然間調出來的萬能修圖參數，希望你們都可以用到

小李是個攝象獅 2026-04-12 02:35:49
0 跟貼 0
進口滴眼液，從700多元漲至3000多元？

中國新聞周刊 2026-04-12 21:11:07
282 跟貼 282
10米/秒！國產人形機器人奔跑峰值速度接近人類巔峰，機器人能超越博爾特嗎

環球網資訊 2026-04-13 07:11:47
93 跟貼 93
函數空間作為向量空間 | 泛函分析第二講

集智俱樂部 2026-04-11 14:34:33
0 跟貼 0
禁忌的紅利：當Anthropic開始販賣“末日保險”

虎嗅APP 2026-04-13 03:28:10
1 跟貼 1
上海?蘇州，僅需5分鐘！這條可步行跨省的新路即將全面完工

東方網 2026-04-13 09:52:39
8 跟貼 8
為什么不能把楊柳樹都砍了？官方回應

BRTV新聞 2026-04-12 20:37:45
192 跟貼 192
彈頭劃過鋼軌的機械觸感 56式半自動單發裝填阻力與入膛的邏輯

武器知識 2026-04-13 01:08:15
0 跟貼 0
閉鎖前的動力銜接 56式半自動槍機框復進推彈與入膛的動作邏輯

武器知識 2026-04-12 12:50:59
0 跟貼 0
全錯！谷歌實錘AI越乖洗腦越深，現行安全指標淪為廢紙

新智元 2026-04-13 12:06:49
0 跟貼 0
36.4萬超聲圖文對！中國團隊構建首個大規模超聲專屬數據集

量子位 2026-04-12 15:16:51
0 跟貼 0
“馬斯克版微信”真的來了！

華爾街見聞官方 2026-04-13 11:47:32
0 跟貼 0
以軍坦克在黎南部沖撞聯黎部隊意大利車輛

海外網 2026-04-13 07:32:01
12 跟貼 12
捷途旅行者PLUS預售發布 XWD全自動智能四驅越野很友好

SuperStreet超級街 2026-04-12 21:02:09
0 跟貼 0
深圳理工大學將面向全國13個地區招生

中國青年報 2026-04-12 23:51:04
39 跟貼 39
彈盡瞬間的鋼鐵停頓經典56式半自動空倉掛機的反饋邏輯

武器知識 2026-04-10 23:53:03
0 跟貼 0
華為靳玉志：智能汽車零整不同步，用戶迫切需求硬件升級

極果酷玩 2026-04-12 00:05:34
0 跟貼 0
054B型護衛艦性能參數詳解：隱身、動力、武器全解析

因果 2026-04-11 23:44:49
0 跟貼 0

“臺灣永遠都不會是中國的一部分”，她被全民唾罵，被明星扇耳光

“臺灣永遠都不會是中國的一部分”，她被全民唾罵，被明星扇耳光

閱微札記

2026-02-28 20:01:18

臺灣地區前領導人馬英九：我不希望臺灣成為第二個香港！

臺灣地區前領導人馬英九：我不希望臺灣成為第二個香港！

阿腩講娛樂

2026-04-13 04:13:20

中國第1前鋒 31歲韋世豪霸氣回應工體看臺：10分造2球疑逃過紅牌

中國第1前鋒 31歲韋世豪霸氣回應工體看臺：10分造2球疑逃過紅牌

風過鄉

2026-04-12 22:09:39

長三角樓市迎來小陽春：南京連夜排隊搶房，杭州土拍“四月開門紅”

長三角樓市迎來小陽春：南京連夜排隊搶房，杭州土拍“四月開門紅”

界面新聞

2026-04-13 08:01:02

不到24小時，以色列迎來6個噩耗，內塔尼亞胡或將入獄4596年

不到24小時，以色列迎來6個噩耗，內塔尼亞胡或將入獄4596年

虎哥閑聊

2026-04-13 09:21:28

老板娘問我她穿絲襪好看嗎？我該怎么回答？

老板娘問我她穿絲襪好看嗎？我該怎么回答？

太急張三瘋

2026-04-13 08:36:29

談崩了！萬斯返回美國，特朗普通告全球：不準中國向伊朗提供武器

談崩了！萬斯返回美國，特朗普通告全球：不準中國向伊朗提供武器

小撇說事

2026-04-13 09:51:29

4月13日A股猛料：特朗普要封鎖霍爾姆茲海峽！全球股市或迎巨震？

4月13日A股猛料：特朗普要封鎖霍爾姆茲海峽！全球股市或迎巨震？

丁丁鯉史紀

2026-04-13 11:25:13

42歲女子頻繁胸悶心悸，心電圖和心臟彩超都正常，最后竟確診這病

42歲女子頻繁胸悶心悸，心電圖和心臟彩超都正常，最后竟確診這病

醫學原創故事會

2026-04-07 23:58:06

單依純不簡單啊

牛鍋巴小釩

2026-03-30 10:43:11

娜然首曬和霍啟山游玩意大利照片，素顏很美有氣質

娜然首曬和霍啟山游玩意大利照片，素顏很美有氣質

賈媽的幸福生活

2026-04-10 15:27:49

研究表明：男性嫖娼率6.4%，女性出軌率15%，且越有錢越開放！

研究表明：男性嫖娼率6.4%，女性出軌率15%，且越有錢越開放！

黯泉

2026-04-01 17:28:39

賭王何鴻燊女兒何超蕸安詳辭世揭長年苦戰乳癌養和醫院度過最后時光

賭王何鴻燊女兒何超蕸安詳辭世揭長年苦戰乳癌養和醫院度過最后時光

TVB資訊臺

2026-04-12 21:39:36

一夜之間，中國網球連奪2冠！吳易昺破荒，張帥解鎖全新紀錄！

一夜之間，中國網球連奪2冠！吳易昺破荒，張帥解鎖全新紀錄！

劉姚堯的文字城堡

2026-04-13 10:12:02

這絕對是史上最不禮貌的鍵盤

放毒

2026-04-11 10:53:19

世錦賽13日播報！常冰玉再打147,中國至少6人晉級，丁俊暉開心

世錦賽13日播報！常冰玉再打147,中國至少6人晉級，丁俊暉開心

曹說體育

2026-04-13 10:09:41

劉越評上海德比：申花板凳發揮更大戰斗力，海港控場能力下降

劉越評上海德比：申花板凳發揮更大戰斗力，海港控場能力下降

懂球帝

2026-04-13 11:55:10

皮爾斯：狀元簽肯定都是內定的蕭華直接讓老板們花幾十億競拍

皮爾斯：狀元簽肯定都是內定的蕭華直接讓老板們花幾十億競拍

硯底沉香

2026-04-12 20:31:14

小鵬把L4級線控轉向塞進50萬車，博世看了都愣

小鵬把L4級線控轉向塞進50萬車，博世看了都愣

Ping值焦慮

2026-04-13 09:34:48

50年的風水先生談陰宅：給祖墳添土的時候，這3個忌諱千萬別犯

50年的風水先生談陰宅：給祖墳添土的時候，這3個忌諱千萬別犯

千秋文化

2026-04-05 18:57:53

從硅谷到中關村，AI信息與測評

153文章數 6關注度

往期回顧全部

科技要聞

傳榮耀與字節跳動接洽“豆包手機”合作

頭條要聞

村民拴繩攔道致騎車13歲男孩被割喉：氣道、食管破裂

頭條要聞

村民拴繩攔道致騎車13歲男孩被割喉：氣道、食管破裂

體育要聞

一支球隊不夠爛，也是一種悲哀

娛樂要聞

賈玲減重后現身馮鞏生日宴身材未反彈

財經要聞

封鎖，還是收費站？

汽車要聞

不止命名更純粹領克10/10+要做純電操控新王

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

房產

家居

軍事航空

干細胞抗衰4大誤區,90%的人都中招

教育要聞

這8件幸福的小事，父母每周做兩件，養出高能量的小孩

房產要聞

土地供應突然暴跌！2026海口樓市，格局大變！

家居要聞

復古風格自然簡約

清新自然復古風尚
自在恣意侘寂風別墅
雅致愜意感知生活之美

軍事要聞

美國副總統萬斯：美伊談判未能達成協議

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

^{<blockquote id="xivfj"></blockquote>}

<cite id="xivfj"><rp id="xivfj"><pre id="xivfj"></pre></rp></cite>

<strong id="xivfj"><track id="xivfj"></track></strong>

<sub id="xivfj"></sub>

<cite id="xivfj"></cite>