<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      非Transformer架構新突破,液態神經網絡推理小模型只用900M內存

      0
      分享至

      編輯|冷貓

      谷歌 2017 年提出的 Transformer 架構事實上已經基本壟斷了大模型。

      不采用 Transformer 架構的大模型已經是少之又少,而采用非 Transformer 架構,還能與主流第一梯隊大模型扳手腕的,更是鳳毛麟角。

      不知道大家是否還有印象,當年有一個嘗試給大模型裝上「蟲腦」的初創公司,他們的研究人員受到秀麗隱桿線蟲的神經結構啟發,研發出一種新型的靈活神經網絡,也被稱為液態神經網絡。

      這是一個連續時間模型,由多個簡單的動態系統組成,這些系統通過非線性門相互調節。這種網絡的特點是時間常數可變,輸出通過求解微分方程得到。它在穩定性、表達能力和時間序列預測方面都優于傳統模型。

      除此以外,液態神經網絡的另一個特點是規模小得多,在 2024 年該架構就實現了 1.3B 大小的模型部署,但彼時尚未能與主流大模型一拼高下。

      提出液態神經網絡架構,并且做出 Liquid Foundation Models(LFM)大模型的,是由 MIT 計算機科學和人工智能實驗室 CSAIL 孵化,成立于 2023 年 3 月的初創公司 Liquid AI。

      就在剛剛,Liquid AI 又一次在 LFM 模型上放大招。他們正式發布并開源了 LFM2.5-1.2B-Thinking,一款可完全在端側運行的推理模型。



      Liquid AI 聲稱,該模型專門為簡潔推理而訓練;在生成最終答案前,會先生成內部思考軌跡;在端側級別的低延遲條件下,實現系統化的問題求解;在工具使用、數學推理和指令遵循方面表現尤為出色。

      該模型在手機上僅需900 MB 內存即可運行,同時在同等規模模型中實現了最快的推理速度和最佳的質量表現。兩年前還必須依賴數據中心才能完成的能力,如今已經可以在你的口袋里離線運行。



      • Leap 開源鏈接:https://leap.liquid.ai/models
      • HuggingFace 鏈接:https://huggingface.co/LiquidAI/LFM2.5-1.2B-Thinking

      優于 Transformer 的性能

      與 Liquid AI 之前的模型 LFM2.5-1.2B-Instruct 相比,LFM2.5-1.2B-Thinking 在三項能力上實現了顯著提升:

      • 數學推理:在 MATH-500 上從 63 提升至 88
      • 指令遵循:在 Multi-IF 上從 61 提升至 69
      • 工具使用:在 BFCLv3 上從 49 提升至 57

      在大多數推理基準測試中,LFM2.5-1.2B-Thinking 的表現已與甚至超過 Qwen3-1.7B,盡管其參數量少了 約 40%。





      同時,該模型在質量與測試時計算效率之間取得了良好平衡:與 Qwen3-1.7B(思考模式) 相比,它在使用更少輸出 token 的情況下,依然提供了更高的整體性能。



      在推理階段,這一性能差距進一步拉大:LFM2.5-1.2B-Thinking 在推理速度和內存效率兩方面,都優于純 Transformer 模型(如 Qwen3-1.7B)和混合架構模型(如 Granite-4.0-H-1B)。



      Liquid AI 表示,LFM2.5-1.2B-Thinking 在 智能體式(agentic)任務和高推理強度任務(例如工具使用、數學、編程)中表現尤為突出。當模型需要規劃一系列工具調用、驗證中間結果并動態調整解題策略時,其生成的推理軌跡能夠發揮實際價值。而在對話交互和創意寫作等場景下,則更推薦使用 LFM2.5-1.2B-Instruct。

      訓練細節

      要構建能力強的小型推理模型,關鍵在于:在知識容量有限的前提下,通過多步推理來彌補能力,同時又要保持答案簡潔,以滿足端側低延遲部署的需求。

      此前在 LFM-1B-Math 上的實驗表明,在中期訓練階段引入推理軌跡,有助于模型內化「先推理,再作答」的模式。隨后,基于合成推理軌跡進行的監督微調(SFT),進一步讓模型能夠穩定地產生思維鏈,而無需依賴特定格式的獎勵設計。

      然而,SFT 并不能解決推理模型中的一個常見問題:模型可能陷入重復文本模式,遲遲無法得出結論。這種行為通常被稱為「doom looping」(死循環式生成)。為此,Liquid AI 采用了一種相對直接的緩解方法:

      • 在偏好對齊階段,基于 SFT 模型生成了 5 個溫度采樣候選和 1 個貪婪解碼候選;當不存在循環時,選擇由 LLM 評判得分最高的作為正樣本、得分最低的作為負樣本;一旦出現循環生成,則無論評判得分如何,直接將出現循環的候選作為負樣本。
      • 在 RLVR 階段,進一步在訓練早期引入了基于 n-gram 的重復懲罰,以抑制循環生成行為。

      通過這些策略,模型在保持推理能力的同時,顯著降低了陷入無效循環的風險。



      這一方法在一個具有代表性提示詞的數據集上,將死循環生成的比例從 15.74%(中期訓練階段) 顯著降低到了 0.36%(RLVR 階段),效果非常直接且穩定。

      Liquid AI 的 RL 訓練流水線核心采用的是無 critic、類 GRPO 方法。整體實現是 reference-free 的,并結合了多項訓練技巧,包括:

      • 非對稱比例裁剪(asymmetric ratio clipping)
      • 對零方差提示組的動態過濾
      • 超長樣本掩碼(overlong-sample masking)
      • 不進行優勢歸一化(no advantage normalization)
      • 截斷的重要性采樣(truncated importance sampling)



      RL 方法的簡化示意圖:最終發布的 checkpoint 是一個合并模型,其「家族樹」中包含 25 個不同的子 checkpoint。

      Liquid AI 采用了一種高度并行的Curriculum RL 訓練框架,先以指令跟隨的 RLVR 作為基礎起點,再分叉出面向推理、數學、工具使用等不同領域的專項 checkpoint。

      這種并行結構不同于傳統的「單模型、多任務同時訓練」方式,往往會引發能力相互干擾。

      Curriculum RL 提供了更精細的控制粒度:每個領域的模型都可以獨立優化,擁有各自的獎勵設計、超參數和評估標準。隨后,我們在不同階段進行迭代式模型合并,生成在多種能力之間更均衡的新 checkpoint。

      實踐表明,模型合并在保留整體性能的同時,能夠有效吸收專項能力提升,是一條可行且可擴展的通用 RLVR 訓練路徑。

      此外,Liquid AI 正在全力拓展 LFM 系列模型的生態系統和合作伙伴。

      LFM2.5-1.2B-Thinking 實現了開箱即用支持,兼容最流行的推理框架,包括 llama.cpp、MLX、vLLM 和 ONNX Runtime。所有框架均支持 CPU 和 GPU 加速,覆蓋 Apple、AMD、Qualcomm 和 Nvidia 等硬件。

      為了確保 LFM2.5 系列 能夠在各種場景下高效運行,Liquid AI 正在快速擴展軟硬件生態系統,并歡迎 Qualcomm Technologies, Inc.、Ollama、FastFlowLM 和 Cactus Compute 作為新的合作伙伴加入。



      LFM2.5-1.2B-Thinking 在不同硬件設備上的長上下文推理表現。

      LFM2.5-1.2B-Thinking 可能只是個起點,但它已經證明了一件事 ——Transformer 并非唯一解,小而強的端側推理模型或許有更優解。

      更重要的是,運行推理模型的門檻越來越低,讓更多設備激發 AI 潛能,不論如何,都是一件美事。

      參考鏈接:https://www.liquid.ai/blog/lfm2-5-1-2b-thinking-on-device-reasoning-under-1gb#training-recipe

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      韓紅去上海買眼鏡,被店員2次提醒價格鬧笑話,網友:對自己真摳

      韓紅去上海買眼鏡,被店員2次提醒價格鬧笑話,網友:對自己真摳

      冷紫葉
      2026-01-20 00:57:00
      突然爆發! 華人遭集體抵制! 中文橫幅抗議大規模蔓延, 小紅書等中文媒體帖子成鐵證! 澳洲已有前車之鑒...

      突然爆發! 華人遭集體抵制! 中文橫幅抗議大規模蔓延, 小紅書等中文媒體帖子成鐵證! 澳洲已有前車之鑒...

      澳洲紅領巾
      2026-01-22 12:39:24
      殲-15幾乎全部退役,淪為全球最短命艦載機!它究竟有哪些短板?

      殲-15幾乎全部退役,淪為全球最短命艦載機!它究竟有哪些短板?

      小莜讀史
      2025-12-27 14:55:11
      河北孟村殺妻案二審判決書已送達,孩子撫養權官司已啟動

      河北孟村殺妻案二審判決書已送達,孩子撫養權官司已啟動

      九方魚論
      2026-01-22 13:10:54
      向華炎葬禮:倆兒子送別,77歲向華強綁麻布,孫女在靈堂笑惹爭議

      向華炎葬禮:倆兒子送別,77歲向華強綁麻布,孫女在靈堂笑惹爭議

      古希臘掌管月桂的神
      2026-01-20 14:17:59
      預虧21億元!永輝超市“胖改”成本賬:調改、停業損失12億元,關閉381家門店

      預虧21億元!永輝超市“胖改”成本賬:調改、停業損失12億元,關閉381家門店

      紅星新聞
      2026-01-22 07:35:21
      銀行大額存單利率步入“0字頭”時代

      銀行大額存單利率步入“0字頭”時代

      新華社
      2026-01-22 09:30:05
      黃健翔功不可沒!球迷實拍拜合拉木被打+致使越南球員染紅全過程

      黃健翔功不可沒!球迷實拍拜合拉木被打+致使越南球員染紅全過程

      側身凌空斬
      2026-01-22 09:31:51
      韓國孤兒宋宜:8歲被美國女星領養,貌丑心高,27歲嫁給63歲養父

      韓國孤兒宋宜:8歲被美國女星領養,貌丑心高,27歲嫁給63歲養父

      以茶帶書
      2026-01-21 17:22:43
      你知道哪些毀人三觀的事情?網友:雖然有點辣眼睛,但確實愛看哦

      你知道哪些毀人三觀的事情?網友:雖然有點辣眼睛,但確實愛看哦

      帶你感受人間冷暖
      2026-01-19 00:05:09
      喜家德水餃托盤被曝發霉存在大量霉斑,公司回應

      喜家德水餃托盤被曝發霉存在大量霉斑,公司回應

      大象新聞
      2026-01-22 13:05:03
      梁洛施罕見談離開李澤楷原因:他很富有,是一生摯愛,也不后悔

      梁洛施罕見談離開李澤楷原因:他很富有,是一生摯愛,也不后悔

      素素娛樂
      2026-01-21 09:55:35
      603778,“地天板”!

      603778,“地天板”!

      中國基金報
      2026-01-22 14:54:37
      王菲海哈金喜被反扒:原來,李亞鵬6段感情,是他人品的最好證明

      王菲海哈金喜被反扒:原來,李亞鵬6段感情,是他人品的最好證明

      菲兒愛蛋糕
      2026-01-20 17:35:33
      寶馬越野車被困汝河,60歲于東來跳入冰水施救,目擊者:他很熱心腸,專門返程救援

      寶馬越野車被困汝河,60歲于東來跳入冰水施救,目擊者:他很熱心腸,專門返程救援

      極目新聞
      2026-01-22 13:19:50
      美媒:為了得到克拉克斯頓和德羅贊,勇士正在想辦法促成三方交易

      美媒:為了得到克拉克斯頓和德羅贊,勇士正在想辦法促成三方交易

      移動擋拆
      2026-01-22 07:23:18
      留學圈近幾日傳出個新詞兒叫“帶球回國”,這是什么意思

      留學圈近幾日傳出個新詞兒叫“帶球回國”,這是什么意思

      西樓知趣雜談
      2026-01-21 15:01:44
      35歲教授辭鐵飯碗收廢電池,20年狂賺400億,如今車企搶著送錢

      35歲教授辭鐵飯碗收廢電池,20年狂賺400億,如今車企搶著送錢

      青眼財經
      2026-01-21 22:47:48
      最后48小時,無一國領導人確定出席,普京都不給特朗普留薄面

      最后48小時,無一國領導人確定出席,普京都不給特朗普留薄面

      蛙斯基娛樂中
      2026-01-22 05:34:06
      上海小區真實事件:一樓奶奶同意交電梯費,結果整棟樓早高峰全卡殼

      上海小區真實事件:一樓奶奶同意交電梯費,結果整棟樓早高峰全卡殼

      趣味萌寵的日常
      2026-01-20 15:00:21
      2026-01-22 15:31:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12166文章數 142547關注度
      往期回顧 全部

      科技要聞

      幾千億只是開胃菜,AI基建還得再砸幾萬億

      頭條要聞

      小伙騎車撞特斯拉后貸款賠1.5萬修車費 發票只開9千元

      頭條要聞

      小伙騎車撞特斯拉后貸款賠1.5萬修車費 發票只開9千元

      體育要聞

      珍妮回應爆料:湖人不感激詹姆斯付出絕非事實

      娛樂要聞

      鐘麗緹土耳其高空落淚 與張倫碩擁吻

      財經要聞

      申通快遞創始人被前夫索要股份

      汽車要聞

      今年集中上市 旅行車的春天可能真要來了

      態度原創

      房產
      時尚
      親子
      教育
      軍事航空

      房產要聞

      那個砸下400億的綠地,又要殺回海南了!

      50+女性穿衣沒頭緒?教你3個顯瘦還時髦的思路,照搬就好看

      親子要聞

      小姑娘的跆拳道太厲害了

      教育要聞

      時間定了!今年高考全國統考將于6月7日、8日舉行

      軍事要聞

      普京:愿意向"和平委員會"提供10億美元

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产大学生粉嫩无套流白浆| 国产又爽又黄又无遮挡的激情视频| 三级九九| 精品人妻一区二区三区-国产精品| 亚洲精品国产av一区二区| 无码av免费精品一区二区三区| 香蕉久久一区二区不卡无毒影院| 91视频专区| 成人国产亚洲欧美成人综合网 | 欧美成人免费全部| 一级天堂| www.国产在线观看| 色综合热无码热国产| 影音先锋中文字幕人妻| 无码人妻丰满熟妇a片护士| 中文字幕人乱码中文字幕| 黑人大战欲求不满人妻| 麻豆AV电影| 久久久精品456亚洲影院| 亚洲中文字幕版| 成在线人午夜剧场免费无码| 色二av手机版在线| 国产成人精品高清在线观看93| 久久精品一本到东京热| 久久成人亚洲香蕉草草| 国产无遮挡又黄又爽免费网站| 伊人啪啪| 日韩一区二区在线观看视频 | 最新国产精品久久精品| 91免费在线视频| 亚洲av永久无码精品一百度影院| 亚洲综合天堂av网站在线观看| 成人无码AV片| 少妇人妻偷人精品视频| 国产老熟女伦老熟妇露脸| 手机AV网址| 视色网| 亚洲伊人成综合网2222| mm1313亚洲国产精品| 日韩亚洲国产综合二区| 无码精品a∨在线观看中文|