<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      小模型,也是嵌入式的未來

      0
      分享至

      這兩天,英偉達一個最新研究結論讓業界備受關注——小型語言模型(SLM)才是智能體的未來。緊接著,英偉達又拋出了自己的全新小型語言模型:Nemotron-Nano-9B-V2,該模型在部分基準測試中達到了同類產品中的最高性能。

      事實上,小型語言模型(SLM)的風,也刮到了MCU和MPU領域。

      小模型,就是“壓小”的大模型

      小型語言模型(SLM)也許我們早有所接觸。SLM 的參數范圍從幾百萬到幾十億不等,而 LLM 則具有數千億甚至數萬億參數。

      SLM是由LLM壓縮而來,壓縮模型需要在縮小模型的同時,盡可能保留模型的準確性。常見方法如下:

      • 知識蒸餾:利用從大型“教師”模型轉移的知識來訓練一個較小的“學生”模型;

      • 剪枝:移除神經網絡架構中冗余或不那么重要的參數;

      • 量化:降低計算中使用的數值精度(例如,將浮點數轉換為整數)。

      小型語言模型比大型模型更緊湊、更高效。因此,SLM需要較少的內存和計算能力,非常適合資源受限的邊緣或者嵌入式設備。

      許多小而強大的語言模型已經出現,證明大小并非一切。常見的10億到40億的SLM包括Llama3.2-1B(Meta開發的10億參數變體)、Qwen2.5-1.5B(阿里巴巴的15億參數模型)、DeepSeeek-R1-1.5B(DeepSeek的15億參數模型)、SmolLM2-1.7B(HuggingFaceTB,的17億參數模型)、Phi-3.5-Mini-3.8B(微軟的38億參數模型)、Gemma3-4B(Google DeepMind的40億參數模型)。

      跑SLM,靠得不光是算力

      對MPU來說,跑SLM,似乎不是什么難題。但對開發人員來說,如何知道MCU支持是否支持運行生成式AI?

      這個問題沒有單一、直接的答案——不過有一個硬性要求,即MCU的神經處理單元(NPU)必須能夠加速Transformer運行。

      除此之外,跑生成式AI,對于MCU的帶寬系統總線以及以及大容量、高速、緊密耦合的內存配置有要求。

      其實,現在很多人都去只用GOPS(十億次運算每秒)或TOPS(萬億次運算每秒)來比較微控制器的原始吞吐量,目前性能最佳的MCU能提供高達250GOPS的算力,而用于生成式AI的MCU將至少提供兩倍于此的性能。但原始吞吐量并非衡量實際系統性能的理想指標。

      因為成功的生成式AI應用程序需要支持Transformer運算,會在系統內部、內存、神經處理單元、中央處理器以及圖像信號處理器等外圍功能之間傳輸大量數據。因此,一個具有高原始吞吐量的系統理論上或許能快速處理大量數據,但如果系統無法將數據快速傳輸給神經處理單元,實際性能就會十分緩慢,令人失望。

      當然,對MPU來說,大帶寬、內存、總線之間的緊密耦合也至關重要。

      Aizip與Renesas合作的SLM項目

      早在去年8月,Aizip就與Renesas攜手合作,在MPU上展示了用于邊緣系統應用的超高效SLM和緊湊型AI Agents,這些小巧而高效的模型已經集成到基于 Arm Cortex-A55的Renesas RZ/G2L和RZ/G3S主板中。

      Aizip創建了一系列超高效的小型語言模型(SLM)和人工智能代理(AI Agents),名為 Gizmo,規模從3億到20億個參數不等。這些型號支持多種平臺,包括適用于廣泛應用的 MPU和應用處理器。

      SLM使設備邊緣應用程序上的AI代理能夠提供與大型語言模型(LLM)相同的功能,但在邊緣占用空間上。設備上模型具有增強的隱私保護、彈性作和節省成本等優勢。雖然一些公司已經成功地減小了手機語言模型的大小,但確保在低成本邊緣設備上為自動化應用提供準確的工具調用仍然是這些 SLM 面臨的重大挑戰。

      據介紹,在運行頻率為1.2 GHz的單個A55內核的RZ/G2L上,這些SLM可以實現不到3秒的響應時間。

      MCU,也在加大對SLM投入

      Alif Semiconductor最近發布了最新系列的MCU和融合處理器——Ensemble E4、E6和E8,便主要針對支持SLM在內的生成式AI模型的運行。與此同時,Alif是首家使用 Arm Ethos-U85 NPU(神經處理單元)的芯片供應商,該芯片支持基于Transformer的機器學習網絡。

      根據基準測試結果顯示,該系列在不到2毫秒的時間內進行高能效物體檢測、圖像分類時間不到8毫秒、在E4設備上執行的SLM在生成文本以根據用戶提供的提示構建故事時僅消耗36mW的功率。

      Ensemble E4(MCU)采用雙Arm Cortex-M55內核,Ensemble E6和E8融合處理器分別基于Arm Cortex-A32內核和雙Cortex-M55內核,值得注意的是E4/E6/E8均搭載雙Ethos-U55+Ethos-U85,算力非常強大。


      Alif認為,相比其他制造商,他們布局更早,因為第一代Ensemble MCU系列早在2021年就發布了,從那時起我們就一直在批量出貨E1、E3、E5 和 E7設備。而在其他MCU廠商還停留在第一代AI MCU時,Alif就發布了第二代產品,同時是業界首款支持基于Transformer的網絡的MCU,是LLM和其他生成式AI模型的基礎。

      SLM會是嵌入式的未來

      SLM在大幅壓縮模型體積的同時,盡可能保留了模型的準確性。這種高效、緊湊的特性,使其完美契合了資源受限的邊緣和嵌入式設備,為這些設備帶來了前所未有的智能能力。

      事實上,邊緣AI的未來圖景正在徐徐展開,SLM也會是MCU和MPU廠商會布局的關鍵領域之一。

      比如,意法半導體的STM32N6、英飛凌PSoC Edge最新一代MCU、TI的AM62A和TMS320F28P55x、恩智浦的i.MX RT700和i.MX 95、ADI的MAX7800X都開始重視NPU。

      嵌入式AI最初主要是在Linux系統上運行的相對昂貴的基于微處理器的產品的一項功能。但很快,市場意識到邊緣和端點設備中也有AI的空間——其中許多設備都是基于MCU。所以,在2025年下半年,先進的MCU廠商都將提供AI功能的產品納入其產品組合中。這些廠商的NPU分為Arm Ethos IP一派和自研一派。目前來看,最新的Ethos-U85開始支持Transformer,并且在半年前展示了搭載SLM的效果,其他廠商也在不斷跟進。在未來,相信SLM也會徹底改變MCU和MPU的格局。

      參考文獻

      [1]IBM:https://www.ibm.com/cn-zh/think/topics/small-language-models

      [2]Hugging-Face:https://hugging-face.cn/blog/jjokah/small-language-model

      [3]Alif:https://alifsemi.com/comparing-mcus-for-generative-ai-its-not-just-about-the-gops/

      [4]Alif:https://alifsemi.com/who-wins-in-the-race-to-make-ai-mcus/

      [5]Arm:https://newsroom.arm.com/blog/small-language-model-generative-ai-edge

      歡迎將我們設為“星標”,這樣才能第一時間收到推送消息。

      關注EEWorld旗下訂閱號:“機器人開發圈”

      回復“DS”領取《DeepSeek:從入門到精通》完整版

      掃碼添加小助手回復“機器人”

      進群和電子工程師們面對面交流經驗


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      8天8漲停,又一“超級大妖股”橫空出世

      8天8漲停,又一“超級大妖股”橫空出世

      財經銳眼
      2026-03-27 18:55:36
      徹底放飛!Lisa29歲生日曬泳裝照,大膽露臀表情夸張,面相都變了

      徹底放飛!Lisa29歲生日曬泳裝照,大膽露臀表情夸張,面相都變了

      橙星文娛
      2026-03-27 13:57:30
      99年陪女老板跑戈壁車壞,我想睡后廂,她拉開車門:“上來!”

      99年陪女老板跑戈壁車壞,我想睡后廂,她拉開車門:“上來!”

      白云故事
      2026-03-07 22:10:03
      美伊一戰,“打醒”3個亞洲國家,中國已經不用再多說啥了!

      美伊一戰,“打醒”3個亞洲國家,中國已經不用再多說啥了!

      健身狂人
      2026-03-27 18:42:09
      中央定調,2026年養老金或繼續調整,養老金4000元能漲100元嗎?

      中央定調,2026年養老金或繼續調整,養老金4000元能漲100元嗎?

      夜深愛雜談
      2026-03-27 17:49:53
      星鏈之后,馬斯克又推出顛覆性計劃

      星鏈之后,馬斯克又推出顛覆性計劃

      九萬里
      2026-03-26 08:53:08
      廣東3消息!徐杰最新傷情,杜鋒罕見表揚球隊,焦泊喬正式離隊

      廣東3消息!徐杰最新傷情,杜鋒罕見表揚球隊,焦泊喬正式離隊

      多特體育說
      2026-03-27 22:51:14
      央視直播:中國U19戰澳大利亞U19,07國青隊沖擊世青賽

      央視直播:中國U19戰澳大利亞U19,07國青隊沖擊世青賽

      民哥臺球解說
      2026-03-27 20:06:08
      最壞情況發生,美軍艦載機在沿海被擊中,白宮意識到大國出手了!

      最壞情況發生,美軍艦載機在沿海被擊中,白宮意識到大國出手了!

      精彩瞬間回顧
      2026-03-28 01:53:31
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      部分娃哈哈宏勝工廠停產,有工廠已放假

      部分娃哈哈宏勝工廠停產,有工廠已放假

      界面新聞
      2026-03-27 14:59:14
      續航680km!豐田4月8日新車預售,混動技術太強悍

      續航680km!豐田4月8日新車預售,混動技術太強悍

      西莫的藝術宮殿
      2026-03-27 00:23:24
      中國可能在等,把三大主要問題解決了,再徹底解決臺灣問題

      中國可能在等,把三大主要問題解決了,再徹底解決臺灣問題

      論事的老樞
      2026-03-21 17:28:10
      為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

      為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

      南宗歷史
      2026-03-27 17:43:32
      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      深度報
      2026-02-11 23:35:03
      邱岳峰服藥被緊急送醫,全力救治終未能挽回生命

      邱岳峰服藥被緊急送醫,全力救治終未能挽回生命

      嘮叨說歷史
      2026-03-17 14:35:56
      古代與現代對亂倫概念的理解大相徑庭,真相揭示三觀沖擊!

      古代與現代對亂倫概念的理解大相徑庭,真相揭示三觀沖擊!

      特約前排觀眾
      2026-03-27 00:05:10
      整院騰退新方法,原拆原建!崇外6號地升級為磁器口東城市更新!

      整院騰退新方法,原拆原建!崇外6號地升級為磁器口東城市更新!

      家住東西城
      2026-03-27 20:18:53
      150億,拼多多開始搞自營了

      150億,拼多多開始搞自營了

      財天COVER
      2026-03-27 12:50:36
      含劇毒,無解藥!每家每戶都有,千萬別亂吃

      含劇毒,無解藥!每家每戶都有,千萬別亂吃

      周哥一影視
      2026-03-22 17:19:26
      2026-03-28 06:39:00
      EEWorld電子工程世界 incentive-icons
      EEWorld電子工程世界
      即時參與討論電子工程世界最火話題,搶先知曉電子工程業界資訊。
      262文章數 22關注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

      頭條要聞

      男醫生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      頭條要聞

      男醫生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      體育要聞

      邵佳一:足球就像一場馬拉松

      娛樂要聞

      范瑋琪加盟,官宣《浪姐7》遭全網抵制

      財經要聞

      我在小吃培訓機構學習“科技與狠活”

      汽車要聞

      與眾08,金標大眾不能輸的一戰

      態度原創

      時尚
      房產
      手機
      家居
      本地

      推廣中獎名單-更新至2026年3月11日推廣

      房產要聞

      6.8萬方!天河員村再征地,金融城西區開發全面提速

      手機要聞

      iPhone 18爆料:只有靈動島變小了?

      家居要聞

      曲線華爾茲 現代簡約

      本地新聞

      在濰坊待了三天,沒遇到一個“濰坊人”

      無障礙瀏覽 進入關懷版