<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      給AI做微創手術:哈工大博士發明新算法,5分鐘讓大模型減重近半

      0
      分享至

      作為一名 AI 領域的博士生,徐玉莊的經歷比較特殊。本科畢業于國防科技大學,隨后在部隊工作了 5 年,接著在清華大學獲得碩士學位,目前在哈爾濱工業大學讀博。


      圖 | 徐玉莊(來源:徐玉莊)

      由其擔任第一作者的一篇論文于近日被 AAAI 2026 接收,在論文中他和所在團隊打造出一種名為 CAMERA 的新技術,該技術能在短短五分鐘,為一個擁有 570 億參數的巨型模型 Qwen2-57B-A14B 完成一次全面的冗余檢查,并在此基礎上進行高效的修剪和壓縮,從而讓大模型在手機、平板等小型設備上的高效運行距離普通人更進一步。

      徐玉莊告訴 DeepTech:“我們的方法能夠實現精準剪枝 20% 后模型效果幾乎無損。我甚至有一個或許還值得討論的提議就是,基礎模型訓練團隊可以用我們這個分析框架判斷自己的模型是不是充分訓練了,如果沒有或許值得多訓一些?!?/p>

      思維大轉變:從修剪枝葉到修剪神經元

      此次成果要解決的問題是:想象一下,你有一個由上百位不同領域的專家組成的超級智庫,每當你問一個問題,一個聰明的調度員就會根據問題類型,立刻叫出其中幾位最擅長的專家來為你解答。這就是當前的大模型內部的一種名為混合專家模型的先進工作方式,它讓 AI 擁有了處理海量知識和復雜任務的能力。

      然而,這個超級智庫有一個幸福的煩惱:專家太多了。雖然每次只需要激活幾位,但是所有專家的知識儲備也就是模型參數都需要時刻準備著,這會帶來驚人的計算消耗和存儲成本。

      更關鍵的是,人們發現增加專家數量帶來的性能提升,遠不如增加的成本那么明顯,這意味著智庫里存在大量的冗余或不那么關鍵的知識。

      而徐玉莊等人就像是給這個巨型大腦做手術的神經外科醫生,他們發現了一種更加精妙的手術方案,不僅能讓大模型大幅瘦身,還能保持甚至提高其智商。


      (來源:資料圖)

      在過去,人們為了讓混合專家模型(MoE,Mixture of Experts)瘦身,主要采用兩種粗放式的方法:

      第一種方法是專家級修剪,即直接砍掉整個專家,就好比由于某個專家的偶爾懶散,因此把他的整個團隊解散了,但這難免會丟失重要知識;

      第二種方法是專家級合并,即把幾個看似相似的專家合并為一個,這就像讓一位文學教授去教高等數學,往往效果不佳。

      這些方法之所以效果有限,是因為它們要么把一個專家當做不可分割的整體來決定去留,要么僅局限于對單個參數矩陣進行孤立地壓縮。但是,徐玉莊等人想到一個更加本質的視角:為什么不看得更細一點呢?

      基于此,他們提出了微專家這樣一個全新的概念。如果把每個專家看做一個功能部門,那么微專家就是這個部門里最基礎的、一個個獨立負責具體任務的神經元或工作小組。

      關鍵在于,一個微專家是由跨三個矩陣的特定行列共同定義的,它們通過協同工作完成了一個最基礎的知識轉換動作。

      整個 MoE 層的輸出,實際上是所有微專家工作成果的加權綜合。徐玉莊等人的核心發現是:在不同的任務場景下,這些微專家的貢獻天差地別。大部分輸出其實是由一小部分至關重要的微專家決定的,而很多微專家則貢獻甚微,存在大量的冗余和馬太效應。

      這就好比在解答如何做番茄炒蛋這一問題時,負責烹飪技巧和食材特性的微專家大放異彩,而負責量子物理的專家則幾乎在圍觀。

      傳統的粗放修剪可能會誤傷重要的烹飪專家,或者把量子物理專家硬塞進烹飪團隊。而 CAMERA 的思路是:精準定位每一個圍觀或者低效的微專家,然后以幾乎無傷害的方式剔除它。


      (來源:資料圖)

      CAMERA 算法:給每個微專家打分的智能秤

      那么,如何從數以萬計的微專家中,快速準確地找出誰重要、誰冗余呢?這聽起來像是一個超級復雜的組合優化問題,在數學上被證明是 NP 難題,即無法在短時間內精確求解。

      但是,徐玉莊等人的巧思在于:他們設計了一個極其巧妙的近似估計算法,為每個微專家定義了一個能量指標。

      這個能量由兩部分決定:

      第一部分是激活系數,它指的是當模型處理不同問題的時候,這個微專家被調用的頻繁程度和強度;第二部分是權重向量范數,它指的是微專家自身知識儲備的規模大小。

      一個微專家的能量越高,意味著它越經常得到使用,而且自身承載的知識量越大,也就越重要。相反,能量極低的,就是可以優先考慮修剪的冗余部分。

      CAMERA 算法利用一個很小的校準數據集比如 128 段文本,就能在幾分鐘內為模型所有層中的所有微專家計算出來能量并進行排序。這就像使用一把智能秤,可以快速地稱出來每個工作小組的貢獻度。

      更令人贊嘆的是,他們從數學上證明了基于這種能量排序的修剪策略,其效果與理論上的最優的壓縮方法之間的差距不僅很小而且是可控的,這為 CAMERA 的可靠性和有效性提供了堅實的理論背書。


      (來源:資料圖)

      CAMERA-P:一把精準的大模型手術刀

      有了精準的微專家能量排名,就可以開始做手術了,這就是 Camera-P,P 指的是 Pruning,也就是修剪的意思。

      Camera-P 的目標是:按照設定的比例比如 20% 或者 40%,移除能量最低的那部分微專家。具體操作非常的結構化,對于一個被選中的冗余微專家,Camera-P 會將其對應的三個矩陣中的特定行或特定列同時置零或直接剪除。

      這樣做的好處是顯而易見的:

      首先,可以保持功能完整,避免了過去單獨修剪某個矩陣可能造成的功能失調;其次,可以真正實現加速推理,被置零的權重在計算時會被跳過,這直接可以減少計算量,提高模型的運行速度;再次,無需進行重新訓練,整個過程是訓練后的,無需使用大量數據來重新訓練模型。

      實驗結果表明:Camera-P 在多個主流 MoE 模型上比如 DeepSeek-MoE-16B、Qwen2-57B 上,從 20% 到 60% 的不同修剪比例下,在語言理解、常識推理、數學問題等 9 項任務上的表現,都超越了之前最好的方法。尤其在高達 60% 的激進修剪下,模型性能下降遠遠小于其他方法,展現了驚人的魯棒性。


      (來源:資料圖)

      CAMERA-Q:給重要知識進行高保真,給次要知識省空間

      除了直接修剪,另一種常見的模型壓縮技術是量化,即降低存儲每個權重數值所需的比特位數,比如從 16 比特降低到 4 比特,這就像把高清無損音樂轉換成 MP3,在盡量保持聽感的同時大幅減少文件體積。

      現有的 MoE 量化方法主要是在專家級別分配不同的精度也就是比特數,比如給活躍的專家高精度,給不活躍的專家低精度。但是,徐玉莊等人認為這仍然不夠精細,每個專家內部也有重要的微專家和次要的微專家。

      于是,他們提出了 CAMERA-Q,Q 指的是 Quantization,就是量化的意思。它利用 CAMERA 得到全局微專家的能量排名,然后在每個專家內部進行混合精度分配。

      具體來說:能量排名最高的那一小部分微專家,分配較高的比特位,精心保留其知識細節;能量中等的那一小部分微專家,分配標準的比特位比如 2 比特;能量最低的那一小部分微專家,分配較低的比特位比如 1 比特,從而可以大大節省空間。

      這種方法的精妙之處在于,它確保了每個微專家內部三個矩陣的精度是一致的,避免了好比“一條腿穿皮鞋,一條腿穿草鞋”的尷尬,維護了基本功能單元的完整性。

      實驗證明,這種微專家感知的量化策略,在激進的 2 比特平均精度下,效果顯著優于傳統的專家級量化方法。

      CAMERA 技術的意義遠不止于學術論文中的漂亮數據。它為解決大模型落地應用的核心瓶頸——計算成本與存儲開銷提供了一套高效、實用的解決方案。


      (來源:資料圖)

      徐玉莊表示:“在路線上,我們首次把大模型的壓縮單元從一個權重矩陣內部擴展到了跨越多個權重矩陣的情形,首次把微專家這個功能完備的微結構作為剪枝或混合精度配置對象。”

      在方法論上,這一研究也首次在數學上給出混合微專家的簡潔表示形式,首次描述微專家壓縮這一最優化問題并給出一個還算簡單有效的解決方案。

      未來,人們或許能在手機、平板電腦甚至智能手表上,運行如今需要龐大算力支撐的尖端 AI 模型。CAMERA 技術能讓這些模型在保持高性能的同時,體積更小、耗電更少、響應更快。

      對于提供 AI 服務的公司來說,模型壓縮意味著可以用更少的服務器資源來服務更多的用戶,從而可以降低運營成本,最終可能讓 AI 服務的價格得到降低。

      在生物、醫藥、材料等需要復雜 AI 模擬的科研領域,研究者們往往受限于計算資源,而更加輕量級的強大模型,能讓更多科研機構參與前沿探索。

      CAMERA 尤其是 CAMERA-P 還可以和其他模型壓縮技術進行無縫結合,從而實現組合拳般的效果,進而達到更高的壓縮率。

      如前所述,徐玉莊目前在哈爾濱工業大學讀博。此外,他也在以端側大模型業務見長的面壁智能擔任實習算法研究員。未來,他將繼續深耕大模型領域。

      參考資料:

      相關論文 https://arxiv.org/pdf/2508.02322

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      洪森兒媳發聲!中方114億援助物資到柬,王毅有何新要求?

      洪森兒媳發聲!中方114億援助物資到柬,王毅有何新要求?

      時時有聊
      2025-12-29 22:02:43
      一頓飯11個菜,客廳大得能打球,哭窮的閆學晶害慘“啃老”的兒子

      一頓飯11個菜,客廳大得能打球,哭窮的閆學晶害慘“啃老”的兒子

      娛小北
      2025-12-28 23:49:54
      她和奧運冠軍馬琳離婚分走千萬,再婚嫁給金融學霸,如今怎樣了?

      她和奧運冠軍馬琳離婚分走千萬,再婚嫁給金融學霸,如今怎樣了?

      優趣紀史記
      2025-12-28 14:47:11
      A股:大家要做好心理準備,不出所料,12月31日,周三可能這樣走

      A股:大家要做好心理準備,不出所料,12月31日,周三可能這樣走

      有范又有料
      2025-12-30 15:47:39
      張鎮麟把廖三寧弊端防出來了!沒三分,沒終結,卻在垃圾時間刷分

      張鎮麟把廖三寧弊端防出來了!沒三分,沒終結,卻在垃圾時間刷分

      籃球資訊達人
      2025-12-30 00:55:28
      張本智和徹底翻臉!拒交四成獎金,自掏腰包組建六人“對抗軍”

      張本智和徹底翻臉!拒交四成獎金,自掏腰包組建六人“對抗軍”

      破鏡難圓
      2025-12-29 22:38:09
      約基奇21+8傷退掘金慘負熱火 鮑威爾25分引8人上雙大勝

      約基奇21+8傷退掘金慘負熱火 鮑威爾25分引8人上雙大勝

      醉臥浮生
      2025-12-30 10:49:11
      以好色出名的抗日名將,逃跑本事無人能比,卻能屈能伸活到103歲

      以好色出名的抗日名將,逃跑本事無人能比,卻能屈能伸活到103歲

      古書記史
      2025-12-22 19:52:23
      廣東98-74迎8連勝后!杜鋒又收4好消息,3外援57分,搶46籃板

      廣東98-74迎8連勝后!杜鋒又收4好消息,3外援57分,搶46籃板

      老吳說體育
      2025-12-30 21:28:54
      剛領完離婚證,前夫將婆婆送來:你幫我伺候幾天,我冷笑:想的美

      剛領完離婚證,前夫將婆婆送來:你幫我伺候幾天,我冷笑:想的美

      船長與船1
      2025-12-30 12:01:29
      西媒:總價超8000萬歐 切爾西計劃用哈托+錢交換費爾明

      西媒:總價超8000萬歐 切爾西計劃用哈托+錢交換費爾明

      智道足球
      2025-12-30 19:16:03
      家里有一個糊涂的人,日子過得能有多絕望 網友:凈拖后腿

      家里有一個糊涂的人,日子過得能有多絕望 網友:凈拖后腿

      另子維愛讀史
      2025-12-30 20:31:45
      廣西經濟最落后的十個縣城 1.都安瑤族自治縣 2.那坡縣

      廣西經濟最落后的十個縣城 1.都安瑤族自治縣 2.那坡縣

      金哥說新能源車
      2025-12-30 11:28:20
      曹穎自曝患癌時日無多,含淚坦言最怕看不到兒子長大,心痛萬分!

      曹穎自曝患癌時日無多,含淚坦言最怕看不到兒子長大,心痛萬分!

      老特有話說
      2025-12-29 22:29:41
      林徽因為何反對國徽用康乾線條?她只說了一句:去霍去病墓前看看

      林徽因為何反對國徽用康乾線條?她只說了一句:去霍去病墓前看看

      丞丞故事匯
      2025-12-29 00:38:31
      成飛官宣殲-36的名字,太好聽了,出自何處呢?

      成飛官宣殲-36的名字,太好聽了,出自何處呢?

      世家寶
      2025-12-30 16:32:27
      在岸人民幣兌美元升至2023年5月以來最強水平

      在岸人民幣兌美元升至2023年5月以來最強水平

      每日經濟新聞
      2025-12-30 12:58:08
      兩性關系:女人喜歡你,但不讓親嘴,不是不愛,而是藏這幾種心理

      兩性關系:女人喜歡你,但不讓親嘴,不是不愛,而是藏這幾種心理

      風月得自難尋
      2025-12-30 15:14:10
      殲-20飛掠花蓮軍事基地!強度前所未有:“雙尾蝎”飛臨臺北上空

      殲-20飛掠花蓮軍事基地!強度前所未有:“雙尾蝎”飛臨臺北上空

      文雅筆墨
      2025-12-30 11:32:26
      新款寶馬5系要來了!外形回歸沉穩,若依舊只賣30多萬,你買嗎?

      新款寶馬5系要來了!外形回歸沉穩,若依舊只賣30多萬,你買嗎?

      優視汽車
      2025-12-30 18:02:33
      2025-12-30 22:11:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16057文章數 514443關注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨角獸

      頭條要聞

      車主質疑步行街停車掃私人碼繳費不合規 物業公司回應

      頭條要聞

      車主質疑步行街停車掃私人碼繳費不合規 物業公司回應

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰女友被扒 父親涉經濟案卷款13億?

      財經要聞

      朱光耀:美關稅政策正使WTO名存實亡

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      時尚
      游戲
      藝術
      本地
      軍事航空

      她的發型又火了!年底做頭發,不妨從這篇找找靈感

      《黑神話》馮驥出道網易云?這次真拿“年度最佳”

      藝術要聞

      謝稚柳雪景山水20圖

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      軍事要聞

      福建海警艦艇與臺海巡船對峙航行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 北安市| 伊人毛片| 久久青草国产精品一区| 一区二区三区无码高清视频| 亚州成人无码| jizz国产| 免费看的一级毛片| 国产伦精品免编号公布| 成人午夜福利视频后入| 丰满熟女乱婬A片六区| 国产AV无码专区亚洲AV漫画| 曰本女人牲交全视频播放| 国产手机在线αⅴ片无码观看| 91手机在线视频| 亚洲精品日韩在线观看| 特大巨黑吊av在线播放| 久久国产精品精品国产色婷婷| 国产网友自拍| jizzjizz视频| 亚洲成人网在线观看| 亚洲中文字幕久久精品无码喷水| 男人下部进女人下部视频| 错那县| A片精品| 天天影视色香欲综合久久| 欧美粗大猛烈老熟妇| 97免费公开在线视频| 一区二区三区视频| 午夜剧场黄色| 久久久av男人的天堂| 国产亚洲成av人片在线观看| 色av永久无码影院av| 色猫AV| 免费av网站| 亚洲成a人片网站| 99久久激情国产精品| 精品熟女亚洲av在线观看| 亚洲精品国产精品国自产| 无码精品国产va在线观看dvd| 99国产成人| 中文字幕在线日韩|