網易首頁 > 網易號 > 正文申請入駐

谷歌把這技術藏了3年，500步訓練讓7個模型"自動組隊"

2026-03-25 15:47:54　來源: 野生運營

北京舉報

分享至

聯邦學習（Federated Learning）有個老毛病：各家公司把模型練得再精，合起來反而更差。KALAVAI團隊用一套新機制，讓7個獨立訓練的"專科醫生"自動學會會診——全程不交換任何原始數據。

數據不出域，模型怎么"抱團"

傳統思路是中央集權：把數據收上來，練一個大模型。但醫療、金融、小語種場景里，數據根本動不了。KALAVAI反過來操作：把基礎模型 checkpoint（檢查點）分發出去，各參與方用自己的數據微調，再把模型權重交回來。

這里有個反直覺的點：模型 diverge（發散）得越厲害，融合后效果越好。如果各方數據太像，微調后的模型長得差不多，融合就是七個克隆人開會，毫無意義。只有數據足夠多樣，模型參數"各奔東西"，才能互補。

谷歌研究院 2022 年的實驗顯示，用 KALAVAI 融合 7 個語言專家模型，在低資源語言任務上比單模型平均提升 23%。關鍵是，整個路由網絡只訓了 500 步——相當于讓七個專家在半小時內學會互相打配合。

500步訓練的"門控系統"

融合的核心是個輕量級 Mixture of Experts（混合專家）路由。它不看原始數據，只看輸入 token 的特征，實時決定該激活哪個專家。門控函數的權重直接對應"這個輸入更像誰的專業領域"。

訓練路由用的是混合數據——從各專家的訓練集里采樣拼湊。這里容易翻車：如果路由過擬合，見到陌生輸入就懵；如果學歪了，把法語句子派給阿拉伯語專家，直接 domain mismatch（領域錯配）。KALAVAI 的解法是把驗證集誤差寫進損失函數，強制路由保持"謙虛"。

整個流程零梯度共享、零數據共享。參與方只上傳最終的模型權重，連訓練過程中的中間狀態都不暴露。這比傳統的聯邦平均（FedAvg）更進一步——后者好歹還要傳梯度。

誰該緊張，誰該興奮

對小語種研究者，這是救命稻草。斯瓦希里語、冰島語的數據持有者再也不用把語料交給大廠，自己訓完模型，扔個 checkpoint 進池子就行。對醫療 AI 更關鍵：醫院 A 的腫瘤數據、醫院 B 的心電數據，這輩子不可能見面，但兩個專科模型可以融合成一個"全科醫生"。

但有個隱藏成本：路由的 inference（推理）開銷。每處理一個 token 都要計算 7 個專家的輸出再加權，延遲比單模型高 40% 左右。KALAVAI 團隊的建議是——用稀疏激活，每次只跑 top-2 專家，把開銷壓到 15% 以內。

2024 年 3 月，Hugging Face 社區有人復現了 KALAVAI 的簡化版，用 4 個 7B 模型融合出一個"免費 GPT-4 替代品"。帖子底下最高贊的評論是："終于不用求爺爺告奶奶要數據了。"

如果每個醫院都能貢獻一個專科模型，卻不泄露任何病例——你覺得最先落地的會是腫瘤篩查，還是罕見病診斷？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

他用一根橡皮筋，講透了AI的底層邏輯

孤獨大腦 2026-03-05 22:52:18
0 跟貼 0
「你是專家」竟成AI幻覺毒藥？新論文一巴掌揭穿提示詞最大騙局

新智元 2026-03-23 20:57:06
0 跟貼 0

AI“搶飯碗”，硅谷大裁員！一線工程師戳破真相：AI效率被嚴重高估，人類被倒逼成審核員，工作量是過去10倍

華爾街見聞官方 2026-03-25 23:20:49
2 跟貼 2

跨越兩千公里！成都都市圈亮相杭州，共筑人工智能產業新生態

每日經濟新聞 2026-03-25 23:06:05
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0

谷歌新算法聲稱能“6倍壓縮KV緩存” 美股存儲板塊承壓走弱

財聯社 2026-03-26 00:30:15
0 跟貼 0

華為工程師，偷偷用中文寫代碼，這事兒在硅谷炸鍋了

逗比星球大冒險 2026-03-24 09:40:45
1 跟貼 1
Token中文名定了/華為啟境 GT7官宣上市時間/iQOO Z11跑分超262萬

雷科技 2026-03-25 10:37:44
2 跟貼 2

DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
機器人進汽車廠，給波士頓動力，裝上谷歌最強大腦

機器之心Pro 2026-01-06 19:02:05
0 跟貼 0
3月25日（報道時間），河南。孩子想到馬路對面找爸爸，一路"疾跑"奔向馬路對面險釀悲劇，媽媽擔心孩子

中安在線 2026-03-25 11:55:16
931 跟貼 931
大模型API的大眾點評來了：7×24小時實測，毫秒級延遲智能路由

量子位 2026-02-02 11:48:44
2 跟貼 2
馬斯克，要啟動史上最大IPO了

智東西 2026-03-25 22:16:16
1 跟貼 1
回顧張雪峰老師冒死“隱談”大學錄取數據，幫助了無數人

搞笑桔子 2026-03-25 04:59:29
343 跟貼 343
ICLR 2026 | PIL：基于線性代理的不可學習樣本生成方法

機器之心Pro 2026-02-24 19:36:33
0 跟貼 0
中國首個“特朗普金卡”申請者曝光！“中國路由器之王”？

深度報 2026-03-24 21:51:20
2 跟貼 2
微軟Power BI藏了5個函數，80%分析師卻只會用SUM

薛定諤的BUG 2026-03-25 17:01:16
0 跟貼 0
比比皆是的下一個創新點：Prompt Learning進化到SIPDO閉環自進化

機器之心Pro 2026-02-28 11:17:43
0 跟貼 0
日本自衛隊現役軍官攜刀強闖中使館中國軍號連續發聲

看看新聞Knews 2026-03-25 17:33:25
1387 跟貼 1387
中考680，你可以怎么選？

區老師不是qu老師 2026-03-22 12:27:49
2 跟貼 2
2026最新五大常用無線智能家居協議全面對比，跟著選不出錯

新文年華 2026-03-24 14:59:13
0 跟貼 0
這不是實驗，是拿命開玩笑

娟姐配音 2026-03-24 07:53:52
7 跟貼 7
老婆做實驗告訴老公做人道理，老公聽完明白了老婆“良苦用心”

重慶頭條官方 2026-03-25 17:35:26
0 跟貼 0
紅警越獄一塊地！占領風水寶地資源最多，直接出個閃電風暴！

月亮3說紅警 2026-03-25 11:58:35
13 跟貼 13
美國模型飛機試飛，鏡頭一轉事不簡單，指揮員吃了熊心豹子膽

桔子笑笑 2026-03-23 14:56:42
1 跟貼 1
拼多多“新拼姆”落地上海：開啟品牌自營，一期已注資150億

新京報 2026-03-25 21:40:27
1 跟貼 1
中泰化學：2025年度凈利潤約-2.89億元

每日經濟新聞 2026-03-26 00:09:03
0 跟貼 0
高考地理:從2025年廣東第19題體會地貌演變試題的解題思路

譚老師地理大課堂 2026-03-25 21:01:13
0 跟貼 0
“聚力向C 重構未來” 2026酒業創新思享會今日在蓉舉行

每日經濟新聞 2026-03-26 00:16:09
0 跟貼 0
目錄 | 《中國現代教育裝備》雜志2026年3月高教版

中國高等教育學會 2026-03-25 18:37:53
0 跟貼 0
泡泡瑪特：2025營收371.2億元

界面新聞 2026-03-25 12:30:58
982 跟貼 982
不早不晚，中國一組數據擺上桌，美國緊張不已

洋聊生活 2026-03-23 10:45:30
0 跟貼 0
德總統稱"對美信任已然喪失" 得到法國軍方強烈共鳴

紅星新聞 2026-03-25 13:54:18
308 跟貼 308
女子稱找高鐵乘務員投訴一名男子在列車口抽煙，被發了一個口罩，當事人：乘務員的態度很好，但自己對這種情況無語，希望高鐵全面禁煙

洪觀新聞 2026-03-25 14:56:54
621 跟貼 621
小伙技術方面沒的說，一般人真做不到，想知道咋過去的！

海星旅行 2026-03-25 13:51:04
0 跟貼 0
女子用自己的美顏參數拍閨蜜，成片直接把對方嚇一跳！這濾鏡太狠

a好劇共享 2026-03-24 07:50:51
0 跟貼 0
歐爾班拒絕同意歐盟向烏提供900億歐元貸款，美方回應

環球網資訊 2026-03-25 11:26:19
446 跟貼 446
彪哥騎摩托追逃犯，哪料技術太菜，自己差點丟掉性命

仙仙看影 2026-03-25 08:28:14
3 跟貼 3
國際油價24日顯著上漲

每日經濟新聞 2026-03-25 05:27:04
528 跟貼 528
半年干掉8位核心高管，理想汽車的激進換血轉型給企業什么啟示？

商道童言 2026-03-25 22:13:45
0 跟貼 0

手機 / 數碼

房產 / 家居

谷歌把這技術藏了3年，500步訓練讓7個模型"自動組隊"

數據不出域，模型怎么"抱團"

500步訓練的"門控系統"

誰該緊張，誰該興奮

紅極一時卻草草收場，Sora宣布正式關停

伊朗放話愿意與"主和派"萬斯談 特朗普表態

伊朗放話愿意與"主和派"萬斯談 特朗普表態

35歲替補門將，憑什么入選英格蘭隊？

張雪峰經搶救無效不幸去世 年僅41歲

管濤:中東局勢如何影響人民幣匯率走勢?

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態度原創

轉頭就暈的耳石癥，能開車上班嗎？

PS6升級動力遭質疑！玩家或當“PS5釘子戶”

女人過了40歲別胡亂穿衣，趕緊看看這些日系穿搭，舒適又耐看

伊朗重申非交戰國家船只可安全通過霍爾木茲海峽

伊朗放話愿意與"主和派"萬斯談特朗普表態

伊朗放話愿意與"主和派"萬斯談特朗普表態

張雪峰經搶救無效不幸去世年僅41歲