<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      北航提出大模型Scaling Laws:編程語言差異與多語言最優配比策略

      0
      分享至



      北航、人大和九坤投資共同撰寫的論文 《Scaling Laws for Code: Every Programming Language Matters》 整理而成。

      在代碼大模型(Code LLMs)的預訓練中,行業內長期存在一種慣性思維,即把所有編程語言的代碼都視為同質化的文本數據,主要關注數據總量的堆疊。然而,現代軟件開發本質上是多語言混合的,不同語言的語法特性、語料規模和應用場景差異巨大。如果忽略這些差異,籠統地應用通用的 Scaling Laws,往往會導致性能預測偏差和算力浪費。

      為了打破這一黑盒,研究團隊耗費了相當于 33.6 萬個 H800 GPU 時,進行了超過 1000 次實驗。研究覆蓋了從 0.2B 到 14B 的模型參數規模,以及高達 1T 的訓練數據量,系統性地對 Python、Java、JavaScript、TypeScript、C#、Go、Rust 這七種主流語言進行了解構。這項工作的核心貢獻在于建立了區分語言特性的 Scaling Laws,并據此提出了一套數學可解的最優數據配比方案。



      • 論文:《Scaling Laws for Code: Every Programming Language Matters》
      • 論文鏈接:https://arxiv.org/abs/2512.13472



      圖 1:論文提出的多語言 Scaling Law 與傳統均勻分布基線的 Loss 對比。藍色曲線顯示,基于本文方法優化的模型在相同算力下能持續獲得更低的 Loss)

      語言特異性:Python 潛力巨大,Rust 快速收斂









      圖 2:七種編程語言各自獨立的 Scaling Law 曲線。可以看到 Python(左上)的曲線斜率更陡峭,而 Rust(右下)則更早趨于平緩)

      協同效應矩陣:語言間的 “近親繁殖” 與 “非對稱互助”

      在實際預訓練中,我們很少只訓練單語言模型。那么,混合多種語言訓練是否存在 “協同效應”(Synergy)?研究團隊構建了一個詳盡的協同增益矩陣,量化了引入輔助語言對目標語言性能的影響。

      實驗發現,絕大多數語言都能從多語言混合訓練中獲益,且收益大小與語法相似度高度相關。例如,Java 與 C#、JavaScript 與 TypeScript 這類語法結構高度相似的語言對,在混合訓練時表現出極強的正向遷移效果。

      更有趣的是,這種遷移往往是非對稱的。Java是多語言訓練的最大受益者,幾乎與任何語言混合都能大幅降低其 Loss,這可能是因為 Java 作為成熟的面向對象語言,能從其他語言的范式中汲取通用邏輯。而Python雖然是代碼領域的通用 “供體”(幫助其他語言提升),但其自身從其他語言獲得的收益卻相對有限,甚至在某些混合比例下會出現輕微的負遷移。這一發現提示我們,在構建語料庫時需要精細設計混合策略,而非盲目地 “大雜燴”。



      表 1:協同增益矩陣。紅色越深代表輔助語言(列)對目標語言(行)的提升越大。Java 所在的行顯示出它能從所有輔助語言中獲得顯著收益)

      跨語言對齊策略:并行配對激發 Zero-Shot 能力

      除了單語言生成,跨語言翻譯(如 Java 轉 Python)也是代碼模型的重要能力。論文對比了兩種數據組織策略:傳統的“隨機打亂”(Random Shuffling)和“并行配對”(Parallel Pairing)—— 即將一段代碼與其翻譯版本拼接在同一個 Context 中輸入模型。

      實驗結果表明,并行配對策略在所有模型規模上均顯著優于基線。這種策略實際上利用了模型的長上下文窗口,構建了隱式的文檔級對齊信號。更關鍵的是,這種策略激發了模型在Zero-Shot(零樣本)方向上的泛化能力。例如,模型僅訓練了 Python?Java 和 Python?Go 的配對數據,但在測試從未見過的 Java?Go 翻譯任務時,基于并行配對訓練的模型表現出了驚人的組合泛化能力。這證明了通過構建以 Python 為樞紐的平行語料,可以有效拉齊不同編程語言的向量空間。



      圖 4:三種策略在跨語言翻譯任務上的表現對比。綠色線條代表的并行配對策略(Prompt-based Concatenation)在各方向上均取得最低 Loss)

      最優 Token 分配指南:基于邊際效用的經濟學

      基于上述發現,論文提出了“科學配比的多語言 Scaling Law”(Proportion-dependent Multilingual Scaling Law)。這不僅是一個理論公式,更是一套指導算力投資的行動指南。

      在總算力固定的約束下,傳統的均勻分配并非最優解。最優策略應遵循邊際效用最大化原則

      1. 重倉高潛力語言:大幅增加Python的 Token 占比,因為它的 Scaling 指數高,投入更多數據能帶來持續的性能爬坡。
      2. 平衡高協同組合:利用JavaScriptTypeScript的互補性,保持兩者適度的比例以最大化協同增益。
      3. 削減早熟語言投入:適當減少RustGo的數據占比。因為它們收斂快,過多的數據投入只會帶來邊際收益的快速衰減,不如將這部分算力轉移給更難學的語言。

      實驗驗證顯示,采用這種 “引導式分配” 策略訓練出的 1.5B 模型,在多語言代碼生成(MultiPL-E)和翻譯任務上,均穩定優于均勻分配的基線模型,且沒有任何一種語言因數據減少而出現顯著的性能退化。



      圖 5:基線策略 vs 優化后的 Token 分配方案。基于 Scaling Law 的建議大幅增加了 Python(藍色)的占比,同時削減了 Rust(橙色)和 Go(青色)的占比)

      總結與啟示

      這項工作是代碼大模型領域一次重要的 “去魅” 過程。它用詳實的數據證明,編程語言在模型訓練的視角下絕非同質。

      對于致力于訓練 Code LLM 的團隊而言,這意味著數據工程的重點應從單純的 “清洗與去重” 轉向更宏觀的 “成分配比”。理解不同語言的 Scaling 特性(是像 Python 一樣潛力巨大,還是像 Rust 一樣迅速飽和)以及它們之間的協同關系,能夠幫助我們在有限的算力預算下,訓練出綜合代碼能力更強的基座模型。這不僅是算法的優化,更是資源配置效率的提升。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      他接受紀律審查和監察調查

      他接受紀律審查和監察調查

      錫望
      2025-12-26 13:29:55
      50歲佘詩曼私生活曝光:未婚,身價過億,獨居客廳僅10㎡小破宅,只想當個富婆

      50歲佘詩曼私生活曝光:未婚,身價過億,獨居客廳僅10㎡小破宅,只想當個富婆

      黎兜兜
      2025-12-25 21:56:18
      金融圈炸鍋!中信建投連續兩人栽了,“投行第一美女”也沒逃過

      金融圈炸鍋!中信建投連續兩人栽了,“投行第一美女”也沒逃過

      金融八卦女
      2025-12-26 14:59:39
      中國軍隊回撤時越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

      中國軍隊回撤時越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

      古書記史
      2025-12-22 19:50:50
      特朗普已做好開戰準備?王毅曾警告:中美一旦沖突,結局只有一個

      特朗普已做好開戰準備?王毅曾警告:中美一旦沖突,結局只有一個

      芊芊子吟
      2025-12-26 11:43:45
      殯儀館老師傅說:人咽氣時最后悔的,從不是愛過,而是沒敢活

      殯儀館老師傅說:人咽氣時最后悔的,從不是愛過,而是沒敢活

      真實人物采訪
      2025-12-25 10:00:06
      體壇核爆!烏克蘭開出“戰爭黑名單”:援俄國家全部滾出奧運會!

      體壇核爆!烏克蘭開出“戰爭黑名單”:援俄國家全部滾出奧運會!

      看盡人間百態
      2025-12-26 14:11:10
      劉強東拿下理想汽車,震驚行業!

      劉強東拿下理想汽車,震驚行業!

      財經三分鐘pro
      2025-12-25 11:43:53
      太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

      太諷刺!龐家無償捐4700平米祖宅,院長雙謊被戳穿,省多部門介入

      好賢觀史記
      2025-12-23 18:14:27
      郭晶晶霍啟剛給仨娃買蜜雪冰城,爺爺霍震霆結賬,還去看了車

      郭晶晶霍啟剛給仨娃買蜜雪冰城,爺爺霍震霆結賬,還去看了車

      小咪侃娛圈
      2025-12-26 14:04:13
      黎筍之子黎堅誠坦言:父親選擇同中國開戰,是其畢生最大的失策

      黎筍之子黎堅誠坦言:父親選擇同中國開戰,是其畢生最大的失策

      磊子講史
      2025-12-24 11:04:05
      紫牛熱點∣周大福售“牛馬”吊墜被指有“陰陽”之意!客服:只是寓意不怕困難、好運“jia”倍

      紫牛熱點∣周大福售“牛馬”吊墜被指有“陰陽”之意!客服:只是寓意不怕困難、好運“jia”倍

      揚子晚報
      2025-12-26 19:45:55
      永州男子發現女兒非親生,和女友分手后獨自撫養至5歲,為上戶口發尋親公告,當地回應

      永州男子發現女兒非親生,和女友分手后獨自撫養至5歲,為上戶口發尋親公告,當地回應

      瀟湘晨報
      2025-12-26 19:54:11
      章澤天和劉強東在迪拜過圣誕節,住幾萬一晚的豪華酒店,太浪漫了

      章澤天和劉強東在迪拜過圣誕節,住幾萬一晚的豪華酒店,太浪漫了

      有范又有料
      2025-12-26 13:32:20
      藍白拼接長袖搭配運動短褲,時尚又清新,輕松打造夏季清爽風

      藍白拼接長袖搭配運動短褲,時尚又清新,輕松打造夏季清爽風

      朝史暮夕
      2025-12-25 10:42:04
      剛剛!山東省紀委監委發布:2人被處分

      剛剛!山東省紀委監委發布:2人被處分

      魯中晨報
      2025-12-26 12:57:02
      美國回應了!香港油船被扣后,白宮:對委石油“隔離”至少兩個月

      美國回應了!香港油船被扣后,白宮:對委石油“隔離”至少兩個月

      歷史有些冷
      2025-12-25 19:50:03
      詹姆斯復出湖人戰績反而下滑了,東契奇和里夫斯雙核帶隊戰績最佳

      詹姆斯復出湖人戰績反而下滑了,東契奇和里夫斯雙核帶隊戰績最佳

      摸神drose
      2025-12-26 22:38:01
      暴漲313%,比亞迪“殺瘋了”!

      暴漲313%,比亞迪“殺瘋了”!

      蔣東文
      2025-12-26 20:28:29
      中國最重要的“東西大動脈”,要來了

      中國最重要的“東西大動脈”,要來了

      國民經略
      2025-12-26 11:47:35
      2025-12-26 23:15:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12000文章數 142521關注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      黑老大2名表超5千萬成交 深圳原政法委書記是其保護傘

      頭條要聞

      黑老大2名表超5千萬成交 深圳原政法委書記是其保護傘

      體育要聞

      開翻航母之后,他決定親手造一艘航母

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經要聞

      投資巨鱷羅杰斯最新持倉:只留四種資產

      汽車要聞

      兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

      態度原創

      家居
      數碼
      藝術
      公開課
      軍事航空

      家居要聞

      格調時尚 智慧品質居所

      數碼要聞

      ACEMAGIC阿邁奇推出M1A PRO+迷你主機:AI Max+ 395,三M.2

      藝術要聞

      William Dyce:19世紀蘇格蘭重要的畫家

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      烏最新20點俄烏和平草案遞交莫斯科 俄方拒絕

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 在线a级毛片免费视频| 吉安市| 成人毛片一区二区| 少妇人妻综合久久中文字幕| 亚洲国产av一区二区三区四区| 四虎网址| 成人欧美一区二区三区白人| 亚洲天堂中文字幕| 一女被多男玩喷潮视频| 伊大人香蕉久久网欧美| 日本va欧美ⅴa欧美Va精品 | 河津市| 久久国产精品久久精品国产| 无码国产精品一区二区免费式直播| 国产一区国产精品自拍| 久草青春| 无码人妻aⅴ一区二区三区69岛| 26uuu另类亚洲欧美日本| 欧美日韩亚洲国产| 亚洲成人天堂网| 伊人88| 日韩高清在线中文字带字幕 | 91色色色| 伊人久久精品| 静乐县| 欧美老熟妇又粗又大| 奇米网777狠狠狠俺| 国产v视频| 中文字幕人妻宗合另类| 国产美女被遭强高潮免费网站| 日韩大片高清播放器| 91福利姬| 国产精品久久久久9999高清| 亚洲午夜成人片| 蜜桃av亚洲精品一区二区| 亚洲一本大道在线| 99久久精品免费看国产电影| 老鸭窝在钱视频| 久久偷拍视频| 国产综合色在线精品| 精品?一区?卡|