<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      行業(yè)標(biāo)準(zhǔn)過時了?楊植麟首次披露Kimi技術(shù)路徑

      0
      分享至



      出品/未來科技界

      作者/李彥

      編輯/楊宇

      大模型的底層架構(gòu),過時了?

      過去幾年,行業(yè)對“Scaling”的理解幾乎等同于算力堆砌與參數(shù)擴張。但在今年的技術(shù)交流中,一個更清晰的共識正在形成:單純依賴資源線性投入,已經(jīng)難以持續(xù)推高模型能力的上限。如何在效率、結(jié)構(gòu)與系統(tǒng)協(xié)同中尋找新的“規(guī)模紅利”,成為新的命題。

      北京時間3月18日凌晨,月之暗面創(chuàng)始人楊植麟在英偉達(dá) GTC 2026大會上首次系統(tǒng)披露了Kimi K2.5的技術(shù)路線圖,其核心指向“更有效率的規(guī)模化”。

      他將Kimi的演進(jìn)總結(jié)為三個維度的協(xié)同:Token效率、長上下文能力,以及智能體集群(Agent Swarms)。這三個方向并非獨立優(yōu)化,而是試圖形成乘數(shù)效應(yīng)——即通過效率提升降低計算成本,通過長上下文提升推理能力,再通過多智能體協(xié)作放大任務(wù)處理能力,從而整體抬升模型智能水平。

      這一技術(shù)路線的落腳點,在于對既有基礎(chǔ)架構(gòu)的重構(gòu)。

      以優(yōu)化器為例,自2014年以來,Adam系列幾乎成為行業(yè)標(biāo)準(zhǔn)。但在超大規(guī)模訓(xùn)練中,其Tokenl效率與穩(wěn)定性問題逐漸暴露。Kimi團隊在實踐中引入Muon優(yōu)化器,并進(jìn)一步開發(fā)出MuonClip機制,通過數(shù)值穩(wěn)定性改進(jìn)解決Logits爆炸問題,在效率上實現(xiàn)對AdamW約2倍的提升。這意味著,在相同算力條件下,模型可以完成更多有效訓(xùn)練,從源頭提升“性價比”。

      針對 2017 年誕生的全注意力機制(Full Attention),楊植麟展示了基于KDA架構(gòu)的 Kimi Linear。這是一種混合線性注意力架構(gòu),它挑戰(zhàn)了“所有層必須使用全注意力”的慣例,通過優(yōu)化遞歸存儲管理,在128K甚至1M的超長上下文中,將解碼速度提升了5到6倍,且在不同長度的場景下均保持了優(yōu)異性能。

      與此同時,針對殘差連接這一長期被忽視的基礎(chǔ)組件,Kimi提出了Attention Residuals方案。通過用注意力機制替代傳統(tǒng)的逐層累加,模型可以更有選擇性地利用歷史信息,從而避免深層網(wǎng)絡(luò)中信息被稀釋的問題。這類改進(jìn)雖然不如新模型架構(gòu)“顯眼”,卻直接作用于模型表達(dá)能力的上限。

      如果說上述優(yōu)化仍停留在單模型層面,那么Kimi更進(jìn)一步的探索,則指向“多模型協(xié)作”。



      在演講中,楊植麟提出,未來的AI形態(tài)將不再是單一智能體,而是由多個Agent動態(tài)組成的協(xié)作系統(tǒng)。Kimi K2.5中的Orchestrator機制,能夠?qū)?fù)雜任務(wù)拆解為多個子任務(wù),并分配給不同Agent并行執(zhí)行。同時,通過專門設(shè)計的強化學(xué)習(xí)獎勵函數(shù),避免多Agent系統(tǒng)退化為串行流程,從而真正實現(xiàn)并行效率提升。

      這一思路,實質(zhì)上將“Scaling”從單模型擴展為“系統(tǒng)級Scaling”。當(dāng)任務(wù)復(fù)雜度不斷提高,僅依賴單一模型能力已難以覆蓋全部場景,分布式智能體協(xié)作可能成為新的主流范式。

      此外,Kimi在跨模態(tài)方向上的實驗也提供了一個值得注意的信號:視覺強化學(xué)習(xí)不僅提升視覺能力,還能夠反向增強文本推理能力。在相關(guān)基準(zhǔn)測試中,這種訓(xùn)練方式帶來了約2.1%的文本性能提升。這表明,不同模態(tài)之間的能力并非孤立,而是存在可以被利用的遷移關(guān)系。

      從更宏觀的角度看,這場演講所傳遞的信息,或許比具體技術(shù)細(xì)節(jié)更重要。

      一方面,大模型的發(fā)展正在從“資源驅(qū)動”轉(zhuǎn)向“效率驅(qū)動”。當(dāng)算力供給逐漸成為瓶頸,誰能在單位算力中挖掘出更高價值,誰就擁有更強的競爭力。

      另一方面,AI的競爭邊界也在外擴。從模型本身,到訓(xùn)練方法,再到多智能體系統(tǒng),技術(shù)演進(jìn)正在向更復(fù)雜的系統(tǒng)工程演化。

      楊植麟在最后提到,過去受限于算力,很多技術(shù)想法難以通過大規(guī)模實驗驗證,而現(xiàn)在,隨著“Scaling Ladder”的建立,研究者可以在不同規(guī)模上反復(fù)驗證假設(shè),從而讓那些曾被忽視的“舊技術(shù)”重新煥發(fā)生命力。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      蔣經(jīng)國寫給宋慶齡的硬筆書信驚艷書壇!字跡畢恭畢敬!好似小學(xué)生

      蔣經(jīng)國寫給宋慶齡的硬筆書信驚艷書壇!字跡畢恭畢敬!好似小學(xué)生

      鶴羽說個事
      2026-03-20 21:20:03
      和老伴在江蘇南京住了30天,實話實說:跟網(wǎng)上評價的完全不一樣

      和老伴在江蘇南京住了30天,實話實說:跟網(wǎng)上評價的完全不一樣

      星星沒有你亮
      2026-03-21 13:56:21
      雷軍:續(xù)航達(dá)到902公里,只用96.3度電;王興興、何小鵬、王傳福現(xiàn)身新一代SU7發(fā)布會

      雷軍:續(xù)航達(dá)到902公里,只用96.3度電;王興興、何小鵬、王傳福現(xiàn)身新一代SU7發(fā)布會

      大風(fēng)新聞
      2026-03-19 20:15:21
      放進(jìn)去就是做了,不放進(jìn)去就是沒做

      放進(jìn)去就是做了,不放進(jìn)去就是沒做

      桉予
      2026-03-20 13:54:20
      中國農(nóng)民倒了什么血霉,被這樣的人研究

      中國農(nóng)民倒了什么血霉,被這樣的人研究

      多村來信
      2026-03-18 16:29:30
      李璇:王鈺棟需要低調(diào)務(wù)實、情商在線,才能走得更遠(yuǎn)

      李璇:王鈺棟需要低調(diào)務(wù)實、情商在線,才能走得更遠(yuǎn)

      懂球帝
      2026-03-21 12:24:27
      Cursor 新模型被指就是Kimi K2.5,聯(lián)創(chuàng)回應(yīng):確實是,下次我們會說清楚

      Cursor 新模型被指就是Kimi K2.5,聯(lián)創(chuàng)回應(yīng):確實是,下次我們會說清楚

      InfoQ
      2026-03-21 10:21:20
      大家坐穩(wěn)扶好了,三個信號來了,銅價或?qū)⒅匮?9年歷史!

      大家坐穩(wěn)扶好了,三個信號來了,銅價或?qū)⒅匮?9年歷史!

      小陸搞笑日常
      2026-03-21 12:13:59
      伊朗外長:伊朗有意允許與日本相關(guān)的船只通行霍爾木茲海峽

      伊朗外長:伊朗有意允許與日本相關(guān)的船只通行霍爾木茲海峽

      財聯(lián)社
      2026-03-21 10:45:04
      王鈺棟飄了!媒體人熱議:別給自己制造障礙,有名氣得學(xué)會尊重

      王鈺棟飄了!媒體人熱議:別給自己制造障礙,有名氣得學(xué)會尊重

      奧拜爾
      2026-03-21 12:12:03
      訪美的高市不笑了,面色扭曲,美媒提醒,中方還有更多反制手段

      訪美的高市不笑了,面色扭曲,美媒提醒,中方還有更多反制手段

      諾諾談史
      2026-03-21 12:27:43
      四年沖突一朝回本,普京也沒想到,美放緩制裁后,有人加價也要買

      四年沖突一朝回本,普京也沒想到,美放緩制裁后,有人加價也要買

      諦聽骨語本尊
      2026-03-20 17:12:32
      金價失守4600美元 國內(nèi)多家銀行緊急收緊個人貴金屬業(yè)務(wù)

      金價失守4600美元 國內(nèi)多家銀行緊急收緊個人貴金屬業(yè)務(wù)

      環(huán)球網(wǎng)資訊
      2026-03-20 10:43:07
      老板娘問我她屁股大不大?我該怎么回答?

      老板娘問我她屁股大不大?我該怎么回答?

      太急張三瘋
      2026-03-21 08:17:41
      黨毅飛半目擊敗申真谞,對小申信心的打擊是巨大的

      黨毅飛半目擊敗申真谞,對小申信心的打擊是巨大的

      月滿大江流
      2026-03-21 11:16:07
      特朗普的這個“玩笑”,就問高市尷不尷尬

      特朗普的這個“玩笑”,就問高市尷不尷尬

      極目新聞
      2026-03-20 13:39:31
      老中醫(yī):我用黃芪救了無數(shù)個重疾患者!

      老中醫(yī):我用黃芪救了無數(shù)個重疾患者!

      太極本草
      2026-03-17 06:33:03
      你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網(wǎng)友:我有個秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      打臉王勵勤?波爾:樊振東不太渴望回歸國乒!中國乒協(xié)并未聯(lián)系他

      打臉王勵勤?波爾:樊振東不太渴望回歸國乒!中國乒協(xié)并未聯(lián)系他

      念洲
      2026-03-20 18:46:12
      上海德云社開業(yè)僅1天,惡心一幕出現(xiàn),楊議的“老毛病”又犯了

      上海德云社開業(yè)僅1天,惡心一幕出現(xiàn),楊議的“老毛病”又犯了

      攬星河的筆記
      2026-03-21 13:37:23
      2026-03-21 14:35:00
      壹覽商業(yè)官方 incentive-icons
      壹覽商業(yè)官方
      專業(yè)的消費領(lǐng)域服務(wù)平臺
      898文章數(shù) 38關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機器人出貨量第一!

      頭條要聞

      81歲老人呼吸衰竭 女兒曾拒絕插管:以為要失去爸爸了

      頭條要聞

      81歲老人呼吸衰竭 女兒曾拒絕插管:以為要失去爸爸了

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      CMG盛典獲獎名單:章子怡高葉同獲影后

      財經(jīng)要聞

      通脹警報拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

      態(tài)度原創(chuàng)

      健康
      親子
      旅游
      藝術(shù)
      公開課

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      親子要聞

      十萬火急,產(chǎn)婦在家突發(fā)急產(chǎn),29 周早產(chǎn)男寶全身發(fā)紫!兒科醫(yī)院早產(chǎn)兒救援與時間賽跑

      旅游要聞

      佘山度假區(qū)|第二十四屆佘山蘭筍文化季即將啟幕,十大亮點帶你解鎖春日奇樂旅程

      藝術(shù)要聞

      第四屆深圳大芬國際油畫雙年展 | 國際入選油畫選刊(二)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版