<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      超越DeepSeek-V4!羅福莉交出小米最強開源模型,首日適配5家國產芯片

      0
      分享至


      智東西
      作者 李水青
      編輯 云鵬

      智東西4月28日報道,剛剛,小米開源羅福莉帶隊研發的MiMo-V2.5系列模型,采用MIT協議,允許商用推理部署與二次訓練,無需額外授權。


      ▲MiMo-V2.5-Pro在Hugging Face的開源頁面截圖

      此前,該系列模型于4月23日開啟公測,包括MiMo-V2.5-Pro、MiMo-V2.5兩款模型。模型具備更強Agent能力,支持100萬上下文,且Token效率大幅提升。

      MiMo-V2.5-Pro的完整基準測試結果今日公布,小米稱其在GDPVal-AA(Elo)、Claw-Eval(pass^3)等多項測評中超過了最新開源的DeepSeek-V4-Pro模型,也超過了發布不久的Kimi K2.6等主流閉源模型,實現總體最佳。


      ▲MiMo-V2.5-Pro的最新測評成績

      開源首日,MiMo-V2.5-Pro宣布已完成與阿里平頭哥、亞馬遜云科技、AMD、百度昆侖芯、燧原科技、沐曦、天數智芯多個芯片廠商的接入適配。MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。

      與此同時,小米還推出百萬億Token創造者激勵計劃,計劃30天內免費發放總計100萬億Token權益;推出Agent生態共建計劃,目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開合作。

      模型權重合集:
      https://huggingface.co/collections/XiaomiMiMo/mimo-v25
      更多細節參考模型Blog:
      https://mimo.xiaomi.com/index#blog
      百萬億Token計劃申請網址:
      https://100t.xiaomimimo.com/

      一、模型技術細節公布,測評超越DeepSeek-V4

      由小米最新公開的模型卡可知,小米迄今為止最強模型MiMo-V2.5-Pro是一款擁有1.02萬億(1.02T)個參數的混合專家模型,其中420億(42B)個激活參數,基于混合注意力架構,相比前代模型在通用智能能力、復雜軟件工程和長時域任務處理方面均實現了顯著提升。

      MiMo-V2.5-Pro繼承了MiMo-V2-Flash的混合注意力機制和多標記預測(MTP)設計。局部滑動窗口注意力(SWA)和全局注意力(GA)以6:1的比例交錯使用,窗口大小為128個Token,在長上下文情況下,通過可學習的注意力池偏置,將鍵值緩存存儲空間減少了近7倍,同時保持了性能。一個輕量級的MTP模塊,采用密集前饋神經網絡(FFN),原生集成用于訓練和推理,輸出吞吐量大約提升了三倍,并加速了強化學習(RL)的部署。


      ▲MiMo-V2.5-Pro的模型架構及訓練過程

      該模型預訓練使用27萬億(27T)個Token,采用FP8混合精度,原生序列長度為32K,上下文擴展至1M個Token。后訓練遵循MiMo-V2-Flash中引入的三階段范式:1、監督式微調,在精心挑選的數據對上建立基礎的指令跟蹤;2、領域專精訓練,其中不同的教師模型分別通過針對特定領域的強化學習進行優化,涵蓋數學、安全、智能工具使用等領域;3、多教師策略蒸餾(MOPD),其中單個學生模型在每位專精教師的Token級指導下,從自身的展開中學習策略,并將所有教師的能力融合到一個統一的模型中。

      再來看看MiMo-V2.5,這是一個3100億(310B)參數的稀疏MoE模型,擁有150億(15B)激活參數,在48萬億(48T)個Token上進行訓練。它的語言主干框架繼承了MiMo-V2-Flash的混合滑動窗口注意力機制,并搭載自研預訓練視覺、音頻編碼器,兩類編碼器通過輕量化投影模塊完成跨模塊融合。


      ▲MiMo-V2.5架構

      訓練過程分為五個階段:1、基于多樣化語料開展文本預訓練,搭建大語言模型主干網絡;2、進行投影層預熱訓練,實現音視頻、視覺投影器與語言模型的對齊融合;3、依托高質量跨模態數據集,開展大規模多模態預訓練;4、執行監督微調與智能體后訓練,在此過程中將上下文窗口從32K逐步擴容至256K,最終達到100萬Token;5、最后是通過強化學習(RL)與多目標偏好蒸餾(MOPD),進一步強化模型的感知、邏輯推理與智能體執行能力。

      從小米最新公布的測評結果來看,MiMo-V2.5在Claw-Eval Text、Terminal-Bench 2.0、SWE-Bench Pro等多項測評中大幅超越了DeepSeek最新發布的DeepSeek-V4-Flash。


      ▲MiMo-V2.5最新測評情況

      二、開源首日,完成阿里平頭哥沐曦等7家芯片廠商適配

      小米還公布了芯片生態與推理框架最新適配情況,MiMo-V2.5-Pro開源首日完成多個芯片廠商的接入適配:

      阿里平頭哥:基于真武810E及全棧自研AI軟件棧實現深度適配。

      亞馬遜云科技:基于Trainium2芯片與Neuron SDK + vLLM推理框架完成深度適配,實現開源即全球可用的首日適配。下一代3nm制程Trainium3將進一步釋放模型性能。

      AMD:依托ROCm開源軟件棧提供Day-0適配及全面優化支持。

      百度昆侖芯:通過底層算子優化與軟硬件協同加速,保障模型穩定高效運行。

      燧原科技:基于自研馭算TopsRider軟件棧深度優化,在燧原L600上完成全量適配。

      沐曦:基于曦云C系列及全棧自研MXMACA軟件棧,實現Triton語法到沐曦GPU指令集的端到端原生支持。

      天數智芯:實現Day 0級深度適配。

      此外,MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。

      三、免費發放100萬億Token,已與Hermes Agent等合作

      與此同時,小米還同步推出MiMo Orbit計劃,包含兩部分:“百萬億Token創造者激勵計劃”,與面向Agent框架團隊的“Agent生態共建計劃”。

      在百萬億Token創造者激勵計劃方面,小米面向全球AI用戶免費發放Token,30天內發放總計100萬億Token權益,贈完即止。

      該計劃采取申請制,通過者最高獲得Max檔位Token Plan,包含16億Credits,價值659元。活動時間:北京時間2026年4月28日00:00至5月28日00:00。

      Agent生態共建計劃方面,小米面向全球Agent框架團隊提供專項支持,為框架提供MiMo Token限免支持,同時參與和贊助框架平臺的AI Hackathon等共創活動。

      其目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開深度合作。

      結語:多款國產開源模型“亮劍”交鋒

      近期,大模型行業開源力度持續加碼,模型與國產及國際芯片的“Day 0”適配已從亮點變為剛需,推理效率和部署成本成為下一階段競爭的核心。同時,百億級Token免費激勵與Agent框架生態共建,反映出行業正從“拼參數”轉向“拼應用”。

      值得關注的是,小米MiMo-V2.5-Pro在多項基準評測中直接超越DeepSeek最新開源的DeepSeek-V4-Pro模型,可謂與DeepSeek在開源賽道發起“亮劍”交鋒,有望倒逼行業更快降低推理成本、提升Agent真實任務完成率。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      于和偉評價《八千里路云和月》黃澄澄,只字不提演技,卻一針見血

      于和偉評價《八千里路云和月》黃澄澄,只字不提演技,卻一針見血

      陳述影視
      2026-04-26 23:52:56
      武漢一女子在社區醫院治療頸椎,被醫生以檢查身體為由要求脫光衣物,并遭“襲胸”猥褻,涉事醫生已被行拘5日;院方:系退休返聘,已開除

      武漢一女子在社區醫院治療頸椎,被醫生以檢查身體為由要求脫光衣物,并遭“襲胸”猥褻,涉事醫生已被行拘5日;院方:系退休返聘,已開除

      大風新聞
      2026-04-28 10:00:06
      李純被問“有沒有感覺馬頔沒有分寸感”,馬頔:“我們都領證了”

      李純被問“有沒有感覺馬頔沒有分寸感”,馬頔:“我們都領證了”

      韓小娛
      2026-04-28 11:56:41
      謝逸楓:顫抖吧!一季度賣地收入大跌,不足6000億元

      謝逸楓:顫抖吧!一季度賣地收入大跌,不足6000億元

      謝逸楓看樓市
      2026-04-27 09:54:05
      日本油價創下史上新高!比亞迪日本開展3天2夜免費試駕活動

      日本油價創下史上新高!比亞迪日本開展3天2夜免費試駕活動

      中國能源網
      2026-04-27 16:19:06
      約基奇27分掘金戰勝森林狼,道蘇姆被鎖瓊斯成為奪寶奇兵

      約基奇27分掘金戰勝森林狼,道蘇姆被鎖瓊斯成為奪寶奇兵

      李廣專業體育評論
      2026-04-28 13:21:45
      “楊冪臉被蒸汽眼罩燙傷了”熱搜爆了,本人曬右眼下方紅色燙傷痕跡,并配文:蒸汽眼罩咬我

      “楊冪臉被蒸汽眼罩燙傷了”熱搜爆了,本人曬右眼下方紅色燙傷痕跡,并配文:蒸汽眼罩咬我

      魯中晨報
      2026-04-27 21:04:03
      開始了!遼寧艦率13軍艦,強勢“圍觀美日菲”,25萬噸碾壓10萬噸

      開始了!遼寧艦率13軍艦,強勢“圍觀美日菲”,25萬噸碾壓10萬噸

      基斯默默
      2026-04-28 10:24:58
      四年食品學位,畢業后同宿舍四人竟無一人在食品行業!江南大學的真實現狀

      四年食品學位,畢業后同宿舍四人竟無一人在食品行業!江南大學的真實現狀

      戶外阿毽
      2026-04-27 08:31:47
      張軍被帶走后才懂:林丹當年的選擇有多聰明

      張軍被帶走后才懂:林丹當年的選擇有多聰明

      林子說事
      2026-04-27 17:31:26
      就在今天凌晨,美軍火被拉進臺島,臺海生變,洪秀柱已咬死一句話

      就在今天凌晨,美軍火被拉進臺島,臺海生變,洪秀柱已咬死一句話

      阿芒娛樂說
      2026-04-28 09:05:22
      阿里納斯:詹姆斯退役后、媒體再無流量!選他而不是喬丹來建隊!

      阿里納斯:詹姆斯退役后、媒體再無流量!選他而不是喬丹來建隊!

      歷史第一人梅西
      2026-04-27 10:59:36
      民營銀行急了:加息35點!比大額存單還高?7萬億令銀行眼紅

      民營銀行急了:加息35點!比大額存單還高?7萬億令銀行眼紅

      財說得明白
      2026-04-28 13:28:12
      戰功赫赫的紅軍軍團長,整編時竟無人愿收,主席震怒直言純屬瞎胡鬧

      戰功赫赫的紅軍軍團長,整編時竟無人愿收,主席震怒直言純屬瞎胡鬧

      磊子講史
      2026-03-30 15:41:41
      黑猴也被干趴了!《黑神話》D加密終被破解:歷時一年半

      黑猴也被干趴了!《黑神話》D加密終被破解:歷時一年半

      游民星空
      2026-04-28 11:06:20
      5月1日正式開刀!3萬就立案,所有打工人都要警惕

      5月1日正式開刀!3萬就立案,所有打工人都要警惕

      洞見小能手
      2026-04-27 21:17:44
      就差1秒!特朗普欲發射核武器,軍方強行攔截,拒絕為總統扣扳機

      就差1秒!特朗普欲發射核武器,軍方強行攔截,拒絕為總統扣扳機

      瓦倫西亞月亮
      2026-04-23 23:09:51
      繼約基奇后,又一筆季后賽重磅罰單!斯瑪特、肯納德被NBA追罰!

      繼約基奇后,又一筆季后賽重磅罰單!斯瑪特、肯納德被NBA追罰!

      寶哥精彩賽事
      2026-04-28 12:13:56
      “全班媽媽,就你最丑”,媽媽開家長會被兒子嫌棄,網友一語中的

      “全班媽媽,就你最丑”,媽媽開家長會被兒子嫌棄,網友一語中的

      妍妍教育日記
      2026-04-27 12:35:03
      廣廈隊、上海隊、北京隊誰能奪冠?馬布里給出了自己的答案!

      廣廈隊、上海隊、北京隊誰能奪冠?馬布里給出了自己的答案!

      體育哲人
      2026-04-27 22:28:15
      2026-04-28 14:00:49
      智東西 incentive-icons
      智東西
      智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
      11703文章數 117049關注度
      往期回顧 全部

      科技要聞

      10億周活目標落空!傳OpenAI爆發內部分歧

      頭條要聞

      男子強奸大嫂出獄后又殺人 被執行死刑

      頭條要聞

      男子強奸大嫂出獄后又殺人 被執行死刑

      體育要聞

      人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

      娛樂要聞

      蔡卓妍官宣結婚,老公比她小10歲

      財經要聞

      俞敏洪再遭重擊

      汽車要聞

      上汽大眾“攻山頭” ID.ERA 9X劍指細分前三

      態度原創

      本地
      時尚
      教育
      公開課
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      T恤+闊腿褲、襯衫+闊腿褲,今年夏天最火的搭配,誰穿誰時髦!

      教育要聞

      考場上拿分才是硬道理

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      德國總理默茨:美國正遭受伊朗領導層的羞辱

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产三级无码内射在线看| 邻居少妇张开腿让我爽了在线观看| 亚洲成a人片在线观看日本 | 宁津县| 亚洲资源在线视频| 亚洲国产成人极品综合| 一区二区三区内射美女毛片| 久久天天躁夜夜躁狠狠ds005| 97激情| 林口县| 欧美性猛交xxxx三人| 精人妻无码一区二区三区| 爆乳女仆高潮在线观看| 51自拍视频| 久久亚洲精品情侣| 亚洲成人第一VA| 国产精品久久久久9999吃药| 成人超碰在线| 国产成人国产在线观看| 天堂无码AV| 欧美性xxxx狂欢老少配| 熟妇人妻系列| 国产福利精品导航网址| 午夜欧美精品久久久久久久 | 国产性在线| 欧美自慰一级看片免费| 中文字幕人乱码中文| 看亚洲黄色不在线网占| 起碰免费公开97在线视频 | 国产欧美日韩精品a在线观看| 成人嫩草研究院久久久精品| 中文字幕丝袜一区二区| 黄色综合网| 日韩亚洲欧美中文高清| 国产黄片视频在线观看| 成人α片免费视频播放在线| 久久久www免费人成精品| 国产果冻豆传媒麻婆精东 | 国产成人精品手机在线观看| 昭平县| 欧洲亚洲av|