<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      小米突然發(fā)布新模型:媲美 DeepSeek-V3.2,把手機的性價比卷到 AI

      小米新模型媲美DeepSeekV3.2

      0
      分享至

      開源模型再次迎來一位重磅選手,就在剛剛,小米正式發(fā)布并開源新模型 MiMo-V2-Flash。

      MiMo-V2-Flash 總參數3090億,活躍參數150億,采用專家混合架構 (MoE),性能還能和 DeepSeek-V3.2、Kimi-K2這些頭部開源模型掰 掰 手腕。


      此外,MiMo-V2-Flash 采用 MIT 開源協(xié)議,基礎版權重也已經在 Hugging Face 上發(fā)布。


      當然,除去「開源」這一標簽,新模型真正的殺手锏在于架構設計上的激進創(chuàng)新,把推理速度拉到了150 tokens/秒,成本壓到了每百萬 token 輸入0.1美元、輸出0.3美元,主打一個超絕性價比。


      此外 ,根據官方體驗頁面信息,MiMo-V2-Flash 還支持深度思考和聯(lián)網搜索功能, 既能對話聊天,也能在需要實時數據、最新動態(tài)或資料核對的場景里派上用場。


      附上 AI Studio 體驗地址:

      http://aistudio.xiaomimimo.com

      開源模型新標桿, MiMo-V2-Flash 跑分全線開花

      先來看看 MiMo-V2-Flash 的跑分。

      基準測試成績顯示,AIME 2025數學競賽和 GPQA-Diamond 科學知識測試中,MiMo-V2-Flash 都排在開源模型前兩名。

      編程能力更是亮眼,SWE-bench Verified 得分73.4%,超越所有開源模型,直逼 GPT-5-High。而這個測試是讓 AI 去修真實世界的軟件 bug,73.4% 的成功率也意味著它能搞定大部分實際編程問題。


      在多語言編程基準測試 SWE-Bench Multilingual 里,MiMo-V2-Flash 的解決率為71.7%。

      轉看智能體任務,MiMo-V2-Flash 在τ2-Bench 分類得分中,通信類95.3分,零售類79.5分,航空類66.0分,BrowseComp 搜索代理得分45.4,啟用上下文管理后直接飆到58.3。


      這些數據說明,MiMo-V2-Flash 不僅會寫代碼,還能真正理解復雜任務邏輯,執(zhí)行多輪智能體交互。

      更重要的是,寫作質量也接近頂級閉源模型,這意味著 MiMo-V2-Flash 不只是個工具,還能當個靠譜的日常助手。

      MiMo-V2-Flash 在保持長文本性能的同時,還降低了成本,究其原因,離不開兩項核心技術創(chuàng)新。

      混合滑動窗口注意力機制:傳統(tǒng)大模型處理長文本時,全局注意力機制會導致計算量二次爆炸,存儲中間結果的 KV 緩存也跟著飆升。

      小米這次采用了5比1的激進比例,5層滑動窗口注意力搭配1層全局注意力交替使用,滑動窗口只看128個 token。

      這種設計讓 KV 緩存存儲量直接減少了近6倍,但長文本能力卻沒打折扣,最長支持256k 上下文窗口。


      且模型即使在這么激進的窗口設置下,照樣能穩(wěn)住長文本性能。

      對此, 羅福莉在社交平臺上特別指出一個反直覺的發(fā)現:窗口大小128是「最佳甜點值」。實驗證明,盲目擴大窗口(如增至512)反而會導致性能下降。同時她強調,在實施該機制時,sink values 是維持性能的關鍵,絕不可省略。


      另一個黑科技是輕量級多 Token 預測 (MTP)。

      傳統(tǒng)模型生成文本時一次只能吐一個 token,就像打字員一個字一個字敲。MiMo-V2-Flash 通過原生集成的 MTP 模塊,能并行預測多個 token,一次性猜出接下來好幾個 token。

      實測平均能接受2.8到3.6個 token,推理速度直接提升2到2.6倍,不僅在推理時管用,訓練階段也能加速采樣,減少 GPU 空轉,屬于一箭雙雕。


      羅福莉提到,在三層 MTP 設置下,他們觀察到平均接受長度超過3,編碼任務速度提升約2.5倍。它有效解決了小批量 On-Policy 強化學習中「長尾樣本」帶來的 GPU 空閑時間浪費問題。

      啥叫長尾樣本?就是那些特別難、特別慢的任務,拖著其他任務一起等,GPU 就在那干瞪眼。MTP 把這個問題給解了,極大提高了效率。

      不過羅福莉也坦誠,這次因為時間緊迫沒能把 MTP 完整集成進 RL 訓練循環(huán),但它與該流程高度契合。小米已經把三層 MTP 開源了,方便大家在自己的項目中使用與開發(fā)。

      算力只用1/50,性能如何不打折?

      預訓練階段,新模型使用 FP8混合精度,在27萬億 token 數據上完成訓練,原生支持32k 序列長度。

      FP8混合精度是一種壓縮數值表示的技術,能在保持精度的同時減少顯存占用和加速訓練。這種訓練方式在業(yè)界并不常見,需要對底層框架進行深度優(yōu)化。

      而在后訓練階段,小米整了個大活,提出了多教師在線策略蒸餾 (MOPD)。

      傳統(tǒng)的監(jiān)督微調加強化學習管線,不僅訓練不穩(wěn)定,算力消耗還賊高。MOPD 的思路是讓學生模型在自己的策略分布上采樣,然后由多個專家教師在每個 token 位置提供密集的獎勵信號。

      通俗點說就是,學生模型自己寫作業(yè),老師在每個字上都給評分,不用等寫完整篇才打分。這樣一來,學生模型能快速從教師那里學到精髓,而且訓練過程穩(wěn)定得多。

      最夸張的是效率提升,MOPD 只需要傳統(tǒng)方法1/50的算力,就能讓學生模型達到教師性能峰值。這意味著小米能用更少的資源,更快地迭代模型。

      而且 MOPD 支持靈活接入新教師,學生模型成長后還能反過來當教師,形成「教與學」的閉環(huán)自我進化。今天的學生,明天的老師,后天又能教出更強的學生,套娃玩法屬實有點東西。

      用羅福莉的話來說,他們借鑒 Thinking Machine 的 On-Policy Distillation 方法,將多個強化學習模型進行融合,結果帶來了驚人的效率提升。這為構建一個自我強化循環(huán)系統(tǒng)奠定了基礎,學生模型可以逐步進化,最終成為更強的教師模型。


      在智能體強化學習擴展上,小米 MiMo-V2-Flash 研究團隊基于真實 GitHub issue 構建了超過10萬個可驗證任務,自動化流水線跑在 Kubernetes 集群上,并發(fā)能開10000多個 Pod,環(huán)境部署成功率70%。

      針對網頁開發(fā)任務,還專門搞了個多模態(tài)驗證器,通過錄制視頻而非靜態(tài)截圖來驗證代碼執(zhí)行結果,直接減少視覺幻覺,確保功能正確。

      對于開發(fā)者而言,MiMo-V2-Flash 能與 Claude Code、Cursor、Cline 等主流開發(fā)環(huán)境無縫配合,256k 的超長上下文窗口支持數百輪智能體交互與工具調用。

      256k 是什么概念? 大概相當于一本中等篇幅的小說,或者幾十頁技術文檔。這意味著開發(fā)者可以把 MiMo-V2-Flash 直接融入現有工作流,不需要額外適配,拿來就用。

      小米還把所有推理代碼貢獻給了 SGLang,并在 LMSYS 博客分享了推理優(yōu)化經驗。

      技術報告公開了完整模型細節(jié),模型權重 (包括 MiMo-V2-Flash-Base) 在 Hugging Face 上以 MIT 許可協(xié)議發(fā)布。這種全面開源的態(tài)度,在國內大廠里屬實少見。

      目前 MiMo-V2-Flash 已經在 API Platform 限時免費開放,開發(fā)者可以直接上手體驗。


      小米的 AI 野心,不止于手機助手

      MiMo-V2-Flash 的發(fā)布,標志著小米在 AI 賽道上的全面發(fā)力。

      羅福莉在社交平臺上透露了更多信息,「MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖上的第二步?!沟诙骄鸵呀涍@么猛了,那后面還有啥大招?想想就有點期待。

      當然,小米在技術報告中也坦誠,MiMo-V2-Flash 與最強的閉源模型相比仍有差距。但他們的計劃很明確,通過擴大模型規(guī)模與訓練算力來縮小差距,同時繼續(xù)探索更穩(wěn)健、更高效的智能體架構。


      MOPD 框架下教師模型與學生模型的迭代共進化,也為未來的能力提升留足了空間。

      把視角拉高來看,背后是小米對整個 AI 生態(tài)的一次戰(zhàn)略押注。手機、IoT、汽車,小米的硬件生態(tài)需要一個強大的 AI 底座,MiMo-V2-Flash 顯然就是小米為全硬件生態(tài)準備的那塊基石。

      就像十四年前小米手機用1999元重新定義了旗艦機的價格標準,如今 MiMo-V2-Flash 正在用白菜價的成本、73.4% 的 SWE-Bench 得分,重新定義開源大模型的性能標準。

      這一次,屬于開源模型的「小米時刻」真的來了。

      HuggingFace 模型地址:
      http://hf.co/XiaomiMiMo/MiMo-V2-Flash
      技術報道地址:
      http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

      歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      博主:嚴鼎皓即將加盟遼寧鐵人,鐵人還對玄智健感興趣

      博主:嚴鼎皓即將加盟遼寧鐵人,鐵人還對玄智健感興趣

      懂球帝
      2025-12-17 15:51:26
      廣東存儲芯片“小巨人”,啟動IPO

      廣東存儲芯片“小巨人”,啟動IPO

      芯東西
      2025-12-17 17:49:45
      媒體人:民進黨追殺政敵,反而可能保送高虹安連任新竹市長

      媒體人:民進黨追殺政敵,反而可能保送高虹安連任新竹市長

      海峽導報社
      2025-12-16 21:40:02
      她是國家一級演員,享正軍級待遇,離異后至今單身,67歲依然美麗

      她是國家一級演員,享正軍級待遇,離異后至今單身,67歲依然美麗

      老謝談史
      2025-12-16 14:59:41
      火箭申請1250萬傷病特例:隊內7人解開交易限制 斯通著手陣容補強

      火箭申請1250萬傷病特例:隊內7人解開交易限制 斯通著手陣容補強

      顏小白的籃球夢
      2025-12-17 11:38:07
      誤打誤撞把病治好是啥體驗?網友:華佗在世都要甘拜下風啊

      誤打誤撞把病治好是啥體驗?網友:華佗在世都要甘拜下風啊

      帶你感受人間冷暖
      2025-07-21 00:15:06
      寶應縣委書記張小輝,已任揚州市委常委、宣傳部部長

      寶應縣委書記張小輝,已任揚州市委常委、宣傳部部長

      上觀新聞
      2025-12-17 19:43:08
      娛樂圈風向又變了!天津曲協(xié)“倒戈”郭德綱,主流相聲圈要內訌?

      娛樂圈風向又變了!天津曲協(xié)“倒戈”郭德綱,主流相聲圈要內訌?

      史怌的生活科普
      2025-12-16 20:36:22
      離隊倒計時!遼籃新援幾乎被棄用 上場1分半鐘 楊鳴還要忍多久

      離隊倒計時!遼籃新援幾乎被棄用 上場1分半鐘 楊鳴還要忍多久

      胖子噴球
      2025-12-17 21:57:36
      流亡一年后,阿薩德已成克宮“透明人”,和普京連頓飯都難約上

      流亡一年后,阿薩德已成克宮“透明人”,和普京連頓飯都難約上

      凡知
      2025-12-17 06:09:34
      柬埔寨為啥不用中國戰(zhàn)斗機去應戰(zhàn)泰國?不是不想,而是真的沒法用

      柬埔寨為啥不用中國戰(zhàn)斗機去應戰(zhàn)泰國?不是不想,而是真的沒法用

      詩意世界
      2025-12-17 10:14:24
      哪個瞬間你秒懂了別人暗示?網友:醫(yī)生暗示男孩就說腦殼有點大

      哪個瞬間你秒懂了別人暗示?網友:醫(yī)生暗示男孩就說腦殼有點大

      帶你感受人間冷暖
      2025-12-13 00:15:04
      耗時3年:玩家在《我的世界》創(chuàng)造出真實世界!難以置信地逼真

      耗時3年:玩家在《我的世界》創(chuàng)造出真實世界!難以置信地逼真

      快科技
      2025-12-16 17:03:41
      日軍侵華長達14年,為何入侵印度5個月就放棄?原因令人哭笑不得

      日軍侵華長達14年,為何入侵印度5個月就放棄?原因令人哭笑不得

      云霄紀史觀
      2025-12-16 17:14:46
      關于楊蘭蘭,終于破解出幾條她的關鍵信息

      關于楊蘭蘭,終于破解出幾條她的關鍵信息

      熱點菌本君
      2025-10-01 17:24:05
      豬肚再次成為討論對象!研究發(fā)現:常吃豬肚,可能會獲取3大益處

      豬肚再次成為討論對象!研究發(fā)現:常吃豬肚,可能會獲取3大益處

      九哥聊軍事
      2025-12-15 21:18:17
      徐正源遭炮轟:蓉城成功靠輸血!吃資源喜歡鬧事,豪門不會考慮他

      徐正源遭炮轟:蓉城成功靠輸血!吃資源喜歡鬧事,豪門不會考慮他

      奧拜爾
      2025-12-17 18:07:23
      戈貝爾官宣女兒出生但已與孩子母親分手!前女友超美卻被趕出家門

      戈貝爾官宣女兒出生但已與孩子母親分手!前女友超美卻被趕出家門

      Emily說個球
      2025-12-17 11:33:17
      關于性欲的真相(適用于所有人)

      關于性欲的真相(適用于所有人)

      心理咨詢師陳實
      2025-12-03 22:10:03
      保羅被連夜開除的理由之一:保羅經常帶領替補吊打快船首發(fā)

      保羅被連夜開除的理由之一:保羅經常帶領替補吊打快船首發(fā)

      愛體育
      2025-12-17 21:09:16
      2025-12-17 23:16:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      5935文章數 26725關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發(fā)聲

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發(fā)聲

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態(tài) 長城歐拉5上市 限時9.18萬元起

      態(tài)度原創(chuàng)

      家居
      本地
      藝術
      手機
      公開課

      家居要聞

      溫馨獨棟 駝色與淺色碰撞

      本地新聞

      云游安徽|踏過戰(zhàn)壕與石板,讀一部活的淮北史

      藝術要聞

      毛主席書寫林則徐詩詞,字跡超凡,引發(fā)關注。

      手機要聞

      iQOO Z11 Pro曝光,3D超聲波指紋+2億大底主攝

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲无码资源| 亚洲性爱在线观看| a在线视频v视频| 波多野结衣中文字幕一区二区三区 | 巴塘县| 罗甸县| 井陉县| 亚洲精品成a人| 金昌市| 色欲久久久天天天综合网精品| 人妻另类综合| 亚洲综合一二| 成人在线亚洲| 国产精品无码专区| 国产乱理伦片在线观看| 精品久久人人妻人人做精品 | 临朐县| 亚洲国产色图| www.啪啪白浆| 国产精品自在自线视频| 国产精品无码aⅴ嫩草| 久久无码av中文出轨人妻| 国语对白做受xxxxx在线中国| 国产亚洲精品久久久久蜜臀 | 国产精品一区二区无线| 男女做爰真人视频直播| 在线a久青草视频在线观看| 国产精品久久久久久人妻精品| 女人被狂c躁到高潮视频| 国产亚洲精品久久久久久牛牛| 99久久人妻无码精品系列| 色综合天天综合网国产| 成在线人永久免费视频播放 | 熟女成人影片| a片入口| 黑人无码视频| 99精品视频在线观看| 仙游县| 人妻无码TⅤ| 亚洲成人资源| 好吊妞视频这里有精品|