<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      小米發了個 310B:性能不一定最強,但路線很現實

      0
      分享至

      今天我有一個考試,考試前的半個小時刷twitter,看到了小米發布的模型,但是沒顧得上仔細看,晚上再看的時候。

      覺得這貌似是前DeepSeek的核心參與者Fuli Luo,到新公司小米之后正式發布的第一條twitter,所以從含金量上來說肯定是拉滿了。


      當然事實上也的確是,從小米的huggingface上可以看到,MiMo-V2-Flash是一個單獨的系列,相比起其他系列,這個系列最大的特點就是大,足足有310B,而其他的都只有8B。


      很明顯的,8B的模型唯一的優勢就是速度快,但是要談到能用的程序,還遠遠不夠。

      而310B這個量級,基本上可以說是夠用了。

      為什么說是夠用呢,因為小米這種公司本身就不是搞AI的,所以把AI刷到世界第一既不可能,也沒有太大的必要。

      最重要的是夠用和好用,最好是能跟小米的整個硬件生態關聯上。

      有些人可能會提到這不就是刷Benchmark嗎?這話怎么說的。沒有新出的大模型不刷Benchmark的,因為如果沒有在benchmark上達到sota,那就根本沒有發布的意義。


      其實刷benchmark也是有策略的,大多數情況就是小米這樣,拿通用的benchmark跑一遍,跑到大多數達到sota即可。

      而有些公司,比如OpenAI,他們是發現普通的benchmark都被刷爛了,再刷也很難體現他們的斷崖式領先了,所以他們會有動力搞新的benchmark,這就是所謂的規則制定者。

      所以,刷榜正常也非常的必要。

      至于真實的使用性能,我覺得對于小米的模型來說,能夠實現deepseek級別的理解能力,其余的都應該放到efficient上。

      而實際上小米的整個模型也是這么干的。

      01

      小米模型的技術策略

      第一,架構設計

      5層Sliding Window Attenion(SWA)+1層Global Attention(GA),然后重復8次,可以大多數的層都很省,只有1/9的層在做大批量運算。



      但SWA的窗口很小,所以出現attention sink,看起來MiMO專門在這個地方打了補丁。

      第二,Lightweight Multi-Token Prediction(MTP):輕量多 token 預測

      傳統的大模型一個token一個token的吐,慢和貴,一次性吐好幾個肯定快,但是穩定性就很難說了。

      它這里提到的Speculative Decoding(投機解碼),就是用一個小模型先“草擬一串 token”,大模型再驗證/修正。

      看起來MiMO模型原生的集成了這個模塊,讓大模型自己在一步里“預測多個未來 token”,而不是傳統的另外訓練一個“草稿模型”。

      基本上就是用hybrid attention(SWA +GA) + MTP這倆工具把“長上下文 + 推理速度”這兩大痛點壓下去(省顯存、省算力、輸出更快),打造出了這一款最新的國產大模型。

      速度肯定是快,因為很多巧思都用在了速度和效率上。

      但是天下沒有免費的午餐。

      性能肯定不會拔尖,但是我覺得對于小米來說關系不大,快和能用比較重要。

      02

      小米模型的性能優化

      在性能上,看起來小米干了三件事:

      Multi-Teacher On-Policy Distillation (MOPD)

      第一個很有意思,最近看了一個帖子,說是的2025年最流行的Policy Optimization algorithms,看起來小米自己也做了一個MOPD,不過好不好用現在還很難說,過幾個月看有多少人用就知道了。

      PPO (Proximal Policy Optimization)

      GRPO (Group Relative)

      GSPO (Group Sequence)

      DAPO (Decoupled Clip and Dynamic sAmpling)

      BAPO (BAlanced)

      ARPO (Agentic Reinforced)

      Scaling Agentic RL

      第二個,Scaling Agentic RL

      我覺得這應該是小米的強項,因為它的小米生態里面有太多的任務可以拿來測試了,甚至這應該是小米未來最強的點。

      就跟Nano Banana之于Google一樣,人家的強項就是數據,OpenAI的圖像生成你再怎么搞也不可能老大。

      而小米的優勢就是硬件生態,甚至說能搞出豆包AI手機一樣的東西也不是不可能。

      Advanced RL Infrastructure

      第三個,Advanced RL Infrastructure

      講的是大規模訓練時候的細節問題,本質上就是“你論文里寫一句話,工程上要填一萬個坑”的那種東西:MoE 的路由一致性、rollout 和訓練對齊、前綴緩存、多輪工具調用的資源調度、長尾任務拖慢 GPU 利用率,都是這種體系一旦做大就繞不開的臟活累活。

      這部分一般不太容易刷出一個“新算法名字”,但反而最能體現一個團隊到底有沒有真把系統跑起來。

      所以我對 MiMo-V2-Flash 的整體判斷很簡單:它不是那種要拿第一名的模型,而是那種“為了能落地、能跑得快、能接得上產品”而做出來的模型。

      如果小米接下來能把它真正放進自己的硬件生態里,讓它變成一個穩定可用的能力層(而不是停留在論文和榜單里),那它的意義會比單純刷幾個分大得多。

      至于它最后能走多遠,其實就看兩件事:

      第一,有多少開發者愿意用它、圍繞它做應用。

      第二,小米能不能把“模型”變成“系統能力”,從手機到家電到車機,真正連成一條鏈。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      老同志借而不還的畫,現估價8800萬現身拍賣會這個老東西究竟是誰

      老同志借而不還的畫,現估價8800萬現身拍賣會這個老東西究竟是誰

      深度報
      2025-12-22 22:36:02
      1-0!鐵衛處子球,曼聯復仇紐卡升英超第五,烏加特甩掉災星帽子

      1-0!鐵衛處子球,曼聯復仇紐卡升英超第五,烏加特甩掉災星帽子

      釘釘陌上花開
      2025-12-27 08:00:23
      RYBAR改口:庫皮揚斯克失守,俄系軍博的“最后防線”也塌了

      RYBAR改口:庫皮揚斯克失守,俄系軍博的“最后防線”也塌了

      老馬拉車莫少裝
      2025-12-24 21:28:37
      央地交流,侯延波赴吉林履新

      央地交流,侯延波赴吉林履新

      吉刻新聞
      2025-12-27 12:18:02
      價格飆升,多地零售價突破10元/斤!年初一斤僅一兩元,網友:雞蛋都快配不上它了……

      價格飆升,多地零售價突破10元/斤!年初一斤僅一兩元,網友:雞蛋都快配不上它了……

      每日經濟新聞
      2025-12-26 10:01:26
      若有一天中日開戰,日退役少將預言三大后果,日本唯一生機曝光?

      若有一天中日開戰,日退役少將預言三大后果,日本唯一生機曝光?

      比利
      2025-12-26 20:59:23
      緊急提醒!這款常用藥或導致自殺傾向

      緊急提醒!這款常用藥或導致自殺傾向

      中國新聞周刊
      2025-12-27 12:29:03
      生殖科最奇葩的事是什么?網友:這個科絕對是最有錢成本最低的科

      生殖科最奇葩的事是什么?網友:這個科絕對是最有錢成本最低的科

      帶你感受人間冷暖
      2025-12-25 00:05:19
      《獻血法》頒布實施至今 全國無償獻血累計3.08億人次 保障獻血者權益從多個維度持續發力

      《獻血法》頒布實施至今 全國無償獻血累計3.08億人次 保障獻血者權益從多個維度持續發力

      每日經濟新聞
      2025-12-26 18:08:17
      甘肅女博士張明玉剛生完孩子,被丈夫提刀割喉,丈夫:你真臟

      甘肅女博士張明玉剛生完孩子,被丈夫提刀割喉,丈夫:你真臟

      天字號野史
      2024-11-18 23:49:45
      頂流空降深圳!有人早上開始排隊

      頂流空降深圳!有人早上開始排隊

      深圳晚報
      2025-12-26 22:19:48
      37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責造謠者

      37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責造謠者

      粵語經典歌單
      2025-12-27 09:09:49
      陜北革命老區邁入“高鐵時代”

      陜北革命老區邁入“高鐵時代”

      人民網
      2025-12-27 09:11:15
      悲催!廣東一臺資工廠結業,聲稱6月起沒有訂單,將依法支付補償

      悲催!廣東一臺資工廠結業,聲稱6月起沒有訂單,將依法支付補償

      火山詩話
      2025-12-27 13:42:15
      不到24小時,歐豪發三大喜訊竟暗自追隨謝霆鋒的腳步

      不到24小時,歐豪發三大喜訊竟暗自追隨謝霆鋒的腳步

      手工制作阿殲
      2025-12-27 11:36:56
      不到48小時,高市大反轉,支持率飆升至92.4%,日本發生了什么?

      不到48小時,高市大反轉,支持率飆升至92.4%,日本發生了什么?

      鐵錘簡科
      2025-12-26 19:23:46
      21歲男子趁表姐熟睡欲與其發生關系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      21歲男子趁表姐熟睡欲與其發生關系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      紅星新聞
      2025-12-26 17:20:10
      醫學博士:腫瘤越來越高發,我們究竟被隱瞞了什么?

      醫學博士:腫瘤越來越高發,我們究竟被隱瞞了什么?

      深度報
      2025-12-21 23:01:02
      太奇葩了,中國籃協宣布重要決定,球迷怒噴,中國籃球又成為笑話

      太奇葩了,中國籃協宣布重要決定,球迷怒噴,中國籃球又成為笑話

      宗介說體育
      2025-12-27 15:42:19
      從承諾歸還搶走的土地,到提出出海權,俄國時隔100年又服軟了?

      從承諾歸還搶走的土地,到提出出海權,俄國時隔100年又服軟了?

      近史博覽
      2025-12-20 10:50:02
      2025-12-27 16:39:00
      平凡AI incentive-icons
      平凡AI
      高校AI從業者
      54文章數 23關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業界稱終端再不漲明年必虧

      頭條要聞

      男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

      頭條要聞

      男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

      財經要聞

      注意,開始拉物價了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態度原創

      教育
      手機
      房產
      健康
      公開課

      教育要聞

      附加題難倒了學霸!陰影部分面積為90,求空白正方形的面積

      手機要聞

      吳彥祖開箱小米17 Ultra徠卡版:So cool

      房產要聞

      年銷20億+!中交·藍色港灣用好房子致敬好生活

      這些新療法,讓化療不再那么痛苦

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品无码a∨麻豆| 亚洲综合性| 人妻有码中文字幕在线| 十八岁以下禁止观看黄下载链接| 久久久精品午夜免费不卡 | 无码色色| 国产99久60在线视频 | 传媒| 国产午夜福利短视频| 亚洲色宗合| 亚洲人成亚洲人成在线观看| 日韩精品一区二区三区激情视频| 精品丝袜人妻久久久久久| 一本色道久久综合无码人妻| 人妻丰满熟妇无码区免费| 国产综合精品一区二区三区| 少妇一晚三次一区二区三区| 日逼免费视频| jizzjizz亚洲| 精品人妻系列无码天堂| 乱60一70归性欧老妇| 成在线人永久免费视频播放 | 性欧美老妇另类xxxx| 激烈的性高湖波多野结衣| 欧美一区二区| 欧美最新精品videossexohd| 在线视频精品中文无码| 国产午夜亚洲精品不卡下载| 久久综合九色综合欧美狠狠 | 亚洲男人皇宫| 日韩丨亚洲丨制服|痴汉| 国产视频最新| 欧美videos粗暴| 国产免费自拍视频| 国产成人精品无码专区| xxxx国产| 巨乳无码| 一本一道久久综合狠狠躁牛牛影视| 国产在线乱子伦一区二区| 亚洲大尺度无码无码专线| 亚洲国产精品综合久久20| 国产绿帽在线视频看|