<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      雷軍的AI福將?羅福莉交出萬億參數模型大作業,林俊旸點贊

      0
      分享至



      出品|搜狐科技

      作者|常博碩

      編輯| 楊 錦

      真相大白了,Hunter Alpha原來是小米羅福莉的“作業”。

      事情還要回溯到3月11日,當天全球最大API聚合平臺OpenRouter上突然出現了一個代號為Hunter Alpha的模型。短短七天內,累計調用量突破1萬億Token,連續多日登頂榜單。


      這個模型沒有標注開發者身份,于3月11日以“隱身模型”形式發布,且向開發者提供免費訪問。測試顯示,該系統具備1萬億參數規模和高達100萬token的上下文窗口。

      由于模型自稱是主要以中文訓練的中國AI模型,知識截止時間為2025年5月,不管是性能參數還是知識時間節點都和DeepSeek之前的模型風格很相似,于是市場便紛紛猜測這可能是DeepSeek在正式發布前對其下一代系統進行的秘密測試。

      然而,昨天小米 MiMo 團隊正式認領了該模型,Hunter Alpha是小米旗艦模型MiMo-V2-Pro的內部測試版本。目前,小米AI團隊領軍人物是前DeepSeek 核心研究員羅福莉,或許這也是為什么Hunter Alpha會讓大家“幻視”DeepSeek吧。


      小米也想上桌

      在小米新品發布會上,雷軍正式發布小米首款自研旗艦大模型Xiaomi MiMo-V2-Pro,此外,小米還推出了相關系列模型MiMo-V2-Omni 和 TTS。

      過去一年,小米在AI領域的存在感并不強。既沒有阿里那樣做基模也不像DeepSeek 在社區靠開源爆火,更像是硬件和生態玩家。但這次Hunter Alpha的表現直接說明,小米已經擁有一支能做萬億級模型的團隊。

      此次小米共發布三款模型,MiMo-V2-Pro(原Hunter Alpha)是一款面向Agent時代的旗艦基座模型??倕盗?萬億,激活參數控制在42B,并支持1M超長上下文。

      MiMo-V2-Omni(原Healer Alpha):全模態理解模型。專為需要快速反應和低延遲的真實場景打造,能夠同時處理文本、圖像、音頻乃至長達一小時的視頻輸入。

      MiMo-V2-TTS則是一款擬人語音大模型。

      具體來看,MiMo-V2-Pro是此次受關注最高的一款模型,也是小米正式進軍智能體時代的標志。與傳統以對話體驗為核心優化目標的語言模型不同,它的設計起點并非“生成回答”,而是作為 Agent 系統的中樞,能夠理解目標、規劃步驟、調用外部工具,并在多階段執行過程中持續修正路徑,最終完成任務閉環。

      從模型架構來看,MiMo-V2-Pro 采用超大規模稀疏化設計,總參數規模達到萬億級(1T),其中單次推理的激活參數約為 42B。

      這一結構本質上是對 MoE(Mixture-of-Experts)體系的進一步工程化實現,大規模專家網絡承載知識容量,同時在推理階段僅激活部分子網絡,這就能夠在不增加計算成本的情況下擴展模型表達能力。

      在注意力機制上,MiMo-V2-Pro 引入改進后的路由注意力(Hybrid Attention)結構,將局部窗口注意力與全局注意力進行分層組合。通過窗口化機制限制計算復雜度的同時還能通過全局路徑保留長距離依賴。

      這就使得模型能夠在長上下文場景下維持穩定推理,不會出現典型的注意力退化問題。

      MiMo-V2-Pro的上下文窗口進一步擴展至100萬Token。在多步驟任務執行中,模型可以在單次上下文內保留完整的中間狀態、工具調用結果以及歷史決策路徑,從而避免頻繁的上下文重建或外部檢索。這一特性對于Agent系統尤為關鍵,使其能夠在長鏈路任務中保持一致性與連貫性。

      在此前以Hunter Alpha代號進行的匿名測試階段,這些能力已經有所體現。根據OpenRouter官網的調用數據,模型在上線后使用場景更多是代碼生成、開發工具與自動化任務。

      從跑分上來看,MiMo-V2-Pro表現確實很不錯。

      在通用Agent能力評估(ClawEval)中,MiMo-V2-Pro得分61.5,逼近Claude Opus 4.6;在PinchBench測試中排名全球前三。在編碼能力方面,其表現甚至超過Claude Sonnet 4.6,接近更高端的Opus級別。

      定價上,MiMo-V2-Pro在256K上下文長度內,輸入token單價為每百萬1美元,輸出為每百萬3美元;即使擴展到100萬上下文,輸入也只需每百萬2美元,輸出每百萬6美元,價格約Claude Opus 4.6的五分之一。


      林俊旸點贊羅福莉

      羅福莉,是這次 MiMo 模型體系中一個繞不開的關鍵人物。她本科畢業于北京師范大學計算機專業,碩士畢業于北京大學計算語言學研究所。曾任職于阿里巴巴達摩院、幻方量化及DeepSeek(深度求索)。

      在阿里期間,她主導開發了多語言預訓練模型VECO;在DeepSeek期間,她是MoE大模型DeepSeek-V2的關鍵開發者之一。2025年11月,羅福莉加入小米,負責領導MiMo大模型團隊。

      這次的MiMo-V2-Pro,是羅福莉加入小米后交的第一份大作業。

      在模型公布后,她在自己的社交主頁寫道:MiMo-V2-Pro、Omni 和 TTS 正式發布。這是我們首個真正為智能體時代打造的全棧模型系列。我稱之為一次悄無聲息的突襲——并非因為我們事先計劃好的,而是因為從聊天模式到智能體模式的轉變發生得太快,連我們自己都難以置信。在這期間,我們經歷了一個既激動人心又痛苦不堪,同時又令人著迷的過程。

      據羅福莉表示,1T 基礎模型早在幾個月前就開始訓練了。最初的目標是提高長上下文推理的效率。混合注意力機制帶來了真正的創新,卻又不至于過度擴張。事實證明,它正是智能體時代的理想基礎。1M 的上下文窗口。MTP 推理技術實現了超低延遲和成本。這些架構決策并非一時風尚,而是我們在需要之前就構建的結構性優勢。真正改變一切的是第一次體驗到復雜的智能體框架。

      她還透露,自己給團隊下了硬性指標:MiMo團隊中,每天與AI對話少于100次的人都可以辭職。

      在羅福莉看來,一旦團隊的想象力被智能系統的功能所激發,這種想象力就直接轉化為研發速度。

      她還透露,當模型足夠穩定值得開源的時候,她會選擇開源。隨后,前阿里巴巴通義千問(Qwen)系列大模型核心技術負責人林俊旸點贊了該帖,并評論道:“太棒了?!?/p>


      模型發布后,雷軍第一時間表示,“我們剛發布萬億參數大模型 Mimo-V2-Pro。在全球大模型綜合智能排行榜 Artificial Analysis 上,位列全球第八。按大模型品牌來排名,排在全球第五,超過了xAI Grok。我們模型剛剛完成,未來一段時間,還會快速迭代增強?!?/p>

      同時他也承認,小米一直以來在AI領域相對比較低調,實際進展可能比大家看到的要快很多。

      對于進軍AI這件事,雷軍并不吝嗇,他表示:“我們今年的研發和資本投入就將超過160億元。我相信,只要我們堅持持續投入,小米在AI時代一定會交出一份靚麗的答卷?!?/p>



      運營編輯 |曹倩審核|孟莎莎




      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      先被里瓦爾多全面逆襲,后遭齊達內強勢碾壓,全能戰士時運不濟

      先被里瓦爾多全面逆襲,后遭齊達內強勢碾壓,全能戰士時運不濟

      足籃大世界
      2026-03-26 10:52:09
      每吃一次,大腦萎縮就快一步?勸告:這4物是老年癡呆催化劑

      每吃一次,大腦萎縮就快一步?勸告:這4物是老年癡呆催化劑

      墜入二次元的海洋
      2026-03-26 18:16:38
      越南急著修高鐵中國就是不出手,無奈只能去找新的冤大頭

      越南急著修高鐵中國就是不出手,無奈只能去找新的冤大頭

      照亮你的前行之路
      2026-03-26 14:20:40
      柯文哲案一審宣判牽動臺政壇

      柯文哲案一審宣判牽動臺政壇

      環球時報國際
      2026-03-26 14:09:09
      “針織衫+褲子+半裙”火出圈,怎么搭配都時髦,美炸了!

      “針織衫+褲子+半裙”火出圈,怎么搭配都時髦,美炸了!

      何有強
      2026-03-25 21:07:39
      伊朗愿意與“主和派”萬斯談!特朗普一邊宣稱勝利一邊增兵中東:我和魯比奧也要參與

      伊朗愿意與“主和派”萬斯談!特朗普一邊宣稱勝利一邊增兵中東:我和魯比奧也要參與

      紅星新聞
      2026-03-25 17:17:14
      比亞迪推出革命性可變磁通電機,徹底解決電動車高速掉電難題

      比亞迪推出革命性可變磁通電機,徹底解決電動車高速掉電難題

      娛樂圈的筆娛君
      2026-03-26 17:21:17
      他把黃渤捧紅,自己卻兩次坐牢,出獄后黃渤的做法讓人佩服

      他把黃渤捧紅,自己卻兩次坐牢,出獄后黃渤的做法讓人佩服

      無處遁形
      2026-03-18 04:37:04
      語出驚人!摩根大通CEO戴蒙稱,伊朗戰爭長期來看是好事!為什么這樣說?

      語出驚人!摩根大通CEO戴蒙稱,伊朗戰爭長期來看是好事!為什么這樣說?

      王爺說圖表
      2026-03-25 18:51:12
      48小時倒計時!以色列突然對伊朗瘋狂輸出,這是被逼到墻角嗎?

      48小時倒計時!以色列突然對伊朗瘋狂輸出,這是被逼到墻角嗎?

      浯江孤舟
      2026-03-26 20:35:32
      凱特戴6000塊的帽子險出洋相!助手說漏嘴,意外爆出威廉的瓜?

      凱特戴6000塊的帽子險出洋相!助手說漏嘴,意外爆出威廉的瓜?

      白露文娛志
      2026-03-26 16:41:18
      上海警方發布警情通報:左某某已被警方依法刑事拘留

      上海警方發布警情通報:左某某已被警方依法刑事拘留

      新京報
      2026-03-25 20:46:14
      懷孕傳聞真相大白后,翁帆突傳“喜訊”,楊振寧終于可以放心了!

      懷孕傳聞真相大白后,翁帆突傳“喜訊”,楊振寧終于可以放心了!

      丁丁鯉史紀
      2026-03-25 16:35:13
      周杰倫新專輯《太陽之子》狂賣8000萬:AI無法替代的1%

      周杰倫新專輯《太陽之子》狂賣8000萬:AI無法替代的1%

      娛樂獨角獸
      2026-03-25 22:11:07
      戰場奇跡!1臺烏軍機器人死守陣地45天硬剛俄軍沖殺和機槍掃射

      戰場奇跡!1臺烏軍機器人死守陣地45天硬剛俄軍沖殺和機槍掃射

      子桑說
      2026-03-25 17:27:05
      你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

      你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

      夜深愛雜談
      2026-02-01 18:57:04
      剛剛發布!2026年QS世界大學學科排名:北大榜首,浙大第二,清華復旦并列第三

      剛剛發布!2026年QS世界大學學科排名:北大榜首,浙大第二,清華復旦并列第三

      TOP大學來了
      2026-03-26 00:06:23
      巴基斯坦把稀土賣給美國,以為捏住中國“七寸”,其實在玩火自焚

      巴基斯坦把稀土賣給美國,以為捏住中國“七寸”,其實在玩火自焚

      通文知史
      2026-03-24 08:35:03
      沙特實戰封神!中國“天盾”21發全中,15億美制系統竟慘遭反殺

      沙特實戰封神!中國“天盾”21發全中,15億美制系統竟慘遭反殺

      素衣讀史
      2026-03-25 21:26:46
      73歲港姐為李小龍哥哥掃墓,墓前鋪滿白花,離婚逾30年仍每年拜祭

      73歲港姐為李小龍哥哥掃墓,墓前鋪滿白花,離婚逾30年仍每年拜祭

      八斗小先生
      2026-03-26 15:02:47
      2026-03-26 23:03:00
      搜狐科技 incentive-icons
      搜狐科技
      搜狐科技官方賬號
      4745文章數 9183關注度
      往期回顧 全部

      科技要聞

      美團發布外賣大戰后成績單:虧損超200億

      頭條要聞

      張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

      頭條要聞

      張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

      體育要聞

      申京努力了,然而杜蘭特啊

      娛樂要聞

      劉曉慶妹妹發聲!稱姐姐受身邊人挑撥

      財經要聞

      油價"馴服"特朗普?一到100美元就TACO

      汽車要聞

      一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

      態度原創

      本地
      時尚
      數碼
      公開課
      軍事航空

      本地新聞

      救命,這只醬板鴨已經在我手機復仇了一萬遍

      這些才是適合春季的穿搭!不沉悶、不單調,大方靚麗又減齡

      數碼要聞

      Intel IBOT加速技術揭秘!硬件不變 白嫖22%游戲性能

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      擔心特朗普突然停戰 以總理下令48小時盡力摧毀伊設施

      無障礙瀏覽 進入關懷版