4月23日,小米MiMo V2.5系列模型開啟公測(cè)。根據(jù)官方介紹,該系列模型具有更強(qiáng)的推理能力、更穩(wěn)定的Agent。
另外,它還有多模態(tài)感知能力,不僅能看懂文本,還能理解圖片、音頻等信息。而且,在Artificial Analysis榜單中,Xiaomi MiMo-V2.5-Pro綜合智能指數(shù)位列全球開源大模型第一。
![]()
(圖源:小米)
既然小米這款大模型能力這么強(qiáng),我們就來(lái)實(shí)際測(cè)試一下,看看它在哪些場(chǎng)景下有出色的表現(xiàn),同時(shí)又有哪些要改進(jìn)的地方。
MiMo V2.5實(shí)測(cè):模型能力很強(qiáng),聯(lián)網(wǎng)檢索稍弱
目前,MiMo V2.5系列已經(jīng)開放公測(cè),所有小米用戶都能在MiMo官網(wǎng)直接體驗(yàn)MiMo V2.5、MiMo V2.5 Pro等模型產(chǎn)品。
網(wǎng)頁(yè)端這種使用場(chǎng)景不能百分百發(fā)揮出大模型的潛力,但作為摸底考試來(lái)說(shuō)問(wèn)題不大。我們結(jié)合日常實(shí)際使用習(xí)慣,通過(guò)五個(gè)具體案例,來(lái)看看MiMo V2.5的真實(shí)實(shí)力。
案例一:文章總結(jié)
長(zhǎng)文概括總結(jié)基本是當(dāng)下主流大模型的基礎(chǔ)能力,作為這次實(shí)測(cè)的開胃菜再合適不過(guò)了。
我們把雷科技(ID:leitech)最近寫的一篇關(guān)于ChatGPT Images 2.0評(píng)測(cè)的圖文內(nèi)容鏈接丟給它分析, MiMo V2.5 Pro的反應(yīng)很迅速,2秒鐘就生成了結(jié)果。它對(duì)文章內(nèi)容的概括非常準(zhǔn)確,把文章中針對(duì)ChatGPT Images 2.0的優(yōu)缺點(diǎn)評(píng)價(jià)都提煉了出來(lái)。
![]()
(圖源:雷科技)
當(dāng)然,這只是基本功,主流大模型一般都能比較好地完成這項(xiàng)任務(wù),接下來(lái)我們就要加大力度了。
案例二:盤點(diǎn)一下小米2025年發(fā)布過(guò)的手機(jī)型號(hào)
這個(gè)問(wèn)題主要考驗(yàn)的是MiMo-V2.5 Pro的信息聯(lián)網(wǎng)檢索能力,坦率說(shuō),它表現(xiàn)得比較一般。
首先,MiMo-V2.5 Pro羅列出的小米15系列是2024年發(fā)布的,并不是2025年的機(jī)型。
![]()
(圖源:雷科技)
查看其信息來(lái)源后,我們發(fā)現(xiàn)它是被一篇博客文章誤導(dǎo)了,這篇博文羅列了多款小米手機(jī)發(fā)布時(shí)間,但很多是錯(cuò)的,甚至很有可能本身也是AI生成的。
![]()
(顯示錯(cuò)誤信息的網(wǎng)頁(yè),圖源:雷科技)
其次,不少機(jī)型被遺漏了,比如最重要的小米17系列。另外,它還出現(xiàn)了一些錯(cuò)誤,MiMo-V2.5 Pro在檢索了早期的爆料信息后,誤以為小米15S Pro還沒發(fā)布,但實(shí)際上它就是一款2025年發(fā)布的機(jī)型。
![]()
(圖源:雷科技)
當(dāng)然,圍繞這個(gè)問(wèn)題,其他大模型的表現(xiàn)也都很難稱得上完美。公認(rèn)聯(lián)網(wǎng)搜索能力很強(qiáng)的Gemini 3.1 Pro就翻車了,它出現(xiàn)嚴(yán)重幻覺,居然虛構(gòu)出了小米16系列。而DeepSeek反而是表現(xiàn)相對(duì)較好的,把小米和紅米機(jī)型基本都盤點(diǎn)全了,還顧及到了很多大模型忽略的海外品牌POCO,當(dāng)然它也遺漏了小米15S Pro。
![]()
(圖源:雷科技)
案例三:去洗車店洗車應(yīng)該走路去還是開車去?
這是之前非常經(jīng)典的「忽悠」大模型的問(wèn)題,曾經(jīng)ChatGPT等知名模型都翻車了,它主要考驗(yàn)的就是模型本身的邏輯推理能力。一個(gè)在真人看來(lái)很簡(jiǎn)單的邏輯題,但對(duì)沒有針對(duì)性做過(guò)訓(xùn)練的大模型來(lái)說(shuō),就很容易掉坑里。
面對(duì)這個(gè)問(wèn)題,MiMo V2.5 Pro沒有被繞進(jìn)去,而是直接了當(dāng)?shù)刂赋隽岁P(guān)鍵:要洗的是車,不是人,洗車的前提是車必須得過(guò)去。
![]()
(圖源:雷科技)
案例四:幫我看看醫(yī)院的檢驗(yàn)報(bào)告
MiMo V2.5有一個(gè)重要亮點(diǎn)就是支持多模態(tài),根據(jù)官方介紹,它在文本和代碼之外,還支持圖像、視頻和語(yǔ)音(MiMo V2.5 Pro暫不支持)。所以,我們可以以圖片等多媒體文件的形式進(jìn)行輸入。實(shí)際體驗(yàn)中,我找了一張醫(yī)院檢查的圖片給它,MiMo V2.5很快識(shí)別出了是哪項(xiàng)檢查,并且結(jié)合獲取到的數(shù)據(jù),給出了具體的結(jié)論和建議。
![]()
(圖源:雷科技)
另外,普通的照片也能丟給它,比如我塞給它一張很模糊的、logo被遮擋的Switch圖片,MiMo-V2.5準(zhǔn)確識(shí)別出了它是Switch,并且表示是OLED版。
這項(xiàng)功能放在具體的終端設(shè)備上的話,可以進(jìn)一步拓展使用場(chǎng)景,比如手機(jī)打開相機(jī)就能把畫面實(shí)時(shí)交給AI分析、導(dǎo)航時(shí)根據(jù)相機(jī)識(shí)別出用戶所在的精準(zhǔn)坐標(biāo)等。
![]()
(圖源:雷科技)
案例五:做一個(gè)瀏覽器能運(yùn)行的小游戲
一直以來(lái),大模型的代碼能力都很被看重。作為一個(gè)編程小白,我更關(guān)心的是它能不能根據(jù)我的需求生成一個(gè)能直接運(yùn)行的程序,不用再做任何額外的工作。
首先,我提了一個(gè)基礎(chǔ)編程課上的簡(jiǎn)單案例:生成一個(gè)解一元二次方程的程序。MiMo-V2.5 Pro很快就開始寫代碼了,馬上做出了一個(gè)可以在瀏覽器上直接運(yùn)行的HTML文件。我只要在程序界面填入對(duì)應(yīng)的數(shù)字,它就能算出結(jié)果。
![]()
(圖源:雷科技)
然后,我們加大了難度,讓它寫一個(gè)圍棋的程序,它的代碼更加復(fù)雜,還要圍繞UI設(shè)計(jì)做很多工作。MiMo-V2.5 Pro處理這項(xiàng)任務(wù)也毫無(wú)壓力,將它生成的代碼直接運(yùn)行,就能在圍棋程序里面下棋了。
![]()
(圖源:雷科技)
MiMo Claw來(lái)了,小米「龍蝦」好用嗎?
伴隨著MiMo-V2.5系列的發(fā)布,小米還同步上線了MiMo Claw。不過(guò),這款龍蝦目前還處于測(cè)試階段,通過(guò)在網(wǎng)頁(yè)端運(yùn)行的模式提供給用戶使用。
它的單次體驗(yàn)限時(shí)1小時(shí),超時(shí)后原有的數(shù)據(jù)會(huì)被銷毀,用戶可以重新創(chuàng)建一個(gè)Claw項(xiàng)目再次體驗(yàn)。我們通過(guò)新聞抓取、財(cái)報(bào)分析和文檔優(yōu)化三個(gè)場(chǎng)景來(lái)測(cè)試這款龍蝦的實(shí)際表現(xiàn)。
場(chǎng)景一:新聞抓取
我給MiMo Claw出了一個(gè)不大不小的難題:搜索當(dāng)天的科技要聞,并且按照指定的懷舊風(fēng)格生成一張海報(bào)。這主要考驗(yàn)它的兩個(gè)能力,一是信息檢索,二是作圖。
從實(shí)測(cè)結(jié)果來(lái)看,作為一款還在公測(cè)的「龍蝦」,它的表現(xiàn)還可以,至少模仿90年代雜志風(fēng)格這方面做得挺不錯(cuò)的,而且排版基本沒出現(xiàn)大問(wèn)題。
當(dāng)然,還是老問(wèn)題,它的信息聯(lián)網(wǎng)檢索能力一般,搜集了一些舊聞,時(shí)效性差點(diǎn)意思。但整體來(lái)說(shuō),這個(gè)效果已經(jīng)很好了,效率也比人工高。
![]()
(圖源:雷科技)
場(chǎng)景二:財(cái)報(bào)分析
很多海外大公司發(fā)布的財(cái)報(bào)文件,篇幅很長(zhǎng)、數(shù)據(jù)很多,而且基本是英文,國(guó)內(nèi)投資者要看懂看透,難度不小。我們嘗試把一份28頁(yè)的蘋果財(cái)報(bào)PDF文件丟給MiMo Claw,讓它來(lái)分析和總結(jié)。
![]()
(圖源:雷科技)
MiMo Claw的表現(xiàn)很給力,比較精準(zhǔn)地概括了這份財(cái)報(bào)數(shù)據(jù)的重點(diǎn),并且給出了結(jié)論:
1. iPhone 是絕對(duì)功臣
2. 研發(fā)投入暴增31.7%
3. 服務(wù)業(yè)務(wù)穩(wěn)健增長(zhǎng)但增速放緩
4. Mac和可穿戴拖后腿
5. 現(xiàn)金流極其充沛
![]()
(圖源:雷科技)
在查看MiMo Claw的工作流時(shí),我們發(fā)現(xiàn),它首先會(huì)把PDF文件中的文本信息全部提取出來(lái),在云端以TXT文件保存,再將這份文檔進(jìn)行翻譯、分析,最后歸納總結(jié)。不過(guò),由于它是基于網(wǎng)頁(yè)端運(yùn)行的,所以實(shí)際體驗(yàn)沒能和主流的網(wǎng)頁(yè)端大模型拉開很大的差距。
場(chǎng)景三:文檔優(yōu)化
對(duì)于MiMo Claw的能力,小米官方提到了它與金山生態(tài)達(dá)成了合作,在Office文檔處理方面會(huì)有優(yōu)勢(shì)。我個(gè)人一直都是PPT苦手,難點(diǎn)不在于內(nèi)容填充,主要是排版。畢竟,PPT給人的第一印象往往是由版面美觀度決定的。
為了「拷打」MiMo Claw,我特意找了個(gè)排版風(fēng)格非常陳舊的大學(xué)課件,這個(gè)PPT一打開,完全是90年代的風(fēng)格,而且毫無(wú)排版設(shè)計(jì)可言。
![]()
(圖源:雷科技)
我們將這個(gè)PPT喂給MiMo Claw,并且要求它著重美化排版,具體參考科技公司的Keynote。坦率說(shuō),我對(duì)最后的成品沒有抱太多期待,主要是因?yàn)镻PT美化的難度比純粹修改文本高很多,需要龍蝦工具在模型、智能體和Skills方面都有很強(qiáng)的能力。
然后,從MiMo Claw最后生成的PPT文件來(lái)看,整體排版效果好了非常多,至少字體顏色比原版正常很多,看著更舒服。別的不說(shuō),原版PPT那種陳舊毫無(wú)美觀度可言的版面,總算消失了。
![]()
(圖源:雷科技)
終端品牌入局大模型,小米有長(zhǎng)遠(yuǎn)打算
由于還在公測(cè)階段,MiMo-V2.5系列大模型以及MiMo Claw在實(shí)際使用中自然還會(huì)存在一些問(wèn)題,但我們已經(jīng)能感受它較為出色的模型和Agent能力。
同時(shí),這次的大規(guī)模公測(cè),大量用戶的實(shí)測(cè)和反饋,也能給小米提供一些改進(jìn)的方向。從小米的規(guī)劃來(lái)看,MiMo-V2.5系列不僅面向普通用戶,更面向廣大開發(fā)者。伴隨這次公測(cè),小米MiMo-V2.5系列的Token付費(fèi)服務(wù)也一并上線。
當(dāng)然,我們也認(rèn)為,對(duì)于小米而言,不遺余力地迭代大模型,絕不僅僅是為了在發(fā)布會(huì)上秀技術(shù)肌肉和賺點(diǎn)服務(wù)費(fèi),其真正的野心在于深度賦能旗下龐大的消費(fèi)核心業(yè)務(wù)。
就拿我們最熟悉的小愛同學(xué)來(lái)說(shuō),如果融入MiMo-V2.5系列的全模態(tài)能力,它將迎來(lái)一次跨越式的進(jìn)化。固有印象中的小愛同學(xué),更多是一個(gè)被動(dòng)的指令執(zhí)行工具,用戶發(fā)號(hào)施令,它按部就班地開關(guān)電器或是定鬧鐘。
但在全模態(tài)大模型的加持下,它正在轉(zhuǎn)型成為一位真正的超級(jí)管家。它不僅能直接看懂用戶手機(jī)或平板屏幕上的內(nèi)容并進(jìn)行深度交互,更能敏銳地聽懂家庭場(chǎng)景中那些模糊的自然語(yǔ)言,理解背后復(fù)雜的真實(shí)意圖。
![]()
(圖源:小米)
小米自家的AI技術(shù),不僅能應(yīng)用到手機(jī)這類單品中,還能廣泛融入小米的「人車家」生態(tài)中,為更多產(chǎn)品、更多應(yīng)用場(chǎng)景提供支持。可以預(yù)見的是,小米未來(lái)的產(chǎn)品藍(lán)圖肯定不局限于智能家居和汽車,還將包括人形機(jī)器人、其他形式的AI硬件等。
可以說(shuō),如今的大模型已經(jīng)徹底跳出了發(fā)布會(huì)上那些干巴巴跑分和技術(shù)指標(biāo),成長(zhǎng)為真正打通并盤活各種智能場(chǎng)景生態(tài)的核心大腦。從更行業(yè)視角來(lái)看,這不僅是小米一家的戰(zhàn)略,更是整個(gè)智能終端賽道的共識(shí)。
小米正依托大模型不斷深化其人車家全生態(tài),而榮耀等廠商也在掌舵人李建的帶領(lǐng)下,加速推進(jìn)底層AI的全面重構(gòu),榮耀的人形機(jī)器人剛在馬拉松賽道上奪冠,就是這一證明。這標(biāo)志著曾經(jīng)單純卷硬件參數(shù)的手機(jī)廠商們,都在默契地跨越傳統(tǒng)的邊界,從終端硬件品牌全面向AI生態(tài)品牌轉(zhuǎn)型。
2026第十九屆北京國(guó)際汽車展覽會(huì)將于4月24日至5月3日在北京?中國(guó)國(guó)際展覽中心(順義館)和首都國(guó)際會(huì)展中心(新國(guó)展二期)舉行,本屆車展以“領(lǐng)時(shí)代·智未來(lái)”為主題,集中展現(xiàn)汽車工業(yè)的更多黑科技。
比亞迪、小米、鴻蒙智行(問(wèn)界等)、小鵬、蔚來(lái)、嵐圖等頭部品牌集結(jié),多款重磅新車首秀;地平線、Momenta、卓馭等供應(yīng)商集體秀肌肉,AI大模型深度賦能,高階智駕、動(dòng)力電池、超快充技術(shù)等前沿科技集中亮相,看點(diǎn)拉滿!
雷科技旗下「電車通」將派出報(bào)道團(tuán)直擊現(xiàn)場(chǎng),以“關(guān)注電動(dòng)車,更懂智能化”的專業(yè)視角,帶來(lái)一線獨(dú)家報(bào)道,敬請(qǐng)關(guān)注!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.