![]()
智東西
作者 云鵬
編輯 李水青
智東西2月12日消息,春節將至,國產AI大模型之戰愈發火爆。
短短1天多時間,DeepSeek、智譜、字節等多家廠商模型密集更新,MiniMax-M2.5正式上線,其重點提升了Agent和編程能力。
![]()
▲MiniMax-M2.5已可選
MiniMax AI相關負責人在X平臺上發文稱,他想盡快發布M2.5,已經迫不及待想回家過年了,但隨著他們投入的訓練計算增多,模型效果也越來越好,這是一個痛并快樂著的問題。
![]()
▲MiniMax AI工程負責人Skyler Miao在X平臺發文
智東西第一時間體驗了MiniMax-M2.5在定時任務、網頁制作、調研報告撰寫、視頻生成、PPT制作等任務執行上的能力。
從結果來看,網頁制作是其強項,尤其在可視化表達方面,網頁的視覺呈現效果較好,比如我可以一句話讓它生成一家公司的投資分析儀表盤。
![]()
▲關于蘋果公司的可視化儀表盤分析網頁
做一個“黃金礦工”網頁版游戲,MiniMax-M2.5也可以給出不錯的結果。

▲網頁版黃金礦工小游戲
定時任務方面,其可以按照要求按時完成任務,但不同任務呈現的結果質量有一定差異。此外,不論是PPT制作還是調研報告生成,其生成結果的詳實程度都較好,輸出篇幅較長。
有X平臺用戶提前三天拿到了內測資格,他發文稱,MiniMax-M2.5提升明顯,和Opus 4.6打的有來有回,其模型體積小,據傳Mac mini也能部署。他還曬出了MiniMax-M2.5制作的網頁版“macOS系統”。
![]()
▲X平臺用戶評價
截至2月12日港股收盤,MiniMax股價漲幅14.62%,總市值1622億人民幣,其股價盤中曾一度漲幅超23.5%。根據官網信息,MiniMax將于3月2日公布全年業績。
![]()
▲截至2月12日收盤,MiniMax港股股價情況
一、網頁設計是強項,一句話做“黃金礦工”小游戲
首先,在考察編程能力的網頁制作環節,我們讓模型創建一個網頁儀表盤,對蘋果公司進行可視化分析,內容必須涵蓋財務健康狀況、技術面/市場情緒、競爭對手比較以及戰略估值(SWOT/內在價值),以提供明確的投資建議。
從結果來看,需求中提到的基本指標都有較好覆蓋,SWOT分析給出的較為具體,整體網頁設計比較簡潔、美觀,基本的動效都已做好,數據展示較為直觀,鼠標懸停在統計圖表上會有對應數據呈現。
![]()
接著,我們讓模型為一家AI創業公司設計官方網站,融入太空主題元素,使用黑、白、灰作為主色調,營造出酷炫、精致且充滿科技感的氛圍,特別要有一個能讓用戶感到震撼的精美地球動畫。
從結果來看,網頁焦點處確實有地球動畫效果呈現,且地球本身可以跟隨鼠標進行一定程度的運動。

但網頁本身并沒有實現主色調的要求,對于精致、科技感的要求沒有明確呈現,地球動畫本身帶有一些類似“粒子光效”的表現,但整體感覺并未達到“震撼”的水平。
網頁游戲制作令我們印象比較深刻,雖然第一次的生成效果“翻車”,游戲無法交互游玩。
![]()
▲初次生成的版本無法游玩,僅有首頁封面
但重新生成后,游戲本身完成度還是比較高的:
▲同樣提示詞,第二次生成的結果
基本的游戲模式、游戲說明、游戲關卡、游戲操作都按照要求完成了,并且確實可以游玩,游戲過程還配合了對應的音效。
二、專業報告一鍵生成,PPT制作學會用比喻潤色
此外,我們通過幾個任務測試了模型生成專業研究報告的能力,比如全面梳理AI開源推理生態、分析應用場景、對應方案并分析原因。
從結果來看,其輸出內容邏輯清晰,在展示不同框架異同時用了表格進行對比,內容較多比較詳實,約6000字。
![]()
▲AI開源推理生態相關研究報告生成
對于“計劃開發一款針對初學者的AI 3D建模工具”這一需求,我們讓模型分析目標用戶畫像和用戶在主要場景下的核心痛點,并推導出對應的潛在功能需求,寫出MVP需求文檔和初期運營增長路徑。
![]()
▲AI 3D建模工具產品MVP需求文檔
從結果來看,所有需求要點都有比較準確的對應信息,需求文檔和運營增長路徑都有多個表格呈現梳理的內容,路徑規劃較為具體。
![]()
▲AI 3D建模工具初期運營增長路徑
PPT制作環節,我們要求PPT“讓學生真的能聽進去”,舉的例子能讓他們產生共鳴,對于這一需求,模型在PPT制作中用了很多“比喻”,融入了一些當代元素,比如“唐朝朋友圈”、將長安城比作“北上廣深”、將杜甫比作關注民生的“新聞記者”。
![]()
不過模型在PPT制作的美觀程度和細節嚴謹程度方面還有待提升。
三、新聞報告成“舊聞匯總”,視頻生成仍有優化空間
Agent能力方面,我們還測試了兩個定時任務,包括每日科技要聞摘要和TikTok熱門趨勢周度分析。
![]()
雖然需求強調了是24小時內新聞,但給出的8個新聞全部為“過時消息”,基本均為2025年舊聞。這樣即便總結的新聞內容較為準確,但已經失去了最根本的“新聞”屬性。
![]()
▲每日科技新聞摘要
同時,對于檢索來源的標注只標明了媒體名稱,并未帶上對應的網頁鏈接。
在TikTok熱門趨勢周度分析任務中,模型首先總結了核心趨勢動向,接著對熱門挑戰、熱門音頻、熱門話題標簽、重要創作者等部分進行了分析總結,最后按照要求給出了內容創作建議。
![]()
▲TikTok熱門趨勢分析報告
最后,我們簡單嘗試了視頻生成,從結果來看,模型并沒有對需求中狗的品種有準確呈現,不過畫面的氛圍、主物體動作、背景元素都有準確還原。
提示詞:
![]()
結果:
結語:編程和Agent能力仍是模型競賽焦點
雖然MiniMax-M2.5尚未官宣發布,但從實際體驗和公開評價來看,其提升的重點仍然是Agent能力和編程能力,這也是當前主流大模型競爭的焦點。
從生成結果來看,“拿來即用”仍然存在一定距離,大部分結果仍然需要修改校對,對需求的準確呈現仍然存在優化空間。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.