
要說這兩天AI圈最火的一條消息,莫過于MiniMax正式通過港交所聆訊,即將沖刺IPO。
而前段時間,MiniMax M2 剛在 OpenRouter 上拿下了“全球前五、開源第一”的成績,GitHub 上的 Cline、Roo Code 等硬核開發社區都在熱議這個來自中國的模型。就在大家還在回味 M2 的代碼生成能力時,MiniMax 團隊沒有任何喘息,反手又把M2.1端到了我們面前,在正式發布之前,先在社群里面掀起了一波討論和內測高潮。CSDN也特別申請了內測資格,來個一手的評測體驗。
說實話,時間走到 2025 年底,咱們開發者對 AI 的祛魅過程已經基本完成了。當最初那種生成個貪吃蛇、寫個俄羅斯方塊 Demo 的多巴胺刺激逐漸消退后,整個行業終于開始正視一個略顯尷尬的現實:AI 寫新代碼容易,但想讓它讀懂并維護舊代碼,真的很難。
在真實的軟件工程世界里,我們 90% 的時間其實并非在從零創造什么驚天動地的算法,而是在與三年前(甚至三個月前)遺留的“屎山”搏斗。那些錯綜復雜的業務上下文、牽一發而動全身的架構債、莫名其妙的并發 Bug,以及前任開發者留下的“神之一手”,這才是資深工程師日常的主戰場。
MiniMax M2.1 顯然是瞄準了這一痛點。官方將核心能力押注在了多語言代碼能力,在內測文檔中我們了解到,M2.1在Multi- SWE-bench上表現優異,試圖在“存量代碼維護”這個讓無數 AI 翻車的深水區開辟一條新賽道。
為了驗證它到底是不是真有“資深維護工程師”的素養,這次測評我們決定玩點狠的。我們摒棄了那些常規的玩具級測試,專門構建了一個名為 LegacyShop 的電商后臺項目。這個系統雖然表面上基于 React 與 TypeScript 的標準技術棧,但內里被我們刻意埋設了嚴重的性能陷阱、高度耦合的巨型模塊以及基礎設施配置的缺失。
這種“帶病上線”的狀態,主打一個完美復刻讓無數開發者頭疼的工程災難現場。我們很好奇,面對這種頂級難度的“爛攤子”,M2.1 到底是會像普通 AI 那樣胡言亂語,還是能真正拿出點工程級的解決方案?
優化細節直接讓頁面飛起
LegacyShop 的實時銷售大屏模塊,是我們設置的第一道關卡。
面對一個需要承載 5000 條高頻更新數據的列表,前任開發者在 Dashboard.tsx 里留了個典型的大坑:簡單粗暴地將所有 Mock 數據一次性映射為 DOM 節點。結果就是文檔流里堆積了數千個帶復雜內聯樣式的 div,頁面卡得像幻燈片。
現狀可謂慘烈:本地實測 LCP(最大內容繪制)高達 4.57 秒,這意味著用戶打開頁面后要盯著白屏發呆近 5 秒;CLS(累積布局偏移)高達 0.50,代表頁面元素在渲染時像瘋了一樣亂跳,想點個按鈕結果它自己跑了。更致命的是,由于 useEffect 里存在閉包陷阱,定時器從未被正確清除,瀏覽器內存占用曲線走出了一條驚悚的“上揚線”。
![]()
面對這種性能瓶頸,通用型助手通常會唯唯諾諾地建議“加個分頁”這種避重就輕的方案。但 M2.1 拿到代碼后,沒有任何廢話,直接祭出了 VirtualList(虛擬列表) 方案。
![]()
它通過精確計算可視窗口高度,引入 VirtualList 將頁面承載的 DOM 節點從數千個瞬間壓縮至幾十個,從根本上解決了渲染阻塞;同時在處理隱蔽的內存泄漏時,模型表現得更為老練。它沒有止步于簡單補齊 clearInterval,而是巧妙地引入 useRef 掛載回調,這種高級技巧不僅完美規避了閉包陷阱,更避免了因依賴項抖動導致的定時器頻繁重建。
甚至在指令之外,M2.1 還主動表現出了“代碼潔癖”。它順手對 TradeRow 子組件進行了深度清理,剝離冗余內聯樣式的同時包裹了 React.memo。這種防御性編程思維,把不必要的子組件重渲染壓到了最低。
結果是直觀且震撼的:LCP 從 4.57 秒暴跌至 0.16 秒,基本上鼠標剛松開頁面就刷出來了,實現了真正的瞬開;CLS 直接歸零,整個布局穩得像張靜態圖片。這種從代碼底層運行機制出發的精準治理,證明 M2.1 在微觀層面已經超越了簡單的“翻譯代碼”,它懂的不僅僅是語法,而是代碼在瀏覽器里到底是怎么跑的。
![]()
![]()
重構代碼邊拆屎山邊把新功能做了
性能優化是為了用戶體驗,重構則是為了保住開發者的發際線。LegacyShop 的商品管理模塊單文件超過 1600 行,業務邏輯和視圖層纏繞得像一團亂麻,改動任何一行代碼都可能導致整個頁面崩潰。
![]()
這次考題堪稱地獄難度。任務要求以資深架構師視角將龐大單體拆解為 MVC 模式,還得順手加個按庫存狀態篩選的新功能。這不僅要構建完整的架構圖,更要確保新功能邏輯能穿透數據層直達 UI。
![]()
M2.1 的操作相當老練。系統沒有機械地按行數切割文件,而是玩起了 Type First 策略。先提取 TypeScript 類型定義,再把散落在各處的十余個狀態收斂進自定義 Hook,最后才把 UI 剝離出去。這種先理清脈絡再動刀子的方式,直接避開了重構最容易翻車的類型丟失坑。
![]()
最見功力的地方在于新增功能。庫存篩選邏輯被自然地融進了數據流轉中,而不是事后打上的補丁。這種一邊重構地基一邊加蓋新房的能力,確實只有資深開發才具備。
視圖層的細節也沒掉鏈子。生成的 ProductFilter 子組件拒絕了偷懶的行內樣式,選用了嚴謹的 CSS Modules 方案。文件頭部顯式定義了 Props 接口,徹底告別了 any 類型這種埋雷行為。
![]()
整個過程最讓人驚喜的是自我糾錯閉環。代碼生成后,M2.1 并沒有直接交差,而是主動跑了一遍 TypeScript 檢查。發現類型匹配報錯后,模型迅速定位文件并修正斷言,直到檢查全部通過。這種寫代碼、跑檢查、修 Bug 的一條龍服務,像極了一位靠譜的獨立開發者。
![]()
最終交付結果非常清爽,原本臃腫的入口文件變成了一行 Hook 調用。這波操作不僅還清了技術債,還留下了一套擴展性極強的架構。
![]()
幫裸奔的項目穿上防彈衣
如果將業務重構視為功能交付的表層升級,那么工程基礎設施建設則是保障系統穩定性的底層防線。在 LegacyShop 項目中,這道防線幾乎形同虛設:核心的登錄組件缺乏測試覆蓋,一旦修改極易引發回歸問題;而陳舊的構建工具配置導致熱更新(HMR)失效,每一次微小的樣式調整都需要忍受漫長的手動刷新,開發體驗堪比坐牢。
這一環節,我們決定對 M2.1 發起更高維度的挑戰,要求其協助構建防御體系并優化開發環境。
在測試編寫環節,我們將目光鎖定于關鍵的 LoginPage 組件。不同于簡單的靜態展示頁,這個組件包含了表單驗證、異步接口請求與路由跳轉等復雜交互。M2.1 并未產出那種僅校驗 DOM 是否存在的“注水代碼”,而是基于React Testing Library交付了一套完整的行為驅動測試用例。
它熟練運用 Jest Mock 模擬網絡層響應,精準覆蓋了用戶提交空密碼時的校驗提示、服務端異常時的全局報錯以及登錄成功后的路由重定向。
![]()
值得一提的是,在編寫測試的過程中,M2.1 展現出了TDD(測試驅動開發)的敏銳度。它發現原有業務代碼中的中文報錯提示與測試用例不符,于是竟然主動修改了 src/pages/Login/index.tsx 源碼,將錯誤信息標準化為英文 "Password is required",從而確保了代碼與測試的一致性。
![]()
隨后,我們將矛頭對準了失效的構建配置。面對被我們惡意破壞的 webpack.config.js,M2.1 展現出了精準的診斷能力。它迅速識別出 hot: false 和 liveReload: false 是導致熱更新癱瘓的元兇,并順手補回了丟失的 cacheDirectory 緩存配置與 CSS Modules 支持。
修復過程相當穩,M2.1 沒有像某些愣頭青 AI 那樣上來就搞暴力覆蓋,而是精準地只修補了壞掉的那幾行。隨著配置文件改好,終端里終于跳出了久違的熱更新激活提示。
![]()
當綠色的 Pass 信號亮起,按一下 Ctrl+S 瀏覽器就能秒更新,這種感覺真的很爽。這時候你就會覺得,它不僅僅是個生成代碼的工具,更像是個能幫你兜底的工程老手。能把這些讓人頭禿的基建坑填平,把風險掐滅在上線前,這才是咱們真正想要的 AI 隊友。
![]()
![]()
一次成型手搓個太陽系
修復舊代碼驗證了工程底蘊,從零構建則能檢驗創造力上限。在完成了上述一系列繁重的修復工作后,我們決定換個口味,玩點大的。
我們給 M2.1 發出了最后一道終極指令:“作為一個資深的前端圖形學工程師,請幫我們從 0 到 1 構建一個基于 Three.js 的太陽系引力模擬系統。”
這絕不是寫幾個 CSS 動畫畫個圓那么簡單。我要求它必須在瀏覽器里從零手搓一個微型物理引擎:徹底拋棄預設動畫,嚴格基于牛頓萬有引力公式實時計算天體軌跡;不僅要處理三維空間中的向量運算來實現公轉與自轉的力學閉環,還要搞定復雜的 Raycasting(光線投射) 算法來實現 3D 交互——鼠標拖拽旋轉、滾輪無級縮放、點擊行星精準反饋。這哪里是考代碼,分明是在考它能不能把高等數學和天體力學完美翻譯成 JavaScript。
這對 AI 的跨學科知識融合能力是一個巨大的考驗。
結果直接 One-Shot 一把過。

模型生成的 HTML 單文件代碼沒有任何語法錯誤,直接在瀏覽器中跑通了。視覺效果方面,M2.1 使用了程序化生成的紋理貼圖,質感細膩;星空背景采用了粒子系統,營造出了深邃的宇宙感。
物理邏輯更是嚴謹。通過閱讀源碼我們發現,行星的公轉速度與相對距離經過了數學換算,不再是簡單的平移運動。交互層面,Raycaster 射線檢測準確無誤,點擊行星后的彈窗信息響應極快。這種將天體物理公式瞬間轉化為三維視覺交互的能力,代表 M2.1 不僅僅精通代碼語法,更展現出了物理、數學與設計美學的融合能力。
![]()
總結
LegacyShop 的實戰演練,配合最后太陽系模擬的現場演示,我們徹底把 MiniMax M2.1 的底子摸透了。
這次評測給我們的最大感受,不是“被替代”的恐懼,而是一種久違的職業解脫感。我們親歷了 AI 從單一的代碼片段生成工具,進化為通曉架構拆解、測試驅動與工程構建的全棧協作伙伴。
夸了這么多,說說不足吧。我們在用M2.1生成測試項目的時候,因為要做一些劣質代碼,所以不是按套路地提要求。對于這種復雜要求,M2.1 在規劃任務時還是有點問題。當我要求 M2.1生成“請你生成一套可以運行,但充滿壞味道的代碼” 之后,并沒有觸發任務規劃,而是依次生成項目文件,并且生成的代碼會報錯,無法運行,但是在后續我們先創建基礎項目,再做破壞性建設的思路下就沒有出現這個問題。因此需要加強一下任務規劃能力。
說實話,M2.1 在實戰中展現出的多維素養表明,它完全有能力接管高風險的存量治理工作。既然 AI 能搞定基礎設施維護與技術債治理這種消耗熱情的“臟活累活”,那我們人類開發者就該騰出手來,回歸架構設計與業務創新的高地。
從 LegacyShop 的起死回生到太陽系的無中生有,M2.1 的表現恰恰印證了 MiniMax 在 Multi-SWE 賽道上的技術遠見。作為一款專為 Coding、復雜 Agent 工作流及長鏈條推理任務設計的模型 ,它的核心競爭力正在從單一的代碼生成向深度的工程理解躍遷。它跳出了單純比拼生成速度的怪圈,轉而攻克復雜上下文理解與存量債務治理這兩個最難啃的硬骨頭 。這種進化讓 M2.1 不再局限于做一個只會補全語法的插件,而是真正成為了能獨立思考架構并解決系統級問題的工程智能體。這才是我們真正需要的未來分工,讓機器去消化那些確定性的工程繁瑣,讓人類徹底回歸不確定性的價值創造。
年底了,與其盯著那些枯燥的跑分榜單看,不如直接前往MiniMax 開放平臺上手跑一跑。把你手頭最棘手、最復雜的真實業務場景丟進去,看看這位 AI 工程師到底能不能抗住壓力——它大概率會給你一點小小的震撼。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.