![]()
被稱為「歐洲版 DeepSeek」的 Mistral AI 在被 OpenAI、Google 和中國開源模型 DeepSeek、Qwen 夾擊大半年后,終于坐不住了,正式發布了新一代 Mistral 3 系列模型。
Mistral AI 是一家總部位于法國的大模型公司。據報道,今年 9 月,英偉達第三次出手投資這家初創企業。經此,Mistral 的估值達到約 135 億美元,成為歐洲 AI 領域最受矚目的獨角獸之一。
![]()
這一次,Mistral 居然只盯著中國模型打
Mistral 3 這次帶來了旗艦模型 Mistral Large 3,以及三款高性價比的小模型 Ministral (3B、8B、14B)。
其中 Mistral Large 3 是絕對的主角,總參數量為 675B,其中活躍參數為 41B,這是自 2023 年底至 2024 年初的 Mixtral 8x7B 和 8x22B 以來,Mistral 首個開放權重的混合專家模型。
但最讓我感到「不對勁」的是官方的對比策略。
在官方的跑分圖里,Mistral 竟然完全無視了 GPT-5.1 或 Gemini 3,而是直接把槍口對準了中國的 DeepSeek-V3.1 和 Kimi-K2。
Mistral 的邏輯很直接:我的參數量只有 Kimi 的一半左右,但我的性能跟你五五開,甚至更強。
官方曬出的成績單如下:
- 贏面: 在 MMMLU 和 AMC 上,Mistral Large 3 分別拿到了 85.5 和 52.0 的高分,略微領先 DeepSeek-V3.1。
- 輸面: 在程序員最關心的 LiveCodeBench 和 SimpleQA 上,Mistral Large 3 還是輸給了 Kimi-K2。
![]()
![]()
比 DeepSeek 笨,還貴 3 倍?
雖然 Mistral 試圖證明自己是「效率之王」,但在 X 上,科技博主直接潑了一盆冷水,甚至用了「Mistral 正在緩慢死亡 (slow death)」這樣嚴重的詞。
他的評價簡單粗暴,列出了 Mistral 新模型的三大罪狀:
1. 更笨: 腦子不如 DeepSeek 好使。
2. 更貴: 價格卻是 DeepSeek 的 3 倍。
3. 更慢: 推理速度甚至比 GPT-5 還慢。
![]()
這確實戳到了痛點。在 Artificial Analysis 的最新綜合 AI 指數榜單上,Mistral Large 3 的得分只有 38 分。
看看排在前面的誰?Gemini 3 Pro(73分)、Claude Opus 4.5(70分)、GPT-5.1(70分)。Mistral 距離第一梯隊的差距,已經不是「追趕」,而是斷層了。
![]()
在 LMArena 排行榜中,它在開源非推理模型中排第二,總榜第六。成績尚可,但絕對稱不上「屠榜」。
![]()
有測試者發現 Mistral Large 3 各個方面都表現不佳:
- 該模型難以正確執行工具調用,常會輸出格式錯誤或無效的工具調用指令。
- 在基于圖像的基準測試中表現平平。
![]()
真正值得沖的,其實是小模型
Ministral 3 是所有開源模型中性價比最高的產品。每種參數規模均提供基礎版、指令版和推理版,且均具備圖像理解能力,全部基于 Apache 2.0 許可證開源。
這意味著什么?你可以免費商用,隨便魔改。
- 全能: 所有尺寸都支持圖像理解,不再是「瞎子」 。
- 能打: 14B 的推理版在 AIME'25 測試中準確率達到了 85%。
![]()
Mistral 3 確實進步了,就像網友說的那樣:歐洲仍有一家前沿模型制造商能基本跟上中國開源模型的步伐,盡管 Mistral 尚未推出推理器,其實際性能仍落后于時代。
![]()
但在 DeepSeek 把大模型價格打下來的今天,僅僅做到「性能不錯」已經不夠了。用戶要的是極致的聰明,或者極致的便宜。
目前的 Mistral ,似乎卡在了一個尷尬的中間位置。能不能成為「歐洲之光」,可能真得看后續的迭代了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.