快科技3月30日消息,中文大模型基準測評SuperCLUE發布2026年3月最新結果,22款國內外主流模型參與角逐。
字節跳動旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下國內第一,成功躋身全球第一梯隊;小米集團的MiMo-V2系列兩款模型均順利上榜。
本次測評覆蓋數學推理、科學推理、代碼生成等六大核心任務,全面檢驗模型綜合能力。海外閉源模型依舊占據總分前列,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。
豆包則緊隨其后,總分僅與GPT-5.4相差0.95分,實現全方位追趕,在智能體任務規劃維度更是反超部分海外模型,躋身全球前五。
小米此次有兩款模型入選測評榜單,其中MiMo-V2-Pro以60.67分位列閉源模型前列,在數學推理任務中取得84.03分的亮眼成績;開源版本MiMo-V2-Flash雖以49.97分排名靠后,但在代碼生成等細分場景中表現出一定潛力。
測評還顯示,國產模型整體表現亮眼,開源賽道尤為突出,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等國產開源模型包攬開源榜前三,大幅領先海外同類模型。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.