大家好,我是 Ai 學(xué)習(xí)的老章
感覺(jué)最近的國(guó)產(chǎn)大模型,,不但 HF 上下載量已經(jīng)反超美國(guó),路線更加多樣了。比如
探索線性注意力機(jī)制。
,使用。
,后面它又發(fā)布了
目前阿里是開(kāi)源世界數(shù)量最多,系列最廣泛,下載次數(shù)最多的大模型廠商。前段時(shí)間一文中提到了 Qwen3-Max-Instruct
預(yù)覽版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代碼能力和智能體(agent)能力方面進(jìn)一步提升,在涵蓋知識(shí)、推理、編程、指令遵循、人類偏好對(duì)齊、智能體任務(wù)和多語(yǔ)言理解的全面基準(zhǔn)測(cè)試中均達(dá)到業(yè)界領(lǐng)先水平。
![]()
Qwen3-Max 的推理增強(qiáng)版本—— Qwen3-Max-Thinking 正在訓(xùn)練
![]()
這不,它來(lái)了
![]()
必然是不開(kāi)源,線上可試用,API 也可以用了
今天就來(lái)測(cè)試一下
好久沒(méi)有登錄 chat.qwen.ai 了,發(fā)現(xiàn)它新增了記憶功能,可以記住所有對(duì)話中的用用細(xì)節(jié)和偏好,提供個(gè)性化、一致性的回復(fù)
![]()
左上角切換,選擇Qwen3-Max,下方選中深度思考模式
![]()
測(cè)試 1:總結(jié)朱自清《背影》繪制 SVG
很拉垮,沒(méi)有識(shí)別 4 次背影,樣式很丑,不如 M2,更別提 Claude 了
![]()
它一開(kāi)始還沒(méi)有生成可以預(yù)覽的 svg,讓其生產(chǎn) html 預(yù)覽版,它就稍微隨意發(fā)揮了一些
![]()
測(cè)試 2:生成器官分布
![]()
效果非常好,比智譜的 GLM-4.5-Air 還要好,這題目的其他模型測(cè)試我在這篇文章有介紹:
測(cè)試 2:創(chuàng)建一個(gè)帶有旋轉(zhuǎn)星云和動(dòng)態(tài)光照的 3D 粒子星系。
也可以,可調(diào)整參數(shù)都能生效
![]()
測(cè)試 4:發(fā)揮你的最大才能,用你最擅長(zhǎng)的工具,生成一組數(shù)據(jù)后繪制數(shù)據(jù)大屏,主題自擬。
它用 Python 的 Plotly 和 Dash 框架創(chuàng)建的交互式數(shù)據(jù)大屏。這個(gè)大屏展示了全球氣候變化的關(guān)鍵指標(biāo),包含四個(gè)核心可視化模塊,所有數(shù)據(jù)均為模擬生成(基于真實(shí)趨勢(shì))。
但是,bug 了
![]()
報(bào)錯(cuò)給到它之后,修復(fù)了
![]()
還不錯(cuò),是可交互的,但是為何是英文頁(yè)面呢,而且鼠標(biāo)移動(dòng)到圖上,數(shù)字示例的背景色也不太理想
![]()
測(cè)試 5:3D 動(dòng)畫演示月食原理及全過(guò)程
它沒(méi)有給我想要的東西,而是給了設(shè)計(jì)方案
![]()
追問(wèn)讓其給我具體可執(zhí)行代碼后,它換成了 3D.js 實(shí)現(xiàn),代碼量 481 行
想法挺好的
![]()
但是首次預(yù)覽,失敗了,報(bào)錯(cuò):Uncaught TypeError: Failed to resolve module specifier "three". Relative references must start with either "/", "./", or "../".
二次生成的代碼,運(yùn)行依然不 ok
![]()
測(cè)試 6:生成一個(gè)動(dòng)態(tài)網(wǎng)頁(yè),展現(xiàn)絢麗多彩的煙花盛況,樣式要多,顏色要炫
它用 Canvas 來(lái)實(shí)現(xiàn)包含多種煙花類型、粒子效果和交互功能,代碼量 612 行
運(yùn)行 ok,但是煙花類型很單一,提到的柳條、棕櫚、環(huán)形、星形都看不到
![]()
測(cè)試 7:解決一個(gè)幾何問(wèn)題
正方形里面有一個(gè)小圓,請(qǐng)問(wèn)小圓的半徑與正方形邊長(zhǎng)的關(guān)系是多少?
![]()
這道題很不容易,答案是正方形邊長(zhǎng)的 4/33。
Qwen3-Max 回答錯(cuò)誤
試了 Kimi-K2、Minimax-M2 Agent 模式、Gemini-CLI 也錯(cuò)誤
可能確實(shí)太難了
綜上:Qwen3-Max 不給力啊?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.