![]()
4月29日凌晨,阿里巴巴開(kāi)源新一代通義千問(wèn)模型 Qwen3,參數(shù)量?jī)H為DeepSeek-R1 的1/3,成本大幅下降。
我自己衡量大模型會(huì)看三個(gè)點(diǎn):成本、效率、體驗(yàn)。
忽略成本談體驗(yàn),都是耍流氓。
真正的開(kāi)發(fā)者和普通用戶,不僅會(huì)看哪個(gè)模型結(jié)果好,還會(huì)看哪個(gè)產(chǎn)品功能豐富,更會(huì)在意要花多少算力、多少錢、多長(zhǎng)時(shí)間。
從數(shù)據(jù)來(lái)看,Qwen3 性能指標(biāo)全面超越 R1、OpenAI-o1 等全球頂尖模型,登頂全球最強(qiáng)開(kāi)源模型。
![]()
體驗(yàn)鏈接:http://chat.qwenlm.ai
在 DeepSeek R2 出來(lái)之前,Qwen3 的模型能力是明確領(lǐng)先的,產(chǎn)品能力更是有跨越式優(yōu)勢(shì)的。
比如 Qwen3 除了文字、代碼、數(shù)學(xué),還有視頻、繪畫等能力和日常高頻的場(chǎng)景預(yù)設(shè)。
先看幾個(gè)視頻效果:
![]()
Prompt:一只胖胖的卡皮巴拉在吃草
Prompt:陽(yáng)光透過(guò)樹林和綠葉灑下來(lái)
Prompt:火車穿越金黃的田野駛來(lái)
Prompt:跳動(dòng)的柴火
Prompt:松鼠在落葉中演奏搖滾樂(lè)
Prompt:兩個(gè)女人表面微笑實(shí)則想殺了對(duì)方
推理能力、數(shù)據(jù)計(jì)算、代碼能力等等,已經(jīng)有不少朋友測(cè)試過(guò)了,是 Qwen3 的優(yōu)勢(shì)強(qiáng)項(xiàng)。
而相對(duì)不引人注意的視頻生成能力,看效果也已經(jīng)達(dá)到了第一梯隊(duì)。
![]()
手機(jī)上通義APP也是滿血版,最新Qwen3模型生視頻任意用
關(guān)鍵還是不限次數(shù),開(kāi)源免費(fèi)的啊!!
市面上哪還有生圖、生視頻產(chǎn)品,能不限制免費(fèi)使用的。
真的用起來(lái),只有一個(gè)感受:真香!
日常其他場(chǎng)景,體感上效果可以說(shuō)是又快又好。比如我想研究一下 Agent 與 MCP 的關(guān)系:
![]()
![]()
![]()
思路很清晰,嚴(yán)謹(jǐn),結(jié)果的完整度很高,還可以根據(jù)想要更快/更多思考,選擇需要的思考量。
![]()
比如有時(shí)候就想要一個(gè)直來(lái)直去的簡(jiǎn)單回答,或者希望秒出答案也也給出思考過(guò)程,調(diào)節(jié)“思考長(zhǎng)度”就很合適。
在更長(zhǎng)的“思考長(zhǎng)度”下,Qwen3 會(huì)執(zhí)行更多中間步驟,如分解問(wèn)題、逐步推導(dǎo)、驗(yàn)證答案等,給出更深思熟慮的答案;而在“非推理模式”下,模型會(huì)直接生成答案。
同一個(gè)問(wèn)題,Qwen 3 可以完成“快思考”和“慢思考”,這類似于人類在回答簡(jiǎn)單問(wèn)題時(shí),憑經(jīng)驗(yàn)或直覺(jué)快速作答,面對(duì)復(fù)雜難題時(shí)再深思熟慮,仔細(xì)思考給出答案。
比如下面就是 Qwen3 一鍵生成的介紹自己的卡片效果:
![]()
回答數(shù)學(xué)、地理交叉學(xué)科的問(wèn)題,Qwen3 也可以表現(xiàn)的很好:
比如下面這道題,曾難倒一眾大模型:
“一架飛機(jī)從北京起飛,先向北飛了 1000 公里,再向西飛了 1000 公里,再向南飛了 1000 公里,再向東飛了 1000 公里,這架飛機(jī)可以飛回北京嗎?”
由于地球是個(gè)球體,緯線長(zhǎng)度隨緯度升高而變短,因此按照題目規(guī)定的路徑,飛機(jī)是無(wú)法飛回原地的。
Qwen3 調(diào)用數(shù)學(xué)和地理知識(shí),不僅回答正確,還給出了擴(kuò)展思考。
![]()
如果我是老師的話,我肯定要給 Qwen 更多分,公式步驟更全,計(jì)算過(guò)程更詳細(xì)。
日常問(wèn)題的話,在通義APP上打字會(huì)更快、更方便順手。
![]()
再來(lái)一道弱智吧的題目:買一臺(tái)三千塊左右的電腦大概需要多少錢?
Qwen3 注意到了題目中存在的矛盾 —— 提到了「三千塊左右 」的預(yù)算,但又問(wèn)「大概需要多少錢 」,由此猜測(cè)是用戶想了解電腦價(jià)格或配置。
于是,Qwen3 列出了 3000 元能買到筆記本、臺(tái)式機(jī)和組裝臺(tái)式機(jī),分別介紹了它們的機(jī)型、配置和缺點(diǎn),并以表格的形式給出了總結(jié)建議。
![]()
拿《2024年高考全國(guó)甲卷數(shù)學(xué)(理)》試題再來(lái)試一下。
![]()
![]()
Qwen3-235B-A22B think ![]()
Qwen3-235B-A22B no-think
答案也是完全正確。結(jié)果就是 、
要知道,設(shè)計(jì)和訓(xùn)練混合推理模型的難度,是遠(yuǎn)超單純的推理模型的。
訓(xùn)練混合推理模型,有復(fù)雜的機(jī)制,相當(dāng)于模型要學(xué)習(xí)兩種不同的輸出分布,要做到兩個(gè)模式融合且基本不影響任何一種模式下的效果,很考驗(yàn)訓(xùn)練過(guò)程的訓(xùn)練策略。
最終的效果也就是,Qwen3 在具體問(wèn)題的表現(xiàn)上更好。
除了生產(chǎn)力和生活使用,我還試了一下一些有意思的小話題。
比如:將“I love Qwen3-235B-A22B”這句話的所有內(nèi)容反過(guò)來(lái)寫
![]()
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
Qwen3-32B think
Qwen3-32B no-think
這個(gè)問(wèn)題很多模型會(huì)出現(xiàn)CoT的問(wèn)題,造成幻覺(jué)或者莫名其妙的奇葩回答。
但 Qwen3全部都對(duì)了。
再比如腦筋急轉(zhuǎn)彎一類的問(wèn)題:“小紅有2個(gè)兄弟,3個(gè)姐妹,那么小紅的兄弟有幾個(gè)姐妹?”
![]()
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
推理過(guò)程和最終答案也都沒(méi)問(wèn)題。可見(jiàn)不同的幾類細(xì)分Qwen3模型,在基本表現(xiàn)上都是優(yōu)秀線以上。
像之前我常測(cè)試的生成天氣預(yù)告卡片、貪吃蛇等等,對(duì)于Qwen3來(lái)說(shuō)已經(jīng)是基本操作了。
Prompt:創(chuàng)建一個(gè) HTML 文件,包含 CSS 和 JavaScript,用來(lái)生成動(dòng)畫天氣卡片,卡片用不同的動(dòng)畫形式直觀地表示以下天氣狀況:風(fēng) (例如移動(dòng)的云、搖曳的樹木)、雨 (例如落下的雨滴)、太陽(yáng) (例如閃耀的光線)、雪 (例如飄落的雪花、積雪),并排顯示所有卡片,底部有一個(gè)漂亮的按鈕可以切換動(dòng)畫速度。

Qwen3 幾乎是秒出代碼,速度非常快,在處理簡(jiǎn)單任務(wù)時(shí)顯然有自己的算力分配邏輯。
再比如下面這個(gè)小球游戲:
Prompt:編寫一個(gè) Python 程序,展示一個(gè)球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應(yīng)受到重力的影響,并且必須真實(shí)地反彈到旋轉(zhuǎn)的墻壁上。

有一說(shuō)一,這個(gè)小球在旋轉(zhuǎn)六邊形里彈跳的程序,Qwen3 編得真不錯(cuò),既沒(méi)有出現(xiàn)小球掉出來(lái)的情況,也沒(méi)有彈跳角度不合理或者程序卡死的情況。
經(jīng)典的貪吃蛇小游戲也完成得很順利,也是秒出,就是審美很像80年代電腦界面,想要更好看的話Prompt要更長(zhǎng)更細(xì)致一點(diǎn)。

我又嘗試了一些好玩的,比如生成一個(gè)表情小游戲,提示詞來(lái)自 @甲木
請(qǐng)你扮演一個(gè)Web游戲開(kāi)發(fā)者。設(shè)計(jì)并生成一個(gè)**表情符號(hào)反應(yīng)堆 **的游戲。 1、核心創(chuàng)意: 一個(gè)快節(jié)奏的反應(yīng)游戲。屏幕上會(huì)快速閃過(guò)一個(gè)目標(biāo)表情符號(hào)(例如:笑臉),下方會(huì)同時(shí)出現(xiàn)3-4個(gè)選項(xiàng)表情符號(hào),玩家需要在限定時(shí)間內(nèi)(例如1-2秒)點(diǎn)擊與目標(biāo)匹配的那個(gè)表情符號(hào)。 2、玩法: - 屏幕中央顯示目標(biāo)Emoji。 - 下方按鈕區(qū)域快速刷新3-4個(gè)Emoji選項(xiàng),其中一個(gè)是正確的。 - 玩家需在計(jì)時(shí)條走完前點(diǎn)擊正確的Emoji。 - 點(diǎn)擊正確得分,速度加快;點(diǎn)擊錯(cuò)誤或超時(shí)則游戲結(jié)束(或扣除生命值)。 - 顯示最高分。 3、技術(shù)實(shí)現(xiàn) (HTML/JS/CSS): - HTML: 用于顯示目標(biāo)Emoji、選項(xiàng)按鈕、計(jì)時(shí)條、得分。 - CSS: 設(shè)計(jì)簡(jiǎn)潔明快的界面,計(jì)時(shí)條動(dòng)畫。 - JavaScript: 存儲(chǔ)一個(gè)Emoji列表。 隨機(jī)選擇目標(biāo)Emoji和干擾項(xiàng)。 動(dòng)態(tài)更新按鈕內(nèi)容。 實(shí)現(xiàn)計(jì)時(shí)器邏輯和倒計(jì)時(shí)動(dòng)畫。 處理點(diǎn)擊事件,判斷對(duì)錯(cuò),更新得分/狀態(tài)。 控制游戲節(jié)奏(逐漸加快)。 4、趣味點(diǎn): 簡(jiǎn)單上手,考驗(yàn)反應(yīng)速度,利用通用的Emoji增加親和力和趣味性,適合碎片時(shí)間玩。
Qwen3-235B-A22B think再來(lái)一個(gè)小游戲,同樣是甲木的提示詞:
請(qǐng)你扮演一個(gè)Web游戲開(kāi)發(fā)者。設(shè)計(jì)并生成一個(gè)**單一的HTML文件**,使用HTML Canvas、CSS和JavaScript,制作一個(gè)簡(jiǎn)單的像素風(fēng)格寵物收集小游戲。 **重點(diǎn)要求:** 1、一定要注意審美,做出來(lái)的網(wǎng)頁(yè)要有美感。 2、頁(yè)面要有設(shè)計(jì)感,有足夠的傳播度 **要求:** 1. **游戲內(nèi)容 (由你生成):** * **游戲名稱:** (例如:“像素爪爪接星星” 或 “方塊萌寵大作戰(zhàn)”) * **寵物描述:** 描述一個(gè)簡(jiǎn)單的像素寵物形象(可以用文字描述其構(gòu)成,例如“一個(gè)10x10像素的橙色方塊身體,上方有兩個(gè)小三角形耳朵”),并給它起個(gè)名字。 * **玩法說(shuō)明:** 簡(jiǎn)要說(shuō)明如何用左右箭頭鍵移動(dòng)寵物,目標(biāo)是接住從上方掉落的“金元寶”(或其他像素物品),并顯示得分。 2. **HTML結(jié)構(gòu):** * 包含標(biāo)題、寵物描述和玩法說(shuō)明。 * 一個(gè) ` ` 元素 (`id= "gameCanvas"`) 用于繪制游戲。 * 一個(gè)區(qū)域 (`id="score"`) 顯示當(dāng)前得分。 3. **CSS樣式 (內(nèi)部 `
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.