阿里在海內(nèi)外 AI 圈內(nèi)的影響力可以說是非常頂。
基本上是唯一一個在模型種類和模型能力 兩個方面同時可以跟谷歌和 Open AI 掰手腕的團(tuán)隊。
在模型能力上剛發(fā)布的 Qwen3-Max 模型能力非常強悍,僅次于海外三巨頭的頭部模型,而且開源模型 Qwen3-235B 在 Lmarena 上也是開源第一。
![]()
除了測評以外 Huggingface 的下載量也是衡量一個模型受歡迎程度的一個重要指標(biāo),前十里面超過一半全是 Qwen 的模型非常離譜了。
![]()
在模型的種類上我感覺更是只有他能跟谷歌掰手腕了,你能夠想到的生成模型種類他都有。
除了 LLM 以外,視頻生成、深度研究、翻譯模型、圖片生成、圖片編輯(Qwen-Edit)、語音轉(zhuǎn)錄、音頻生成、代碼生成(Qwen-Coder)、音視頻通話(Qwen3-Omni),基本可以覆蓋你能想到的任何 AI 產(chǎn)品能力。
你瞅這 Huggingface 頁面的數(shù)量看著都害怕。
![]()
你可以發(fā)現(xiàn),阿里目前已經(jīng)有了構(gòu)建一個可以跟 ChatGPT 掰手腕的超級 AI APP 的所有必要元素,包括豐富的模型類型、強悍的質(zhì)量以及無敵的社區(qū)和海外知名度。
此外,還有阿里生態(tài)的夾持,淘寶、高德、釘釘、飛豬,想象空間很大。
三年之期已到,模型技術(shù)上搞扎實之后,阿里終于想通了,他們要跟 GPT 干,你有的我都有為啥不干。
這兩天發(fā)布的千問 APP直接升級為 Qwen 模型的第一入口。
主要的對話模型用的 Qwen3-閉源,集成了上面提到的所有其他領(lǐng)域的通義頂級模型,基本可以完成所有你認(rèn)知里面常見的 AI 任務(wù)。
![]()
我這幾天也體驗了一下。
首先整體的設(shè)計風(fēng)格相當(dāng)簡潔而且一致,完全不像其他阿里產(chǎn)品的風(fēng)格,恍惚間好像看到了當(dāng)時讓我非常驚艷的夸克的設(shè)計。
所有的主要功能都集中在主頁以及下面的膠囊區(qū)域里面,非常直觀好理解,很多能力都可以用自然語言直接觸發(fā)讓他操作,這個挺重要的,畢竟不是所有人都像我們一樣對各種模型如數(shù)家珍。
![]()
作為一個面向大眾的 AI 應(yīng)用,用戶沒有我們那樣在意是否是頂尖模型以及模型質(zhì)量,他們更在意的是能力的廣度,以及是否收費。
我試了一圈之后發(fā)現(xiàn),千問這兩點都做的挺好的。
免費這個不用說,背靠阿里所有的功能目前都是免費的,我沒找到啥付費點。
即使是視頻生成這種非常消耗資源的功能,每天也有 15 次的額度,這個量級對于大部分普通用戶來說非常夠用了。
在模型能力上,我找了幾個日常常見的任務(wù)需求,進(jìn)行測試。
作為一個 i 人我很少出去玩,但前幾天出門發(fā)現(xiàn) AI 識圖以及講解的需求還是挺多的,比如一些人文古跡的信息問一下 AI 的話,能增加很多談資,然后也能讓你更好地了解這個地方。
這里我找了一張前幾天去拍的牌匾,因為有個字說實話不認(rèn)識。
然后我問一下,他回答得非常牛逼,他不止把文字的意思說出來了,而且他還知道這是哪個地方的牌匾。
![]()
這個能搞定我們來個比較復(fù)雜的。
我找了一個幾乎完全沒有文字信息和內(nèi)容的圖片,識別物可能只有銀杏樹和古建筑。
沒想到他很快就搞定了,而且這種復(fù)雜任務(wù)會自動調(diào)用深度研究能力,即使我沒有勾選深度研究。
![]()
我在點開拍照的時候發(fā)現(xiàn)他還有拍照翻譯的能力。
而且非常牛批的是不止會輸出文字版本的翻譯還會幫你輸出翻譯后的圖片,排版都是對的只是外語換成了中文,這個太好用了,不止可以翻譯藥品之類的,搬運海外的圖片或者信息的時候也很有用。
![]()
作為對比我也試了一下 GPT 和 Gemini 都只能翻譯文字版本,沒辦法在圖片上翻譯。
![]()
搞定了圖片識別之后我們再來看一個日常非常常見的場景就是文章總結(jié)。
我這里選了一個比較復(fù)雜的,找到了我今年六月份的體檢報告讓他分析,應(yīng)該我們很多朋友都有這種需求,一堆數(shù)確實看不懂,自帶的分析又過于簡單。
可以看到整個分析比體檢中心自帶的清晰和直觀多了,他會將有關(guān)聯(lián)的部分整合到一起給你解釋。
比如高尿酸這里會告訴你數(shù)值是多少、有啥風(fēng)險以及你應(yīng)該如何改善這個問題。
血脂這里直接把相關(guān)的膽固醇、甘油三酯、低密度脂蛋白放在一起給你介紹,還會告訴你要定期檢測,感覺阿里在健康數(shù)據(jù)這部分下了不少功夫。
![]()
除了正常的提問以外,深度研究這個我們常用的資料搜集工具也是有的。
選擇輸入框上方的對應(yīng)膠囊按鈕就可以觸發(fā),這里我選擇讓他調(diào)研最近熱度比較高的影視颶風(fēng)相親角事件。
他們這個 UI 設(shè)計的非常好,比 Gemini 和 GPT 那種只有個進(jìn)度條的清晰非常多,你可以清楚的看到他會規(guī)劃大綱之后進(jìn)行多次搜索和總結(jié),而且每次搜索都是有目的的為結(jié)果服務(wù)的。
尤其是最后甚至開始搜索其他 UP 主的類似事件,來輔助提供論據(jù)。
![]()
深度研究的結(jié)果展示頁面也是專門設(shè)計過的,不像一些產(chǎn)品隨便弄一個 Markdown 展示的項目就不管了,字號、換行邏輯、行高之類的都不處理,千問這個看起來非常舒服,常用按鈕也都很直觀。
結(jié)果上直接給了一個 8000 字的報告,可以說非常詳細(xì)了,從開頭的概覽到事件細(xì)節(jié)梳理,再到最后的,反思以及各方影響和觀點都照顧到了。
生成的結(jié)果也支持下載成 PDF 和 Word 格式,可以說吃瓜必備了。
說明確實是想過需求的,不像一些產(chǎn)品直接給個 Markdown 文檔,普通用戶知道到啥叫 Markdown 嗎?
![]()
除了上面這些之外,最近也有非常多的圖像和視頻玩法,這個會給產(chǎn)品帶很多量,尤其是某個玩法在社交媒體火了之后。
千問也支持圖像生成和圖像的編輯,比如常見的圖像編輯需求,讓他幫你給照片調(diào)色或者 P 掉景區(qū)照上的無關(guān)人物都是可以的,甚至支持連續(xù)編輯,多次處理同一張照片。
Qwen-Image 的模型能力也是相當(dāng)不錯的,阿里的人透露,AI 創(chuàng)作這一塊會很快優(yōu)化迭代變得更強。
![]()
視頻生成也是可以的, Wan 視頻模型在發(fā)布之后應(yīng)該已經(jīng)是現(xiàn)在開源領(lǐng)域占有量最大的視頻模型了,側(cè)面說明了模型質(zhì)量。
而且新的 Wan 模型在圖像推理上很強,同時支持直接生成音效和音樂。
我用我隨手拍的一張照片讓他生成視頻,真實感非常強,分辨率也超級高還有音效,我沒有寫任何提示詞,他自己加了運鏡,這也是大部分普通用戶用這種功能的狀態(tài),大概都只會說“幫我把這張圖片生成視頻”。
而且他這個每天免費 15 次,還有個很吊的點是,這玩意沒有水印,圈子里的朋友應(yīng)該知道給視頻去水印有多麻煩。
最后再介紹一個我覺得非常強大的功能,甚至是我最近用過最強的類似功能「實時記錄」也可以在輸入框上方膠囊按鈕找到。
它可以實時轉(zhuǎn)錄你現(xiàn)在的環(huán)境聲音,轉(zhuǎn)錄的時候區(qū)分發(fā)言人。
更強的是他還支持實時的英文翻譯,你可以當(dāng)他是個文本的同聲傳譯了,生成和翻譯的速度相當(dāng)快,而且準(zhǔn)確性很高。
對于學(xué)生黨以及頻繁開會的用戶相當(dāng)有用。
而且在保存后他也會問你這是會議還是課堂筆記,會根據(jù)場景總結(jié)分析你的錄音,比如如果你選的這個錄音是課堂記錄的話他就會給你總結(jié)對應(yīng)的知識點,還可以生成思維導(dǎo)圖。
![]()
![]()
好了這就是藏師傅的千問體驗了。
我只是挑選了一些我覺得非常好的功能,其實千問還有專門的分一能力、AI PPT 生成、AI 視頻通話、智能寫作等一堆好用的能力,基本上你想到的他都有。
誰說阿里沒有產(chǎn)品經(jīng)理不會做產(chǎn)品的,這不挺好的嘛,操作簡單、邏輯清晰、功能全面再加上世界領(lǐng)先的模型能力,這次其他類似產(chǎn)品終于迎來了一個非常強力的對手。
卷起來對于用戶也是好事情,我們誰不喜歡白嫖牛皮模型呢,真的很強,推薦試試,各大應(yīng)用商店搜索“千問”即可安裝,希望在評論區(qū)看到你發(fā)現(xiàn)的其他寶藏用法。
如果覺得內(nèi)容對你有幫助的話歡迎幫我點贊或者喜歡,也可以轉(zhuǎn)發(fā)??給你需要的朋友,這個產(chǎn)品很適合作為普通人接觸 AI 的第一款應(yīng)用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.