10月22日,Airbnb CEO布萊恩·切斯基在采訪中說了句讓硅谷側目的話:
我們大量依賴阿里巴巴的Qwen模型,它非常好,很快速且便宜...
![]()
11月3日,nof1.ai策劃的首屆AI投資大賽結果出爐:Qwen3 Max排名第一,收益率22.3%,和DeepSeek構成了僅有的兩個盈利模型之一。GPT5、Claude 4.5、Gemini 2.5 Pro全部虧損。
![]()
這是第一個專門衡量AI投資能力的測試,可以理解為是幣圈版圖靈測試。
規則很簡單:每個模型拿1萬美元,自己在加密貨幣市場交易,全程無人干預。結果,只有Qwen3 Max賺錢了。
再往前,8月,有網友在X上發了用通義萬相Wan2.2生成的圖片,馬斯克點評:
It will be impossible to tell what’s real online
![]()
7月,HuggingFace CEO連轉12條推盛贊Qwen3-Coder,推特創始人Jack Dorsey直接說:
goose + qwen3-coder = wow
![]()
5月,英偉達CEO黃仁勛,在財報電話會上說:
阿里巴巴的通義千問模型是開源AI模型中最好的。它們在美國、歐洲及其他地區獲得了巨大關注。
在橫掃完一圈硅谷后,Qwen,現在終于殺回國內了。
11月14日,阿里正式推出C端產品——千問APP。這一次,中國終于有了自己的ChatGPT。
![]()
為什么硅谷認可?
從文章開頭我舉的一些例子,你可能就發現了,雖然都在夸Qwen,但他們好像夸的并不是一個Qwen!其中有投資能力霸榜的Qwen3-Max,有馬斯克夸的圖像模型wan2.2,也有Jack Dorsey盛贊的Qwen3-coder。
Qwen實在是太能搞東西,我覺得他們并不是在做模型,而是真在構建一個生態。
而這種多線開花,在分枝上有突破的特點,再加上他們的開源精神,是很容易受到開發者,受到硅谷企業盛贊的。
在9月28日Hugging Face公布的模型趨勢榜上,Qwen系列7款模型擠進全球前10,幾乎屠榜。
![]()
而從模型具體的Benchmark表現來說,Qwen很多模型都可圈可點的:
1)Qwen3-Max:Chatbot Arena全球第三,超過GPT-5
2)Qwen3-Coder:編程能力并列全球第一,超越GPT-4.1
3)Qwen3-VL:視覺理解全球第二,開源第一
這種又強又廣的特點,在開源生態上可能還會體現得更明顯:
1)Qwen衍生模型17萬+,超越Meta的Llama,全球第一
2)下載量超6億次
3)HuggingFace 2024年下載量占比超30%
當然,我也得說一句,模型太多這件事對C端用戶可能就沒那么友好了,普通用戶不像開發者那樣熟悉種種模型之間的優劣勢,也沒有更多的能力去判斷在不同的場景下分別該使用Qwen哪個模型。
所以,Qwen很長時間的情況都是,在硅谷和開發者口中口碑盛好,但...普通用戶確實沒那么了解。
我想現在阿里推出千問app大概就是想解決這個問題,即想把出色的模型能力和豐富的模型生態也開放給普通用戶使用,但也別有那么多的名字提高用戶的決策成本了。
為什么說千問=中國的ChatGPT?
今天,我看到金沙江創投朱嘯虎(對,就是那個投過滴滴、餓了么、小紅書的朱嘯虎)在朋友圈和小紅書發文,標簽千問app的發布意味著「硬剛ChatGPT的國產AI出現了」。
![]()
他給了三個理由,原文如下:
在硅谷屠榜的Qwen殺回國內了,模型直接決定了阿里千問APP的起點。
更聰明的國產AI出現了。 我看了一下它的思考鏈路,邏輯清楚,專業問題也表現挺好,不鬧著玩兒,全是干貨,這是中國市場真正需要的AI產品。
從算力基建、數據積累,到各種應用在AI領域的整合打通。 估計阿里這是準備用千問重構一個超級AI的入口。
作為一個頗受爭議的投資人,朱嘯虎在AI上的觀點常常能激起很多討論。比如,他去年就說過"中國大模型公司沒戲,我一家都沒投",后面DeepSeek的橫空出世讓他改過一次態度,而現在,又公開背書千問,說明是真看好。
我總結了一下,覺得他是從技術、產品、生態這三個視角去得出他的觀點的,這個思路值得參考,我也試著從這三個維度出發,去談談我的觀點。
技術、產品、生態三維度拆解
不過,先岔個題,在兩個半月前,我發了個即刻動態,里面提到現在二級市場上最靠譜的AI股可能是阿里,他們從產品到模型都還不錯。
從那一天至今,阿里股價漲了近30%,看來市場也是逐漸意識到這一點了(當然,這是我自己的小判斷,不構成投資意見,請謹慎參考)。
技術方面,我覺得在開頭提的夠多,就不贅述了,我們可以在額外看幾個關鍵數據:
1)SWE-Bench Verified(代碼解決真實問題測試):69.6分,全球第一梯隊
)Tau2-Bench(Agent工具調用能力測試):74.8分,超過Claude Opus 4和DeepSeek-V3.1
3)AIME 25和HMMT(數學推理測試):雙滿分,國內首次
也就是說,ChatGPT能做的,Qwen都能做。ChatGPT做不到的(比如某些專業推理場景),Qwen也能做。
更別提,Qwen是開源的,參數權重全公開,你可以改、可以定制。
再說說產品方面,千問APP對標ChatGPT的產品哲學:極簡界面,強大能力。
幾個亮點:
會思考:思維鏈高級,多步推理,會根據你實際任務的需要選擇是否思考、是否聯網,不是簡單問答
懂中文:原生中文理解,不會突然給你蹦英文
全模態:文本、視覺理解、圖像生成、語音,一個APP搞定
免費:ChatGPT Plus $20/月,千問完全免費
最后,很重要的,千問背后是阿里的整個AI生態。
1)開源生態:17萬衍生模型,全球開發者共同進化
2)商業場景:能打通淘寶、釘釘、高德等阿里系產品
3)基礎設施:380億AI投資,云計算、算力、數據全覆蓋
4)本土化:不用翻墻,數據在國內,符合監管
在AI模型越來越和實際場景融合的今天,有生態加持的產品顯然是更容易在體驗上做出差異化做出特色來的。而考慮中國的市場環境,ChatGPT顯然是不適配的。阿里有"云+模型+產品+商業場景"全鏈路。這就是朱嘯虎說的"生態閉環護城河"。
四個場景對比:千問 vs ChatGPT vs DeepSeek
我拿幾個實際工作、生活中常見的場景來對比三個產品在一些基礎任務上的表現,分別是:實時信息問答、圖片理解/搜索、文本生成、文本總結。
測試1:實時信息問答
我問的是「楊立昆為何選擇現在離職創業?」,這不是個多困難的問題,但是需要模型意識到需要調用實時聯網搜索能力,減少幻覺,再搜到足夠多的信息,匯總出結論來。
![]()
在這個問題下,三個產品的第一步倒是都沒問題,都有選擇聯網搜索獲取信息,連DeepSeek都沒翻車。不過從最終成文來說,我個人不太喜歡GPT 5.1那種莫名其妙,太套近乎的說話風格,這幾天的5.1也是沒少因此被罵的,有時候我們希望AI就用AI的態度回答就好了。
DeepSeek和千問的結論基本一致,不過千問整體回答的結構化程度是最好的,從「戰略理念分歧」到「組織權力重構」,再到「行業趨勢與個人使命」「離職時機」,一級和二級標題的內容層次結構都相當清晰。
所以這部分我自己的偏好是:千問app > DeepSeek > ChatGPT
測試2:圖文理解/搜索
在這個問題場景里,我是看到了一張很感興趣的照片,想讓AI告訴我這是哪,有什么旅行建議。
![]()
顯然,DeepSeek在這題上翻車了,它都沒法回答,因為DeepSeek雖然也有做視覺模型,但是他們app內現在還完全缺乏圖像理解能力,圖片上傳功能依然只是OCR文字識別的功能
這題里千問和ChatGPT都是完整且準確回答了我的問題,但是解答思路不太一樣,千問是搜索相關圖片,幫我找到了更多圖片資料,我可以自己進一步探索相關內容;ChatGPT則是把圖片理解得很細,甚至告訴我是在哪拍的,拍攝中的主景是什么。算是各有優勢,如果圖片的理解和搜索能結合起來我會更喜歡。
所以在這題上我的偏好是 ChatGPT = 千問 > DeepSeek
測試3:文本生成
讓AI幫我們寫資料算是最常見的使用場景之一了,在這個場景下,我讓他們「幫我寫一個關于如何用AI輔助寫作周報的小紅書文章,300字」。
![]()
最基礎的,小紅書的圖文文章需要有標題、有正文,以及用一些emoji,內容更簡短,更貼近日常更實用生活化的語言。
在這里我覺得ChatGPT似乎不那么理解小紅書,從標題到正文的表述都太AI了。千問app會先闡述痛點引出要寫的內容,然后再去表述解決方案;而DeepSeek則是安利工具的角度寫的,內容結構倒是也很簡潔,但是有個問題是,里面媒體具體的工具,但是提到選擇「專業模式」這類詞,明顯有幻覺,真實度一般。
在這個場景下,我的偏好是:千問app > DeepSeek > ChatGPT
測試4:文本總結
在這個場景里,我都是把上萬字的最近段永平接受雪球CEO采訪的視頻播客的字幕發給了AI,然后讓他們幫我總結其中段永平對AI的觀點。
![]()
讓我比較意外的是,這三個產品都能無壓力吞下幾萬字的輸入,而且確實都總結到了關鍵點。不過,對于一個總結來說,我希望內容是既有深度,又有原文引用,去說明為何有這樣的結論的,細節是什么。
從這個視角來說,DeepSeek總結的結果太簡單了,只有結論沒有引用。千問做的好了不少,直接引用了不少段永平在視頻播客中的原文表述,比如「至少要慘和一下,不要miss掉」「買股票就是買公司」「阿貓阿狗都跟著漲」,從這些細節可以去生動理解段永平的結論。
而ChatGPT則是在這個問題上做了更深度思考,把不同片段中內容的觀點綜合了起來,所以結論在引用原文的前提下有了更深度的探討。
在這個場景下,我的偏好是:ChatGPT > 千問app > DeepSeek
所以,上面四項測試里,千問app有兩次第一,一次并列第一,一次第二,稱之為中國的ChatGPT并不過分。
這不是終點,是起點
所以,千問的出現,意味著什么?
1. 中國AI從追趕到并跑
技術上,Qwen3-Max全球第三,和GPT、Claude在同一梯隊。生態上,17萬衍生模型,甚至超過了Meta的Llama。
過去,我們跟著美國跑,模型晚一年,能力差一截。現在,我們和美國同步,甚至某些方面領先。
2. AI平權時代到來
ChatGPT Plus $20/月,不便宜。千問完全免費,功能全開,國內直接訪問。
人人可用,門檻夠低。
3. 應用落地加速
阿里的商業場景豐富:淘寶、天貓、釘釘、高德、夸克。大膽設想千問有機會可以打通這些產品,真正成為"AI助理"。
想象一下:你在釘釘開會,千問自動生成會議紀要。你在淘寶購物,千問幫你分析哪個商品性價比最高。你在高德導航,千問提醒你路上有什么好吃的。
這些場景,ChatGPT做不到。因為它只是一個產品,千問背后是一個生態。
中國的ChatGPT,不是夢想,而是現實。這不是終點,是起點。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.