![]()
文:王智遠 | ID:Z201440
這兩天,關于夸克「C+計劃」傳得紛紛揚揚。
有人說,這是夸克一次「AI 大換血」;也有人說,是阿里在測試閉源模型的新能力。
我體驗完,覺得這事兒,確實值得聊聊。說是說上線一個新功能,叫「對話助手」。但實際不能完全這么看;因為,它從「會說話、會聊天」,正式跨進了「能干活」的階段。
01
怎么干活呢?先說我自己的體驗。
如果你想用這個功能,得先把夸克升級到最新版本,升級之后,主頁會多出一個入口,點進去就是「對話助手」。
我試著問了一個比較「現實」的問題。
我說:「自己釀的酒給朋友喝,結果朋友喝出事了,這算什么罪名?」
為了測試它到底行不行,我特意在幾個別的AI助手上問了同樣的問題,AI的常規操作就不說了,先去查一些案例、貼幾條法律法規。
但最后這個答案夠不夠清晰?能不能直接用?
我個人覺得,大家可以看下面圖片對比下;夸克回答的結構更清晰、邏輯更有條理,連法律條文的引用,都更貼合實際場景,不堆術語,也不空講原則,是真能看懂、能用的那種。
圖片太長,你也可以搜同一個問題看看。
![]()
注釋:左邊為夸克APP實測,右邊為其他AI助手
我又試了個更偏「動手」的問題:即拍即譯。
怎么測呢?翻箱倒柜,翻出了本老古董——《英語統考大綱及學習指南》。(對,就是大學時人手一本的“考試圣經”。)
拍了兩張照片傳給它,讓它幫我翻譯。
本來也沒抱什么希望,畢竟這種教材類的內容句子長、結構亂,AI一般都整不明白。
結果幾秒鐘,夸克翻完了,還自動分了段。原文、譯文對照著排,我看著沒什么毛病,關鍵是它翻得特別自然。
當年有它我四級估計早過了。順便說一句,圖片里的手是我的,真測的,不是假案例。
你也可以試試拍點別的。比如:拍本外文原版書、拍報紙、拍路牌、拍Excel、拍論文都行,這個助手特別妙,一鍵搞定。
![]()
有時候我們找東西,是在「搜資源」。
大多數資源都太散太雜怎么辦?我這次換了個思路,直接問夸克:有沒有心理學書籍的網盤資源?
它給我列出了一份清單,338 本心理學書籍,書名、作者、文件大小全都有,里面還有馬斯洛、榮格、阿德勒這些經典著作。
有些鏈接,我點進去就能直接存進自己的夸克網盤;有些給的是下載方式,整個過程還挺順,它幫我把“找”和“存”這兩件事,一起干完了。
所以我,玩了將近一天,我才意識到:這已經不是單純的「能聊天」了,它「能干活」。
![]()
體驗完這幾件「能干活」的小事,再看外部進展。
最近,OpenAI 也推出了瀏覽器功能,讓 ChatGPT 能「自己去找」,這是AI發展的第二個階段,從「能說話」到「能思考」。
夸克這一步「邊找邊干」的動作,也有異曲同工之處。
問問題同時,它已經在后臺完成搜索、篩選、整合、比對,然后把結論整理成一段能直接使用的回答。
這種能力在交互上是質變的,因為作為一個用戶,我不用手動去查、去點、去拼,直接得到「已經驗證過的答案」,很方便。
也就是說,它把搜索和執行融合成了一件事。
02
如果說,豆包代表「陪聊型AI」,價值在于幫用戶表達、陪伴、娛樂;那么,夸克方向更像「任務型AI助理」,它的核心是解決問題、完成任務。
兩條路都沒錯,一個在訓練AI的「情感力」,一個在強化AI的「執行力」;但從用戶角度看,這次夸克明顯更接近「能幫我干點實事」的那個AI。
所以,我覺得,這次變化不只是產品層面的,AI助手這件事,正在迎來一個分水嶺:
從陪聊,到幫忙;從生成信息,到執行動作;從理解問題,到完成任務,而夸克,正好站在這條分界線上,它在探索新機會點。
夸克這次的「聰明」,背后有一顆全新「腦子」。
我查了下,它用的是阿里最新 Qwen 閉源模型。這個模型定位有點意思,介于「實驗室」和「落地」之間,屬于那層最核心的引擎。
怎么理解呢?
過去我們說 AI 模型厲害,大多是形容它“知道得多”,但 Qwen 的強,是在「理解力」和「執行力」上;它能聽懂模糊的問題,也能給出清晰的決策,這背后靠的阿里那顆「閉源大腦」。
閉源,不是封閉,更像是一種「可控的極致」;它讓模型的穩定性、準確率、響應邏輯,都被打磨到工程級的水準。
這次 Qwen 閉源版,性能已經比 Qwen3-Max 更強一檔,從去年到現在,在幾乎所有國際榜單上都進了第一梯隊。
03
第一梯隊這話,我說了不算,有數據可以作證。
比如:
Qwen3-Max在Chatbot Arena 上總分 1433 分,全球第三、開源模型第一;在大模型用coding解決真實世界問題SWE-Bench Verified 測試中拿下 69.6 分,躋身全球第一梯隊
在聚焦Agent工具調用能力的Tau2-Bench 測試中得 74.8 分,超過 Claude Opus 4 和 DeepSeek-V3.1;在數學推理的 AIME25 和 HMMT 測試中,更是雙雙拿到滿分 100,這是國內第一次
等等,有些英文你可能不太懂,我解釋一下:
Chatbot Arena 是測「聊天綜合水平」的;SWE-Bench 是測「寫代碼解決問題」的;Tau2-Bench 是測「AI調工具、連系統」的。
而 AIME25、HMMT,就是數學圈最硬核的兩場考試,能拿滿分,差不多等于 AI 在全球數學競賽上考了第一
所以,這一串數據說明一個很簡單的事實:Qwen 的這顆「腦子」,是讓 AI 終于長出了邏輯中樞。
舉個簡單例子:
你問它:「中國未來的新能源車會不會降價?」
普通模型大概率跟你扯一堆宏觀分析;而 Qwen 會先分析市場結構,再拆變量,最后得出趨勢,它不僅有答案,還知道答案是怎么來的。
這就是閉源模型的意義,它代表一種「工程化的確定性」,阿里在用閉源路線,讓 AI 從「能輸出」變成「能交付」,讓每一句回答,都能自證邏輯。
所以,智遠認為夸克「AI對話助手」模型的腦子,已經換代了。
阿里現在在用夸克驗證「模型驅動的生活系統」,未來文檔、網盤、郵箱、搜索、瀏覽器,都會被AI重新組織,你在一個入口提問,它能調用整個體系去完成。
換句話說,這是一次「模型—系統—生態」的打通,模型成了基礎設施,讓模型能從場景里長大,在生態里反饋,在使用中自我迭代。
智遠判斷,這是一場底層協議的改寫。
當模型能在應用中自學習、自反饋、自優化時,它就成了一個會自己演化的系統。
阿里過去做電商、做云計算、做支付系統,都在解決人和系統效率的問題,現在,他們開始解決另一個問題:智能體之間的效率。
從搜索、到對話,到推理,再到能干活,AI助手已經進入第三階段;而夸克,是這條進化線上,第一個能「跑起來」的窗口。
但問題是:當 AI 從會說、會想,進化到會做之后,下一個階段又會是什么呢?值得進一步關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.