![]()
大伙有沒有發現,最近AI圈有個越來越明顯的趨勢:怎么大家全在卷編程啊?
像Claude就不用說了,編程能力一直是標桿,其他人都得猛猛追;咱國產的GLM、MiniMax,最近發布的新模型也都在往編程上猛沖。就連OpenAI,最近都砍掉了燒錢的Sora視頻業務,把算力省出來聚焦生產力工具,說白了也就是編程和企業服務。
![]()
年初的時候,Anthropic就專門出了份《2026 Agentic Coding Trends Report》,預測就在今年,開發者會從"寫代碼的人"變成"指揮AI寫代碼的人"。
行業里有個專門的叫法,Agentic Coding——讓AI不只幫你寫代碼,而是直接幫你把活干了。你只要說清楚"我想要個什么東西",AI自己去理解、拆解、寫代碼、測試、改bug,直到交付一個能用的成品。
然后,就在這個全行業卷編程的節骨眼上,阿里發布了他們最新的大模型,Qwen3.6-Plus。不兒,3.5不是春節才出嗎,前幾天還剛出了個3.5-Omni,這速度是要飆車啊?
而且還不只是這一個模型,過去這一周,除了 3.5 Omni,阿里還發了圖片模型Wan-2.7-image,再加上這次的3.6-Plus,主打一個全面開花,據說,旗艦版Qwen3.6-Max也已經在路上了。這更新密度,都能和網文作者打打了。
從阿里公布的數據來看,千問3.6在SWE-bench系列和Claw-Eval等權威評測里,較上一代3.5有顯著提升,跑分不僅能登頂國內排行榜,而且是用更小的參數量打贏的,可以說是當下最強、最接近編程領域大神 Claude 的國產模型。
![]()
而且,模型更新的時間點也挺有意思的。上個月,千問技術負責人林俊旸離職的消息剛刷了一波屏,好多網友都擱那問,那Qwen以后還更新嗎?結果千問說,更,我還要加速更。。
不光更了,這次瞄準的方向,也是當下AI圈最火的編程。這也算是在這個大家都在卷編程的節骨眼上,交出的一份答卷。
所以,說了這么久,Qwen3.6到底咋樣啊?世超也直接上阿里云百煉搞了個API來,帶大家親自上手測一下。先省個流:這波升級,還真有點東西。
![]()
現在的AI,已經不是說句話就能討好我們的了,龍蝦等各種Agent出現,讓AI動手已經成家常便飯了。于是哥們先給我的龍蝦換了個腦子,直接接入Qwen3.6-Plus!
千問3.6號稱全模態,文字圖片視頻都能讀,那我們就先來個最狠的吧——直接丟視頻。
這次的任務是,我自己用手機錄一段視頻,里面是我在電腦上打開了一個網站,然后我邊滾動邊給Qwen講解,這里需要的功能,需要的特效啊,巴拉巴拉說了一堆,說實話我講得很抽象,連“帥不帥”這樣的詞都用上了。
![]()
提示詞也是簡簡單單。
![]()
結果,任務完成度有點出乎我意料了。那么大個(200多M)視頻過去,你讀完,然后復刻成這個程度,還配合我的抽象指令,我覺得相當可以了,連“進入專業評選”這個需求都做上了。
![]()
當然還是有點bug,比如某些元素有點丑啊,評委沒有滾動展示啊,交互按鈕動不了啊。。指望AI一次出完美的東西還是有點難的。
于是我又把這些反饋給它回復了一輪,給出的結果,完成度就相當高了。
![]()
以前,咱最頭疼的就是咋把自己的想法,翻譯成純文本告訴AI,是真的難,一是術語太多了,二是精確描述一件事,那和寫論文有啥區別,你想想你寫論文時候掉的頭發你就懂了。
所以現在,當你能直接跟AI視頻通話后,普通的vibe coding已經黯然失色了,現在趕到賽場的是,視頻vibe coding。
對了,這次的Qwen在“倉庫級”復雜任務的表現上也有大加強。
為啥叫倉庫呢?因為真實的程序員,寫代碼面對的不是一個文件,是幾百上千個文件,理解一個項目得先搞清楚目錄結構,哪個文件調用了哪個,數據從哪來到哪去,理清楚代碼之間的關系可能就得幾天。所以想真干活,不只是"能不能懂代碼",而是能不能讀懂整個項目,然后在里面干活。
大伙應該聽說了最近Claude Code源碼泄露那事兒,不知道的可以去看我們昨天的文章,反正就是,AI大廠把自家產品的底褲泄露了,源碼被人搬到GitHub上之后迅速傳開,后來還有人直接搞了個開源重制版。
所以世超就直接把GitHub上,這個開源重制版倉庫克隆到了本地。
![]()
但對很多人來說,這種新聞只能看個熱鬧,源碼這玩意,是你給我我就能讀得懂的嗎?
那你說這個我就不困了。現在的AI太好用了,咱直接用AI幫我們分析。我直接把倉庫在電腦上的位置,和我想要的效果發給了它。
結果Qwen3.6配合龍蝦,直接深入我的電腦,找到了這個倉庫。
![]()
不過我還以為一次讀一個倉庫,會把它腦袋讀暈。在發了一堆我看不懂的代碼之后,一個神秘的網站,就被它創造出來了。
![]()
結果,這是真有點帥了,完美的漸變藍,還放了倉庫里的logo,往下滑還有漸入的動效,甚至還貼心地做了去往 GitHub 的跳轉。
![]()
不過這就讓它結束了,我是不甘心的,主要還是我看不懂英文,而且網站講得很泛啊,開局幾張圖,后面就開始籠統概括,我想知道這項目真正的秘密在哪,能不能幫我挖一下啊。
結果,在我下達指令之后,它還真挖出來了,然后把它做成了中文網站,把源碼里藏著的好東西都給我看了,還翻譯成了大白話,以后吃瓜就靠這位大哥了。
![]()
而且,最重要的是我也沒有指路,它自己翻代碼、找重點、理解邏輯,然后把需求一層層拆開做了。這一整套下來,已經能看出Qwen3.6在這種倉庫級復雜任務上表現很強大了。
對了,經常用大模型的都知道,現在的token是越來越不夠用了,以至于很多人都有了token焦慮。
于是我做了一個token計算器,精打細算這一塊。。我下載的是DeepSeek V3的tokenizer,就是用來數token的那個東西,然后讓AI幫我打包成了個可執行文件。
![]()
不過我說實話,有點丑啊,我能不能把它改得好看點,就像一個聊天框那樣呢?
于是我把和Claude的聊天框丟給它了,讓它照著這個做。對了,因為用AI搞過我的文件夾,所以我文件夾還有點亂,我已經分不清哪個是哪個了。
![]()
![]()
第一次出來的結果,和我理解有些小偏差,是給原來那個程序,外觀換了個皮。于是我又補充說明了一版:
![]()
這下聽懂了,等了兩分鐘就給我做出來了,已經跟Claude的聊天框沒啥區別了
![]()
甚至我都沒要求,他還主動裝樣子,給我加了個模型切換,這是真細節了。(雖然沒用,但是有種掌控感)
![]()
從視頻復刻網頁,到讀懂復雜的代碼倉庫,再到一個token計算器說改就改,測到這兒,其實咱的感受已經挺明確了,AI干活的邊界,正在被越推越遠。
因為Qwen3.6這波進化,你已經能直接給AI丟視頻、丟截圖、丟一整個代碼倉庫,讓它自己去看、去理解、去動手改。這也印證了前面說的,這種能直接幫我們干活的Agentic Coding,正在成為各家現階段的首要目標。
而且,整個千問的節奏也在變。以前千問的印象是"開源界頂流",跑分能打,開發者愛用。現在阿里搞了個ATH事業群,吳泳銘親自帶隊,把模型研發、平臺、C端B端應用全串成一條線,品牌也統一成了"千問",從造Token到送Token到用Token一條龍,形成閉環。
就像Anthropic那份報告里提到,現在開發者日常工作里大概有60%已經在用AI了,但真正能完全甩手讓AI獨立干的,也就不到20%。也就是AI現在更像副駕駛,還沒到完全自動駕駛那一步。
但方向已經很清楚了,連銷售、法務、運營都開始自己用AI寫小工具解決問題了,這個趨勢對來Qwen在內的國產模型來說,其實是個機會。當AI編程從極客的玩具變成大伙的日常工具,價格和生態就是決定誰能鋪開的關鍵。
便宜、迭代快、生態優秀、還越來越能干活,這就是Qwen現在手握的優勢。不是每個場景都需要請Claude出山的,一個夠用、不貴、還在瘋狂進化的國產選擇,對大部分人來說已經挺香了。
最后,新模型已經上了百煉對外提供API服務,也已接入悟空、Qoder和Qwen Chat官網,大伙都自己去試試吧。合不合你心意,跑一跑就知道了。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.