說是放假,更勝上班,敢在大年初一之前,阿里終于把新一代大模型千問3.5給發了出來??
阿里出新模型是這樣的,在開源陣營里基本上「發布即登頂」,要是哪次沒有摘得榜一,那才是大新聞。
真正的看點早就已經是Qwen系列模型在架構上還有怎樣的突破,在所有開源大模型里,它是前沿含量最高的一個,沒有之一,歷次更新都在推翻和重建。
這其實也正是開源的價值,不要為了開源而開源,所有的折騰不休,都為行業的整體進步提供養分。
這次的Qwen3.5-Plus也不例外,3970億的總參數,相比上一代旗艦模型Qwen3-Max的萬億參數不增反降,這很反直覺。
雖然大家對于堆參數這件事已經有了邊際收益遞減的預期,但Qwen3.5-Plus以不到前代模型40%的參數量,把性能做到了Gemini 3 Pro的級別,還是讓人感到匪夷所思。
更離譜的是,Qwen3.5-Plus每次響應的激活參數只有170億,相當于只用5%的算力資源,就可以調動滿血智能,最后交付給給用戶的token成本只有Gemini 3 Pro的1/18??
如果互聯網還有記憶,就不會忘記千問大模型死磕MoE架構的過程,從Qwen1.5啟動細粒度專家模式開始,到Qwen3摒棄已經沿用3代的共享專家改用路由專家,再到這次Qwen3.5引入了混合注意力模式學會「有詳有略的讀」,每一次都在革自己和行業的命。
而且阿里并沒有藏私,這次推動Qwen3.5重大突破的門控技術,出自阿里在全球AI頂會2025 NeurIPS上斬獲最佳的論文,所有科技公司都可以吸收成果。
至此,Qwen、GLM、Kimi、DeepSeek??中國廠商已經徹底領跑開源模型隊列,并以無死角的交叉線路完成對閉源模型的全面包圍,都說2026年大的要來,所以由開源模型斬獲無定語的SOTA,會不會是其中一個大的?
準備好開香檳吧。
以前我們說阿里是中國最接近谷歌的AI大廠,更多的是在談四位一體的業務組織,也就是同時具有芯片、云計算、大模型和應用的公司標準,全球除了谷歌,好像也就只有阿里了。
但從今天起,阿里也是一個在全模態上100%對標谷歌的公司了,從預訓練第一天起,Qwen3.5就在文本和視覺的混合數據上聯合學習,讓視覺與語言在統一的參數空間內深度融合,這就是Gemini 3 Pro和Nano Banana、Notebooklm跨模態同步的
還是那句話,不再是6個月了,就只有3個月,這就是國產大模型和地表最強SOTA之間的距離,按照這個速度,超車的身位已經可以看到了。
辭舊迎新,除夕快樂!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.