![]()
不遺余力的發展智能,是為了增加生產力。
作者|張鵬
編輯|Cynthia
清明節期間,朋友圈一度被 Qwen3.6-Plus 登頂 OpenRouter 的日榜榜首,刷新平臺記錄這件事刷屏。
如果再把 Qwen3.6-Plus 刷榜和前后的幾件事結合在一起看,就有意思了。
3 月 16 日,Alibaba Token Hub(ATH)事業群成立,接下來半個月時間,阿里就像是打了雞血一樣:
3 月 30 日,Qwen3.5-Omni 發布,一口氣拿下 215 個 SOTA;
4 月 1 日,Wan2.7-Image 發布,成為國產圖像生成模型里最接近 Nano Banana Pro 的存在;
4 月 2 日,Qwen3.6-Plus 登場,僅僅一天后,就以單日調用量 1.4 萬億 Token 刷新 OpenRouter 的官方記錄。就在今天,這款模型也毫無懸念拿下了 OpenRouter 的周榜冠軍。一個背景知識是,OpenRouter 的美國用戶占比高達 47.17%,中國開發者僅占 6.01%。換句話說,這不是一個墻內自嗨的故事,是全球開發者用腳投票給出的結果。
![]()
節奏一下子像是回到了 2023 年百模大戰的時候,但這一次,卷的難度和目標,都不太一樣了。
01
面對現實,無法松懈
DeepSeek 和 Qwen 先后登頂全球開源模型頂峰之后,國內 AI 圈曾有過一種樂觀情緒:中國模型和海外的差距,已經大幅縮小了。
但這太樂觀了。
拿大洋彼岸的 Anthropic 作參照物。這家公司 2025 年初估值才 600 億美元,一年后就漲到 3800 億,六倍增長。年化收入,從 2025 年的 10 億美元,增長到 2026 年 3 月 190 億美元,漲了 19 倍。
具體到模型上:2025 年 2 月發布 3.7 Sonnet 與 Claude Code,只到 2026 年 3 月發布 Opus 4.6 和 Sonnet 4.6,中間每個季度的模型全部都是當時的 SOTA 模型,并且從 MCP 到 skills,從編程到 agent,Anthropic 也在不斷刷新 AI 場景想象力的天花板。
更值得注意的,當 Claude 系列模型的編程智能能力到達臨界點之后,還看到帶來 Claude Code、Claude Cowork 在內產品能力和市場規模的加速,從而形成一個不斷加速、左腳踩右腳自我強化的飛輪。
類比一下,就是領先者的火箭已經突破大氣層,其加速度在飆升;而如果追趕者還在大氣層爬升,每一步都要對抗摩擦力,雙方差距,很容易越拉越大。
AI 的馬拉松,只能面對現實,無法松懈。Qwen 和 DeepSeek 此前的崛起給了我們信心,但國產模型面臨的壓力并未減少,之前我和 Kimi、Minimax 這樣的創業團隊交流,能明顯感覺到他們提著這口氣在追趕。現在看來,阿里現在這口氣沒有松。
回頭看看,阿里確實站在有利的位置上,不止千問(Qwen)與萬相(Wan)兩大基模系列性能均處于世界頂尖水平。最近我的「龍蝦研究員」也提示觀察到亞馬遜、Airbnb 等公司也基于 Qwen 發展新業務;技術研發層面,英偉達、微軟、Meta 等知名科技巨頭基于 Qwen 開發衍生模型;前沿研究層面,斯坦福李飛飛團隊、硅谷獨角獸 Thinking Machines Lab、艾倫 AI 研究所等頂尖機構基于 Qwen 推進前沿技術創新。可以說開發者口碑上,阿里系的模型不僅贏得了開源聲譽,在 OpenRouter 這種全球開發者用腳投票的平臺上,也能與全球頂尖模型抗衡。
而前不久成立 ATH 這件事,我覺得是阿里要進一步握手成拳,體現戰略決心的動作。
02
智能的結果必須是生產力
為什么互聯網時代的云公司都是有 AB 面業務的公司?比如無論是,亞馬遜 AWS、阿里云都是本身有非常成功的 A 面 toC 業務,然后建立了 B 面的云業務。
很重要的一點是你的技術是要服務真實場景的生產力,甚至它本身就是從自己真實業務的需求長出來,然后才變成對外的服務的。這樣不僅僅合理,也能效率成本最優。
一個好的模型公司,看起來必須同時是一個好的業務公司,比如今天的 Anthropic。因為所有智能競賽,最終都要回答一個問題,誰能把智能轉化為真實價值?因為智能的最終體現一定是變成生產力。
Token 消耗量背后是已經被市場驗證、正在創造價值的業務。這些業務會反哺模型:告訴它什么能力真正有用,什么方向值得投入。
前幾年,中文互聯網一個很熱的話題是要摸著日本過河,因為日本的發展是個很有意思的現象。在「失去的三十年」之前,借助科技創新的力量,日本能在半導體、手機、電腦、家電、汽車、精細化工、鋼鐵,打得滿場開花;廣場協定之后,日本驟然失去了面向世界市場的成本優勢,所以我們看到日本的諾貝爾獎沒有變少,精細化工、半導體材料這些底層、技術路線相對穩定的行業的創新也沒斷,但是在手機、電視、電動車這些不斷變化的 to C 場景中,卻突然變得像沒頭蒼蠅一樣,陷入加拉帕格斯陷阱,頻繁點錯科技樹:把功能機、顯像管電視、氫能汽車做到登峰造極之后,一睜開眼,全世界的主流市場已經是智能機、液晶電視、電動車的天下。
沒有真實需求的拉動,技術進步就是無根之萍。所以在亞馬遜,貝索斯從第一天就用技術支撐自己的電商主業,而當這個業務足夠大、場景足夠復雜,云服務就長出來了。在阿里,則是淘寶的洪峰流量倒逼出飛天操作系統,電商的海量支付需求成就了支付寶。
理解了這個邏輯,就看懂阿里為什么要在 2026 年 3 月 16 日成立 Alibaba Token Hub(ATH)。
對阿里來說,組織變革的真正目標,是押注 Agent 時代的 Token 工業化。
過去,AI 的消耗邏輯是線性的:人類提問,AI 回答,一問一答。未來,在 agent 時代,AI 的 token 消耗邏輯是指數的:人提需求,Agent 自動化運行,一個需求能觸發幾十上百次 Token 消耗。這時候,誰能讓 Token 更高效地創造、輸送、應用,誰就能在 Agent 時代占據核心位置。
為此,在 ATH 這個全新的組織,阿里不僅由 CEO 吳泳銘親自下場帶隊,還對全集團所有與大模型和 AI 應用相關的核心資產,做了分三大板塊的流程化梳理:
創造 Token——通義實驗室,Qwen 的誕生地,基座能力輸出源;
輸送 Token——百煉 MaaS 平臺,幫助各行各業快速搭建 AI 應用,把 Token 以多種產品形態輸送到企業用戶手中;
應用 Token——千問 APP、悟空(釘釘旗下的企業級 Agent)、各種垂直場景的 AI 創新應用,覆蓋不同用戶、不同場景。
在外界看來,這只是一次業務整合。但在阿里內部,調整的背后,是思維慣性的大轉向:
電商時代阿里習慣于圍繞產品和流量來構建組織,這是過去二十年互聯網競爭留下的管理慣性。每條業務線擁有獨立的預算與 KPI,圍繞各自的 DAU 或 GMV 各自為戰。
因此,我們可以看到此前阿里的整體 AI 科技布局事以「通云哥」體系為主,從技術研發角度出發,確實實現了多點開花,但從技術到應用和商業化之間的部門墻則成為掣肘、資源分配問題也因為組織架構的分散而長期存在。
到了 AI 時代,生產要素從人頭變成 Token,組織的基本單位也就需要據此做出靈活切換。畢竟,如果我們認同Token 是新世界的石油,那 ATH 應該承擔的,就是創造集煉油廠、輸油管網、汽車工業于一體的完整工業體系。
不難想見,接下來的 ATH 部門大概率能從整個阿里集團層面,推動資源的更優調配以及不同環節之間的深度配合。前不久,ATH 旗下悟空,在 Qwen3.6-Plus 發布的當天就完成了接入,就是個很好的例子。Qwen3.5-Omni 支持用戶對著草圖口述需求,模型直接生成帶復雜 UI 的產品原型,這種音視頻 Vibe Coding 能力的洞察,也同樣離不開場景的牽引。
模型在進步,組織在變陣,阿里繼續在「折騰」。折騰就對了。
AI 競賽的每一個里程碑都是新的起點。今天阿里在幾天內連續發布三個 sota 模型,不出三個月,OpenAI、Anthropic 們也會發布性能更勝一籌的新版本模型。不同玩家輪流坐莊刷榜,這會是未來相當長一段時間里模型競爭的常態。
所以阿里確實需要繼續提住這口氣。回顧 PC 時代到移動互聯網時代的跨越,那時候,阿里能在電商領域筑起護城河,不是因為它比 eBay 更有錢,也不是因為它比亞馬遜更聰明,而是因為它做到真正的戰略聚焦,執行堅決,然后以更快節奏、更極致的服務好中國商家。
今天,從 ATH 的成立到三連發的密集發布,至少展現的是同樣的戰略意志。
*頭圖來源:阿里
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
極客一問
你如何看待阿里在 AI 上的戰略?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.