文 | 新立場Pro
“工具在使用者手中時才成為工具。”海德格爾的這段話,今天用來理解AI硬件同樣貼切。
問題在于,大模型這只“手”伸出來的時候,用戶究竟愿意把它握在掌心里(手機),還是架在鼻梁上(眼鏡),亦或是讓它一直貼耳傾聽(耳機)?
據《Z Finance》獨家報道,字節跳動內部決定暫停豆包AI眼鏡項目。想要理解這場選擇,需要先回答一個更基礎的問題:大模型公司為什么要做硬件?
據《晚點LatePost》的報道,火山引擎豆包大模型日均調用量已超過120萬億Token,半年增長4倍。國家數據局的數據顯示,中國日均Token消耗量在一年半內增長約300倍。黃仁勛在GTC 2026的舞臺上說,Token將是未來數字世界最核心的大宗商品。
但Token消耗的暴漲,反而掩蓋了一個更根本的問題,即這些Token從哪里被觸發,通過什么界面進入用戶的生活?
過去兩年,這個問題的答案是手機屏幕和對話框。OpenClaw的爆火將Agent從開發者工具推向大眾用戶,直接推高了對“隨時隨地觸發AI執行”這一能力的需求密度。當大模型的競爭從生成式問答轉向執行任務,執行鏈路就需要一個更靠近用戶身體的物理錨點。
豆包選擇的落點是操作系統,以“操作系統級合作”模式切入AI手機賽道,通過與手機廠商在系統層面合作,獲得識別屏幕UI元素、模擬人工操作的核心權限;千問選擇的是眼鏡,千問AI眼鏡上線首批“AI辦事”能力后,支持話費充值、掃碼騎車、停車繳費、語音點外賣。這些功能的共同特征是,AI開始在真實世界里把事情做完。
兩條路徑的本質,是兩家公司對同一個問題給出的不同工程答案:究竟改由誰來做Agent執行鏈路的物理接口。
兩種優勢的兩種延伸
大模型公司做硬件,實際上是在回答一個從Token經濟學中衍生出來的問題。
過去兩年的AI競爭,核心戰場在模型能力和價格。價格戰把Token單價從三年前的高點壓低了約300倍。但單價的崩塌沒有讓AI支出變得可預測,原因很簡單:Agent類應用讓單次任務的Token消耗從普通對話的幾十倍起跳。據騰訊科技報道,亞太區電商技術公司Branch8的6人團隊,啟用Claude Code第一個月花了2400美元,經過八周密集優化才勉強降到680美元。Token支出管理本身已經變成了一項需要專門技能的工作。
這個成本結構,在源頭上改寫了很多AI產品的競爭邏輯。誰掌握了Agent的觸發入口,誰就掌握了Token消耗的源頭。而觸發入口的密度,取決于設備離用戶有多近、啟動摩擦力有多低。這是豆包和千問同時轉向硬件的真實驅動力:在Token消耗鏈路的最前端建立一個物理節點。
千問AI眼鏡的團隊跟蹤了一個指標——用戶交互輪次,即AI幫助用戶完成事項的頻率。夸克眼鏡S1上線后,用戶交互數對比第三方手機AI助手應用提升了約6倍。戴在臉上的AI之所以被調用得更頻繁,原因在于感知始終在線、啟動摩擦力趨近于零。
對于Agent而言,這種持續在場的交互密度,意味著更豐富的上下文積累,也意味著更多執行任務的觸發機會。
2026年4月,千問AI眼鏡首次OTA升級后上線了“AI辦事”能力,通過接入淘寶閃購、支付寶,支持話費充值、掃碼騎車、停車繳費、語音點外賣。產品定義由此發生轉移:AI從回答問題,變成了把事情辦完。
豆包確定的路徑同樣深入,只是方向不同。去年12月,豆包AI手機助手以“操作系統級合作”模式進入AI手機賽道,通過與手機廠商在系統層面合作,獲得識別屏幕UI元素、模擬人工操作的核心權限。
實測顯示,“比價肯德基套餐并下單發送截圖”這一涉及三個應用、十二步手動操作的任務,豆包可在后臺自動完成,僅支付環節需人工介入,全程耗時較人工操作縮短72%。
目前,Agent在大眾用戶中真正形成使用習慣還需要一段時間。豆包和千問現在的硬件投入,是在為一個尚未到來的需求峰值提前卡位。這是典型的平臺邏輯:先占住感知節點,等Agent成熟之后,數據流和調用量自然會從這個節點涌入。
但平臺邏輯有一個前提,設備必須在需求到來之前就已經在用戶身上。這也解釋了為什么千問要在眼鏡之外再布局指環和耳機,畢竟單一形態覆蓋不了全天候的感知需求,矩陣才能。
豆包與千問的硬件路徑,都是從自身核心優勢出發延伸的結果,只是各自優勢所對應的最優形態不同。
豆包AI眼鏡的項目暫停,內部給出的核心判斷也很合理,大框、拍攝、語音、翻譯,主流范式已被Ray-Ban Meta統一。2025年,Meta智能眼鏡全年銷量超過700萬副,全球市場份額達85.2%。在這個格局下,“能不能做”早已不是問題。
千問的選擇,出發點同樣清晰。阿里的應用生態中,話費充值、外賣點單、停車繳費,這些淘寶、支付寶的既有能力可以直接接入Agent執行鏈路,通過眼鏡重新封裝成AI原生交互形態。對于沒有這套生態底座的公司,眼鏡只是一個戴在臉上的語音助手;對阿里來說,眼鏡是打通已有應用、建立新型觸點的現實節點。
豆包深入手機操作系統,是在自己的流量分發能力地帶建立Agent入口。千問押注可穿戴設備矩陣,是在把阿里的應用生態重新封裝成AI原生交互形態。
把時間線拉長來看,今天產品發得多驚艷、銷量跑得多猛,其實都決定不了終局。兩年后,當Agent像網絡一樣融進工作流,唯一的護城河只有一條:用戶習慣了從哪個入口觸發它。
端側推理如何改變成本結構
硬件入口的競爭,最終會回到一個更基礎的問題上:Token從哪里來,到哪里去,誰來付賬。
Token的價格是透明的,但Token里裝了多少“智力”,用戶無從得知。4月,AMD AI戰略總監Stella Laurenzo基于6852個Claude Code會話的分析顯示,從今年2月下旬開始,Claude Opus 4.6的推理深度大幅下降,騰訊科技也報道,“每次代碼編輯前的文件閱讀次數”從6.6驟降至2.0,降幅約70%。
這些改變沒有在任何顯著位置通知用戶,大量開發者是在代碼質量明顯下降之后才開始懷疑“模型是不是變笨了”。
更隱蔽的是緩存命中率對實際成本的影響。一位開發者對Claude Code一周數據的追蹤顯示,正常情況下91%的Token來自緩存命中,緩存命中價格只有標準輸入價格的十分之一。如果緩存全部失效,Input成本會暴漲到原來的5.7倍。
這個成本結構,是端側模型價值主張的核心依據之一。端側推理一次性部署后,邊際成本趨近于零,沒有緩存命中率的不確定性,也沒有云端峰值定價的波動。對于頻繁觸發Agent任務的硬件設備,這個優勢會隨使用密度的增加而持續放大。
谷歌DeepMind 4月發布的Gemma 4,重新劃定了端側模型的能力邊界。其E2B和E4B模型推理時激活的有效參數量分別僅為20億和40億,在LiteRT-LM框架下,可在3秒內處理跨越兩個獨立技能的4000個輸入Token;E2B與E4B原生支持函數調用,覆蓋Agent工作流所需的核心推理路徑。上下文窗口達128K Token,在不足1.5GB的內存占用下可以完成運行。
![]()
這意味著一個可以調用外部工具、執行多步驟規劃的端側Agent,其硬件門檻已降至現代中端手機的內存余量之內。
千問目前采用的云端大模型加本地輕量智能體的混合架構,是在當前端側算力約束下的一個不錯的解。據36氪報道,千問在2026年規劃的硬件形態除AI眼鏡還包括AI指環、AI耳機,三種形態覆蓋視覺交互、無感佩戴和音頻交互三個不同維度,形成全天候的感知矩陣。
這個矩陣的核心價值在于眼鏡捕獲第一視角的行為數據流,這些數據反哺千問大模型迭代,模型能力提升后又優化硬件體驗,形成閉環。
但Gemma 4這類模型的出現,正在縮短這個“當前”的有效期。當端側模型可以在本地獨立完成越來越多的Agent任務,云端兜底的必要性在高頻輕量場景中會持續下降,Token的消耗路徑也會隨之改變。
這會對當前AI硬件的主流云端模式,其一,端側能力的提升會降低硬件設備對云端的依賴,讓設備端AI從成本結構上更具競爭力;其二,當用戶的Agent任務越來越多地在本地完成,依賴數據回流云端來驅動模型迭代的商業閉環,也需要重新設計數據獲取路徑。
有多少增量留在云端、有多少轉移至本地,將成為整個MaaS商業模式需要提前應對的結構性問題。
當Token消耗從對話層遷移到執行層,Agent開始代替人操作應用,這些任務是在云端計費還是在端側本地完成?這個問題的答案,會決定Token的消耗結構,進而影響MaaS業務的收入模型。
火山引擎超百億元的MaaS業務收入目標已隨著Seed 2.0、Seedance 2.0等模型發布、OpenClaw爆火上調被提高。阿里成立了ATH事業群,兩家公司在云端的Token戰爭和在硬件端的入口爭奪,是同一場競爭的兩個戰場。誰能在硬件側建立足夠高頻的Agent使用習慣,誰就在云端MaaS的下一輪增長中占據了需求端的主動權。
2026年的AI硬件競爭,表面上看是眼鏡和手機的形態之爭,實質上是對Agent時代Token消耗入口的提前卡位。這場競爭沒有快速的結論,因為Agent在大眾用戶中的真實使用習慣還在形成,端側模型的能力邊界還在被Gemma 4這類模型持續推進,云端Token的成本結構還在被緩存命中率、推理深度和定價策略悄悄改變。
《新立場》認為,決定勝負的是誰擁有足夠密度和足夠高頻的應用場景,能讓Agent在真實使用中持續積累上下文、優化執行能力,形成對用戶的理解深度。
這個變量,更多由生態底座決定。千問和豆包的硬件分歧,是兩個不同生態底座在同一個技術拐點上做出的不同押注,各自都在最擅長的地方尋找答案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.