撰文| 郝 鑫 吳先之
編輯| 王 潘
電影《某種物質(zhì)》里主人公伊麗莎白為了留住青春,通過注射藥劑,分裂出了克隆體蘇。
大模型讓曾經(jīng)自詡“弄潮兒”的互聯(lián)網(wǎng)大廠,也感受到了“衰老”的恐懼。從百度、阿里到字節(jié),他們紛紛在尋找自己的“蘇”。
字節(jié)“豆包”正在以肉眼可見的速度進行分裂,從AI助手到輸入法,從TWS耳機到從系統(tǒng)上定制智能手機。
12月第1天,字節(jié)發(fā)布了一款可體驗豆包手機助手的工程樣機。手機型號為中興旗下的努比亞手機M153,硬件核心指標包括高通驍龍8至尊版芯片、16GB內(nèi)存+512GB存儲,售價3499元。
![]()
其中,高通驍龍8至尊版芯片搭載了新一代Hexagon NPU可高效運行端側(cè)多模態(tài)生成式AI應(yīng)用,還能支撐多模態(tài) AI 助手實現(xiàn)自動語音識別、大語言模型交互等功能,為搭載豆包提供了支撐。
豆包助手落地的新“肉體”差強人意,M153機型基礎(chǔ)配置與同期其他品牌,還有努比亞今年旗艦相比,都算不上頂配。這可能說明字節(jié)在與手機廠商合作落地豆包手機助手時,重在體驗功能而非拼參數(shù)性能。
根據(jù)豆包實際視頻演示能夠看到,豆包手機助手提供了語音和側(cè)邊AI鍵兩種喚醒方式,無論哪種都需要與終端廠商合作開發(fā),只是差異在于前者替代了手機廠商自己的手機助手,而后者則是定義硬件。
在喚醒條件下,豆包手機助手直接讀取屏幕內(nèi)容、使用多模態(tài)理解照片、自動完成跨平臺比價下單、遠程控制汽車等。視頻重點展現(xiàn)了AI助手在端側(cè)部署中長文本、記憶、個性化的多種技術(shù)能力。
值得一提的是,演示視頻中還給出了一個根據(jù)規(guī)劃執(zhí)行旅行中的機票、門票、餐廳預訂的案例,花費8分多鐘完成了整套操作。
豆包與手機廠商合作,超越了簡單的Agent和Computer Use操作,更像是一次Siri式的落地探索。統(tǒng)一化的喚起和手機操作入口,打包式的集成操作,一個全新的AI手機助手正在被大模型軟件改寫。
互相克隆與排異反應(yīng)
伊麗莎白為了留住青春,需要克隆體蘇延續(xù)青春。在端側(cè) AI 競賽中,豆包手機助手,拉開了 “互為克隆體” 的合作序幕。
![]()
為了拓展用戶規(guī)模,同時也尋找最好的落地形態(tài),豆包進行了多種嘗試,包括PC端、移動端、網(wǎng)頁端、瀏覽器插件,或是內(nèi)嵌入生態(tài)內(nèi),如飛書。種種嘗試似乎仍不能滿足字節(jié)的胃口,畢竟缺乏硬件載體,容易落入“輕量級外掛” 的陷阱之中。
為此,字節(jié)在去年10月,曾推出軟硬融合的Ola Friend——一款搭載了豆包的首款AI智能體耳機。不過TWS耳機的形態(tài)限制了計算與存儲,使得AI藍牙耳機必須依靠外部設(shè)備接入云端大模型,輸出AI功能。而且作為附屬配件,耳機薄弱的離線能力,存在離開手機即斷網(wǎng)的問題。
從實際場景來看,AI耳機最核心的功能是利用聲學信號處理與AI算法的深度融合,在語音交互層面完成從聽到理解的跨越。因此,對于豆包而言,走向手機終端,尋求與硬件更深層次的融合是必經(jīng)之路。
牽手手機廠商,不止能讓豆包,對于所有AI助手而言都是跳出 “云端孤島” 困境的有效手段。手機是用戶保有量最大、每日交互最頻繁的終端,是大模型落地的必爭之地。搭載了豆包助手的AI手機,也有機會進一步激活既有的AI耳機等其他產(chǎn)品。
若是將華榮米OV這類手機生態(tài)完善的大廠,比作基建完善的高速公路,那么努比亞則是相對生態(tài)不夠完善的普通道路。豆包選擇與努比亞合作,既有現(xiàn)實考量,也是希望打造一個標桿級的“蘇”,吸引其他廠商合作。
根據(jù)視頻演示,或多或少看到豆包與努比亞手機的合作已深入到底層權(quán)限的調(diào)用,否則不可能完成OTA場景下的跨平臺動作。
豆包手機助手具備端側(cè)記憶、跨App代操作等技術(shù),其本地加密存儲的記憶功能與GUI模擬點擊能力,讓其從工具完成了向助理的變化。而手機廠商掌控硬件工程與底層權(quán)限,握有分配服務(wù)與變現(xiàn)的主導權(quán)。
換言之,豆包手機助手其實給終端廠商提供了一條類似于華為的智選車合作方案,而非直接下場做手機。
以技術(shù)主導權(quán)換硬件落地,如與努比亞協(xié)同優(yōu)化端側(cè)算力,與其說讓模型適配手機,不如說是適配手機芯片。借助努比亞,豆包向基于安卓的手機廠商釋放了一個相當明確的信息:生態(tài)好壞與否不重要。從生態(tài)上推進 “系統(tǒng)級嵌入”,通過標準化接口解決權(quán)限爭議,同時以端側(cè)數(shù)據(jù)處理,解決數(shù)據(jù)隱私問題。
同時需要看到,努比亞背后的中興不算手機大廠,其名不見經(jīng)傳的小牛語音助理更容易從系統(tǒng)層面換做豆包AI助理。做個不恰當?shù)谋扔鳎拱谂葋啠缤囶I(lǐng)域的華為之于賽力斯。豆包是努比亞的加分項,而對于其他大廠而言,則存在失去“靈魂”的焦慮。
豆包與手機廠商深度合作的挑戰(zhàn),或許并不是技術(shù)能力,而是商業(yè)與組織能力。
在手機大廠眼中,豆包,乃至字節(jié)都只是“第三方服務(wù)商”,而涉及到硬件適配與底層權(quán)限調(diào)用,將讓事情變得復雜起來。引入豆包都將讓手機廠商自研AI助理陷入尷尬的境地,這也導致手機大廠與豆包存在一定的排異反應(yīng)。
誰是蘇,誰是伊麗莎白?
“在AI和游戲面前,手機性能永不過剩。”
一家頭部手機廠商高級副總裁此前談及端側(cè)AI部署時提到,手機廠商除了要保持流暢運轉(zhuǎn),還需要考慮能效、散熱等性能發(fā)揮到極致。畢竟手機端側(cè)AI部署才剛剛起步,對于如何做好底層內(nèi)存占用與調(diào)用,各手機廠商都還在摸索之中。
言下之意,到底如何開展,手機廠商們還在獨自摸索之中。
在談及第三方合作時,上述表達看似開放,實則暗藏深意。“我們跟很多三方廠商都有合作,他們是非常樂意去成就這件事情,甚至有很多服務(wù)廠商主動找我們,我們一直推動的生態(tài)都是希望是雙方共贏的。”
一年時間下來,幾乎所有手機廠商現(xiàn)有的AI應(yīng)用并沒有結(jié)構(gòu)性變化,而無法像豆包與努比亞一樣,真正讓AI助手來“完成動作”。
![]()
OPPO是幾家廠商中步子邁得最大的一家。此前收購波形智能,且一并吸納了核心高管CEO姜昱辰、COO余騰、CTO周王春澍,除了迅速建立起文本處理能力,或多或少也看到了后者鼓吹的LPA(Life-long Personalized AI,長期個性化AI),在個性化服務(wù)上的前景。
盡管不少手機廠商在去年和今年,都曾用自研的AI助手點一杯咖啡,這背后其實源于工程化。在豆包手機助手演示視頻的最后一部分可以看到,其在復雜的出國場景下,如何根據(jù)用戶個性化需求,完成跨平臺的復雜動作。
在社交媒體收藏巴黎餐廳,并在地圖軟件上標記。基于記憶數(shù)據(jù),豆包根據(jù)需求,在行程中插入了奧賽美術(shù)館的梵高展。最后再到OTA平臺,完成了訂票動作。
另一個更現(xiàn)實的問題是,榮米OV都有一支規(guī)模龐大的AI手機助手開發(fā)團隊,與豆包的合作都將改變其在內(nèi)部的位置。
大模型時代,到底是硬件定義軟件,還是軟件定義硬件,關(guān)于這個問題至今眾說紛紜。
但在去年大模型公司和硬件廠商達成的默契是,“雙方一定要合作”,即針對端側(cè)模型在硬件基礎(chǔ)上,進行一體式的優(yōu)化。蘋果和OpenAI拿出了一個范本,涉及隱私部分調(diào)取在本地,算力推理部分在云端。
既非端側(cè)大模型,也不是純硬件,字節(jié)靠豆包AI助手走出了第三條路。這條路以“AI頂流”豆包這款產(chǎn)品為背書,通過以“類Siri”的模式部署到手機端,以此來帶動合作方手機和字節(jié)旗下耳機的銷量。
什么是“類Siri”的模式?豆包AI助手在手機端承擔著喚起所有功能的管家角色,這不同于此前大火的Computer Use功能,因為Computer Use更側(cè)重于讓大模型直接操控操作系統(tǒng)或應(yīng)用程序,實現(xiàn)“所見即控”的自動化任務(wù)執(zhí)行。
豆包的“類Siri”模式本質(zhì)上是AI助手的生態(tài)化延伸,它并不追求直接介入系統(tǒng)底層操控,而是作為用戶與手機功能、內(nèi)容服務(wù)、物聯(lián)網(wǎng)設(shè)備之間的智能調(diào)度中樞。
字節(jié)的第三條路,本質(zhì)上是以軟件體驗為杠桿,撬動硬件市場的增量需求。當用戶因豆包的便捷交互而選擇特定手機或耳機時,模型的價值已不再局限于技術(shù)本身,而是成為了消費決策的關(guān)鍵變量。接下來,這有可能成為新的趨勢,軟件與硬件的邊界正在從“誰定義誰”轉(zhuǎn)向“共同進化”。
入口再定義
“豆包AI助手”所隱喻的內(nèi)涵,正在被字節(jié)悄悄放大。
在我們的既有印象中,豆包是一款AI應(yīng)用,而不是Siri。今年是AI to C大年,各類面向C端的AI助手層出不窮,形態(tài)各異。產(chǎn)品多以兩種方式出現(xiàn),一種是靈光、千問此類的獨立應(yīng)用;另一種是元寶,嵌入微信生態(tài)之內(nèi)的輕量化路徑。
螞蟻靈光團隊在回顧產(chǎn)品誕生歷程中提到一點觀察,“沿著提高信息傳遞效率的產(chǎn)品主軸探索,我們發(fā)現(xiàn)模型寫代碼、調(diào)動各種工具,確實到了一個不僅能夠降本增效,還具備生成用戶消費級內(nèi)容的臨界點”。
豆包作為一款AI應(yīng)用,深受字節(jié)產(chǎn)品邏輯影響。一個細節(jié)是,為了成為一款低門檻的通用助手,豆包從一開始就把語音視為一種重要的輸入方式,到幾乎成為所有嘗試中雷打不動的功能。我們觀察到,語音的邏輯再次復用到了豆包輸入法上。對比微信輸入法,豆包把語音輸入放置在了顯眼的位置。
![]()
某大廠AI應(yīng)用團隊告訴我們,現(xiàn)在的AI產(chǎn)品各有主張,比如豆包的語音打電話功能、DeepSeek的推理功能,這導致新產(chǎn)品問世只能在豆包以外的側(cè)面生存。
同樣是投流之戰(zhàn),Kimi打的是知名度和資本市場估值,字節(jié)則將其視為大型A、B測試訓練場。哪些功能屬于高頻,哪些屬于技術(shù)剛需,用Token調(diào)取量一對比一目了然。
QuestMobile數(shù)據(jù)顯示,2025年10月,AI原生應(yīng)用中,豆包最高,DAU為5410萬。DAU大戰(zhàn)落下帷幕,隨著豆包功能的向外延展,Kimi、MiniMax等產(chǎn)品離一款通用AI助手的標準越來越遠,轉(zhuǎn)而走向了更聚焦的垂直Agent。
然而,這場戰(zhàn)事似乎尚未結(jié)束,在最近有了新的名字——“入口之爭”。阿里的千問是新發(fā)起者,就在上周剛完成了與夸克應(yīng)用、瀏覽器,以及智能眼鏡的深度融合。
眼下,字節(jié)轉(zhuǎn)身殺了個回馬槍,直指手機廠商腹地,提出了另一種“入口”形態(tài)。
如果說千問整合的是阿里生態(tài)入口,那么字節(jié)想以豆包打通的則是,除了蘋果、鴻蒙封閉生態(tài)外的手機廠商入口。此前,諸如面壁智能、階躍星辰一些大模型創(chuàng)業(yè)公司也有一些嘗試,但囿于自身資源,無法跟手機廠商完成深度綁定。
豆包手機助手僅是字節(jié)降落端側(cè)的“先頭兵”,其背后是豆包為統(tǒng)一品牌下的大模型技術(shù)能力、產(chǎn)品能力和用戶場景洞察能力。字節(jié)的野心可能是讓豆包成為手機廠商的標準化Siri,實現(xiàn)“所見即可問,所言即可為”。
在短期內(nèi)或許會遇到挑戰(zhàn)。一方面受限于大模型技術(shù)的不確定性,演示場景無法保證百分百復現(xiàn),實際可用性與預期仍有差距;另一方面,豆包AI助手想要成為“靈魂”,需要與不同廠商的操作系統(tǒng)進行更深度的、定制化的整合,這將需要時間和工程投入。
更長遠來看,如何處理好與安卓手機廠商之間,既合作又博弈的復雜生態(tài)關(guān)系變得尤為重要。
字節(jié)“不造手機,卻想定義手機靈魂”的戰(zhàn)略,正將這場入口之爭推向一個更微妙,也更關(guān)鍵的階段。互聯(lián)網(wǎng)巨頭與終端廠商在這場AI重構(gòu)一切的變革面前,都會思考“You are one”。
這句來自《某種物質(zhì)》的隱喻,既兜售著軟硬一體的本源,也暗藏著無可避免的矛盾。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關(guān)注我們!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.