![]()
制圖:Midjouney-曉睿
圖文作者:舉大名耳
編輯:楊曉鶴
2024年,注定是生成式AI大放異彩的一年,但對(duì)蘋(píng)果來(lái)說(shuō),同樣也是個(gè)多事之秋。
前段時(shí)間,在蘋(píng)果舉行的新品發(fā)布會(huì)上,蘋(píng)果推出了iPad系列最輕最薄的新款iPad Pro,并在其中搭載了性能堪稱變態(tài)的M4芯片。
根據(jù)蘋(píng)果公布的參數(shù),M4的CPU為4大核+6小核,采用了3nm制程,算力達(dá)到了38 TFLOPS(每秒38萬(wàn)億次)。
然而,激進(jìn)的堆料,仍舊沒(méi)能緩解蘋(píng)果在AI時(shí)代的焦慮。
![]()
發(fā)布會(huì)之后,蘋(píng)果股價(jià)僅在周二(5月7日)收漲了0.38%,這不溫不火的股價(jià),也反應(yīng)出市場(chǎng)對(duì)這種一味“卷硬件”的策略,已經(jīng)不太感冒了。
畢竟,在用戶看來(lái),當(dāng)今的手機(jī)、平板,其實(shí)性能早已過(guò)剩,自己為什么要為那實(shí)際上用不到的“高性能”支付昂貴的溢價(jià)?
也正因如此,從去年以來(lái),蘋(píng)果的整體Mac銷(xiāo)量和iPad銷(xiāo)量下滑了40%。
更大的危險(xiǎn)信號(hào)是,iPhone在今年國(guó)內(nèi)市場(chǎng)第一季度的排名中,首次跌出了前五。
根據(jù)市場(chǎng)調(diào)研機(jī)構(gòu)TechInsights發(fā)布的最新數(shù)據(jù),2024年一季度,中國(guó)智能手機(jī)出貨量為6330萬(wàn)臺(tái),同比增長(zhǎng)1%。在頭部廠商排名中,蘋(píng)果以13.7%的市場(chǎng)份額跌出了前五名,加入“others”(其他)行列。
![]()
在競(jìng)爭(zhēng)對(duì)手微軟和谷歌,早已推出各自的AI工具和平臺(tái)的情況下,越來(lái)越多的人已經(jīng)看出來(lái),手機(jī)這類個(gè)人終端的下一場(chǎng)革命,就是當(dāng)下的生成式AI。
根據(jù)Gartner的預(yù)測(cè),到2024年底,生成式AI智能手機(jī)的全球出貨量,預(yù)計(jì)將達(dá)到2.95億臺(tái),占基礎(chǔ)和高級(jí)智能手機(jī)出貨量的22%
但不幸的是,在這個(gè)本該大有可為的新天地,蘋(píng)果卻拉胯了,至今沒(méi)有自己的大模型。
![]()
AI手機(jī)正在迎來(lái)”ipone時(shí)刻“
在當(dāng)下的生成式AI競(jìng)爭(zhēng)中,蘋(píng)果的步伐顯得格外遲緩與被動(dòng)。
當(dāng)微軟與谷歌等巨頭紛紛亮劍,推出自家的大模型,甚至連國(guó)內(nèi)的榮耀和OPPO等手機(jī)廠商,也先后揭曉了其專署的手機(jī)大模型(“魔法大模型”、AndesGPT)之時(shí),蘋(píng)果仍舊遲遲未能推出自主研發(fā)的生成式AI產(chǎn)品。
同時(shí),早已顯得滯后的Siri,在如今AI浪潮的沖擊下,表現(xiàn)也越發(fā)不盡人意。就連前蘋(píng)果工程師John Burkey也曾尖銳批評(píng)Siri的性能,稱其“笨拙”。
實(shí)際上,自庫(kù)克時(shí)代以來(lái),很多人都已經(jīng)感受到,現(xiàn)在的蘋(píng)果已經(jīng)不是喬布斯時(shí)代那個(gè)追求創(chuàng)新,產(chǎn)品為王的蘋(píng)果了。
一個(gè)重要的區(qū)別,就是現(xiàn)在的蘋(píng)果,少了從前那種顛覆性的創(chuàng)新和突破——例如最近OpenAI發(fā)布會(huì)上最新的GPT-4o展現(xiàn)出的強(qiáng)大AI能力。
在5月14日的發(fā)布會(huì)上,OpenAI最新的旗艦大模型GPT-4o,不僅能力橫跨了聽(tīng)、看、說(shuō)等能力,并且交互過(guò)程絲滑流暢毫無(wú)延遲,可以在平均320毫秒的時(shí)間內(nèi)響應(yīng)音頻輸入,與真人對(duì)話的反應(yīng)速度幾乎一樣了。
AI鯨選社
,贊18
更牛逼的是,在整個(gè)演示中,GPT-4o還進(jìn)行了多項(xiàng)需要實(shí)時(shí)交互的任務(wù)。
例如用攝像頭和用戶實(shí)時(shí)視頻聊天,或是通過(guò)攝像頭觀看用戶寫(xiě)在紙上的數(shù)學(xué)題,并進(jìn)行解答,又或者在用戶敲代碼的時(shí)候,觀看屏幕上的代碼,給出評(píng)價(jià)和建議等內(nèi)容。
所有這些體驗(yàn),都像真人一樣順滑,自然,毫無(wú)延遲。
![]()
這種炸裂的功能,直接把Siri這種只能進(jìn)行機(jī)械式語(yǔ)音交互的AI,甩到不知道多少條街開(kāi)外了。
同樣地,在一天后谷歌舉行的I/O開(kāi)發(fā)者大會(huì)上,為了與GPT-4o進(jìn)行對(duì)標(biāo),谷歌的Gemini 1.5 Pro,也展示了類似逆天的功能。
在演示中,召喚Gemini之后,測(cè)試者打開(kāi)了攝像頭,邊走邊提出問(wèn)題,例如:“當(dāng)你看到會(huì)發(fā)出聲音的東西時(shí),告訴我”。
結(jié)果,當(dāng)鏡頭掃過(guò)一個(gè)揚(yáng)聲器時(shí),Gemini果然回答道:“我看到一個(gè)揚(yáng)聲器,它可能會(huì)發(fā)聲。”
![]()
就如同當(dāng)年喬布斯在初代iPhone引入多點(diǎn)觸控屏幕,促進(jìn)了移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái)一樣。
這種毫無(wú)門(mén)檻的,更人性化的交互方式,必定會(huì)在手機(jī)端引發(fā)AI應(yīng)用的革命,從而引領(lǐng)AI走入千家萬(wàn)戶。
毫不夸張地說(shuō),如果將來(lái)手機(jī)AI真的有一個(gè)“iPhone時(shí)刻”,那么構(gòu)成這個(gè)“時(shí)刻”的關(guān)鍵要素之一,正是這樣實(shí)時(shí)性的,充滿人性和情感的語(yǔ)音交互AI。
![]()
不過(guò),正如初代iPhone的奇跡是由多個(gè)技術(shù)要素構(gòu)成的一樣,除了語(yǔ)音交互外,AI時(shí)代的“iPhone時(shí)刻”,也同樣需要更多的要素來(lái)構(gòu)成。
這些潛在的要素,也可以被稱為“技術(shù)合力”。蘋(píng)果的技術(shù)合力能打出AI重拳嗎?
![]()
蘋(píng)果AI實(shí)力到底幾何
就現(xiàn)階段來(lái)看,構(gòu)成手機(jī)AI“iPhone時(shí)刻”的主要技術(shù)條件,至少可歸納為三點(diǎn)核心要素:端側(cè)芯片、模型壓縮技術(shù),以及AI語(yǔ)音交互技術(shù)。
其中,端側(cè)芯片作為硬件基礎(chǔ),不僅決定了手機(jī)能運(yùn)行多大參數(shù)的大模型,而且還直接影響到數(shù)據(jù)處理的速度與效率;
而模型壓縮技術(shù),則是在手機(jī)上實(shí)現(xiàn)高性能AI的關(guān)鍵,它決定了將大模型縮小并塞進(jìn)手機(jī)的同時(shí),模型是否還能保持先進(jìn)、復(fù)雜的推理能力;
![]()
至于AI語(yǔ)音交互技術(shù),則是構(gòu)建流暢用戶界面與人機(jī)溝通體驗(yàn)的關(guān)鍵,它讓手機(jī)AI能夠準(zhǔn)確理解并響應(yīng)用戶的語(yǔ)音指令。
在端側(cè)芯片方面,雖然蘋(píng)果在發(fā)布會(huì)上宣稱M4各種強(qiáng)大,但是從M3的數(shù)據(jù)以及相對(duì)M3的提升來(lái)看,雖然擁有16個(gè)NPU,但在AI算力/生產(chǎn)力關(guān)鍵參考的Token生成速度上,M4大概率只有26-29/秒左右。
![]()
與競(jìng)品相比,蘋(píng)果的M4芯片AI算力(38TOPS)只能算一般。
在AI方面,高通驍龍8Gen3的峰值算力達(dá)45TOPS,英特爾面向AI PC的酷睿Ultra處理器AI算力也可達(dá)34TOPS,而天璣9300搭載的vivo X100 可運(yùn)行 100 億參數(shù)大模型,算力達(dá)到 33TOPS。
由此可見(jiàn),在群雄并起的AI時(shí)代,蘋(píng)果在硬件方面,并未像研發(fā)初代iPhone時(shí)那樣,占據(jù)絕對(duì)的優(yōu)勢(shì)(例如當(dāng)時(shí)的多點(diǎn)觸控)。
雖然蘋(píng)果M系列芯片還有統(tǒng)一內(nèi)存的巨大優(yōu)勢(shì),但是由此帶來(lái)的本地模型運(yùn)行慢,也無(wú)法多線程的劣勢(shì)面前,蘋(píng)果的AI芯片可謂讓開(kāi)發(fā)者又愛(ài)又恨。
而在第二大技術(shù)要素,即模型壓縮技術(shù)方面,蘋(píng)果則顯示出了明顯的滯后。
模型壓縮技術(shù),相當(dāng)于是當(dāng)年構(gòu)成“iPhone時(shí)刻”的iOS系統(tǒng),在這一技術(shù)領(lǐng)域,盡管蘋(píng)果發(fā)布了數(shù)篇關(guān)于手機(jī)大模型的論文,如《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》,總體上看,雖然這些論文的思路,都是在想方設(shè)法將模型壓縮,同時(shí)保持其強(qiáng)大性能,但迄今為止,蘋(píng)果仍未推出任何具體的大模型產(chǎn)品。
![]()
而在這個(gè)領(lǐng)域,走在最前面的,往往是一些專注于大模型技術(shù)的AI企業(yè),例如國(guó)內(nèi)的一些AI企業(yè)。
某智能公司的開(kāi)源MiniCPM-V 2.0模型,不僅以2B的參數(shù)量,超越了多個(gè)較大的模型,如Mistral-7B,甚至在某些方面,還能與Llama2-13B和Falcon-40B等參數(shù)是自己幾十倍的模型相媲美。
![]()
最后,從語(yǔ)音交互方面來(lái)看,早已顯得滯后、笨拙的Siri,在如今OpenAI、谷歌等先進(jìn)的AI技術(shù)面前,根本沒(méi)有任何招架之力。
尤其是5月14日的OpenAI發(fā)布會(huì)上,ChatGPT展現(xiàn)了最新的語(yǔ)音功能后,所有人都感覺(jué)到,這種具有語(yǔ)氣和情感,能夠像人類彼此交流時(shí)那樣允許插話、情緒飽滿的AI語(yǔ)音系統(tǒng),已經(jīng)對(duì)上一代語(yǔ)音AI(如Siri)形成了肉眼可見(jiàn)的碾壓。
![]()
由于蘋(píng)果在AI方面的拉胯,同時(shí)眼看著今年的WWDC(蘋(píng)果全球開(kāi)發(fā)者大會(huì))越來(lái)越近,感受到壓力的蘋(píng)果,不得不與OpenAI和谷歌進(jìn)行深入談判,計(jì)劃引入ChatGPT技術(shù)來(lái)對(duì)Siri進(jìn)行一次重大的“大腦”升級(jí)。
![]()
破碎的城墻
長(zhǎng)期以來(lái),蘋(píng)果之所以能在科技舞臺(tái)上傲視群雄,核心在于其獨(dú)特的軟硬件垂直整合的封閉生態(tài)系統(tǒng)。這一系統(tǒng)確保了從iPhone到Mac的每款產(chǎn)品,都能讓用戶享受到一個(gè)更加純凈、穩(wěn)定的體驗(yàn)。
然而,隨著AI時(shí)代的到來(lái),蘋(píng)果愈發(fā)難以在新的技術(shù)角力中,占據(jù)所有有利要素。
也正因如此,原本封閉的IOS系統(tǒng),如今也不得不對(duì)OpenAI等巨頭進(jìn)行開(kāi)放,而這樣的局面,實(shí)質(zhì)上已經(jīng)表明,蘋(píng)果原本固若金湯的城墻,今天已經(jīng)被部分地“攻破”了。
![]()
不過(guò),這樣的窘境,也不能全怪庫(kù)克,說(shuō)他不思進(jìn)取。其實(shí),這跟蘋(píng)果自身的業(yè)務(wù)性質(zhì)也有一定關(guān)系。
咱們得明白,蘋(píng)果一直以來(lái)玩得轉(zhuǎn)的是啥?是那種能跟它的自身硬件進(jìn)行契合的傳統(tǒng)AI。
啥叫傳統(tǒng)AI呢?簡(jiǎn)單講,就是那些專注于特定任務(wù),比如人臉識(shí)別、語(yǔ)音助手、拍照優(yōu)化這些,這些技術(shù)側(cè)重于利用算法優(yōu)化硬件性能,提升用戶體驗(yàn),恰好與蘋(píng)果擅長(zhǎng)的軟硬件一體化設(shè)計(jì)哲學(xué)不謀而合。
比如iPhone上的Face ID,看一眼屏幕就能解鎖,又例如Apple Watch通過(guò)心率監(jiān)測(cè)、血氧檢測(cè)等功能,結(jié)合AI算法分析,為用戶提供健康預(yù)警和健身建議等功能,這些都是傳統(tǒng)AI在蘋(píng)果設(shè)備上的體現(xiàn)。
![]()
蘋(píng)果這種高度依賴于硬件銷(xiāo)售與服務(wù)結(jié)合的商業(yè)模式,決定了生成式AI必然會(huì)與其存在一定的錯(cuò)位。
因?yàn)?strong>ChatGPT這樣的AI,本質(zhì)上是一種更“獨(dú)立”的系統(tǒng),而不是手機(jī)、平板這類硬件的附庸。在脫離硬件的情況下,其依賴云端算力,也照樣可以進(jìn)行推理。
照這樣來(lái)看,蘋(píng)果在生成式AI時(shí)代的沒(méi)落,難道是一種必然了嗎?
其實(shí)也不完全見(jiàn)得。
如果喬布斯仍舊掌舵蘋(píng)果,以其對(duì)用戶體驗(yàn)的偏執(zhí)追求,至少不會(huì)容忍Siri糟糕的體驗(yàn)?zāi)敲撮L(zhǎng)時(shí)間,蘋(píng)果在語(yǔ)音AI上的表現(xiàn),也許不會(huì)像今天那么慘。
同時(shí),喬布斯不僅理解用戶當(dāng)前的需求,并且還能夠憑借對(duì)市場(chǎng)和技術(shù)的洞察力,預(yù)見(jiàn)用戶未來(lái)可能的需求。
![]()
例如,在1980年代,喬布斯就預(yù)見(jiàn)到了圖形用戶界面(GUI)將取代傳統(tǒng)的命令行界面。并將GUI應(yīng)用于蘋(píng)果的Lisa和Macintosh電腦上,成為了個(gè)人電腦行業(yè)的重要里程碑。
同樣地,在2000年代初期,當(dāng)手機(jī)市場(chǎng)還主要由功能手機(jī)主導(dǎo)時(shí),他就預(yù)見(jiàn)到了智能手機(jī)的巨大潛力,并推出了iPhone。
到了2010年代,其更是前瞻性地預(yù)見(jiàn)到了人們對(duì)于便攜式、長(zhǎng)續(xù)航的移動(dòng)計(jì)算設(shè)備的需求,并推出了iPad,由此迅速開(kāi)啟了平板電腦市場(chǎng)。
![]()
銷(xiāo)售見(jiàn)長(zhǎng)的庫(kù)克,很明顯已經(jīng)意識(shí)到蘋(píng)果的問(wèn)題,也在最近發(fā)布了端側(cè)UI模型Ferret-UI,他能理解屏幕上的內(nèi)容,還能識(shí)別和操作具體的UI元素。
很多人猜測(cè),蘋(píng)果的意圖是手機(jī)端用自己的大模型處理簡(jiǎn)單任務(wù)(短信處理/iPhone 通知),云端用其他家大模型處理復(fù)雜任務(wù)(生成圖像/電子郵件回復(fù))。
這一權(quán)宜之計(jì),對(duì)于蘋(píng)果來(lái)說(shuō),也是沒(méi)辦法中的最好辦法,一向閉源的iOS也不得不半推半就,接受了“靈魂”植入。畢竟三星Galaxy S24依靠與Google大模型的合作,手機(jī)銷(xiāo)量增長(zhǎng)了兩位數(shù)。自己銷(xiāo)量下滑態(tài)勢(shì)止不住,此消彼長(zhǎng)下的黃昏很難熬。
停止造車(chē)后,AIl In AI 的蘋(píng)果,也沒(méi)有勇氣全力打造一款媲美ChatGPT的大模型,只能說(shuō)時(shí)代正在緩緩碾過(guò)巨頭的尸體。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.