撰文| 吳先之
編輯| 王 潘
AI眼鏡正在從極客玩具,穩步走入大眾生活之中。
IDC最新發布的報告顯示,2025年上半年,全球智能眼鏡市場出貨量達到406.5萬臺,同比增長64.2%,預計到2029年更將突破4000萬臺。其中,中國更被視為是拉動全球智能眼鏡增長的主要市場,預計五年復合增長率將高達55.6%,增速位居全球首位。
產品迭代同樣不斷加速。前有Meta一口氣在9月,發布升級多款與Ray-Ban合作的新品,而在剛剛結束的雙十一購物節期間,國內智能眼鏡也呈現“井噴式”增長。
作為人機協同感知世界的全新媒介,AI眼鏡在市場、消費端熱度持續飆升的背后,是大模型對多模態的理解和處理實現了長足的進步。多模態交互能力的革新,除了硬件產品本身,自然而然也為AI技術落地,帶來了更加廣闊的躍升空間。
例如,在11月13日舉行的百度世界2025“大模型如何重塑智能硬件新體驗”論壇上,小度就對外發布了其全新的AI助手品牌,以及包括小度AI眼鏡、多模態智能攝像機等在內的多款AI硬件新品。
![]()
大模型時代,所有的硬件設備都值得,也必將被AI重新塑造和升級。隨著多模態的發展,我們可以看到,通過視覺、語言,甚至是空間數據等多維信息的綜合理解,將進一步解鎖智能硬件的想象力。
更為重要的是,這些硬件,將是通往更自然、更無縫的人機交互未來的重要基石。
讓AI真正有用,趕早更要趕巧
人機交互這個詞,或許不是所有人都聽過。但各類智能助手,大家一定都不陌生。
2011年,在iPhone 4s面世的當天,蘋果Siri以智能語音助手的身份初次正式亮相,就被賦予了“顛覆性交互”的光環,成為當時發布會最大的亮點。但十多年時間過去,這位最早登場的領先者,不僅被諸多后來者彎道趕超,還常在社交媒體平臺上,被網友調侃是“人工智障”。
現在看來,其中很重要的一個原因,就是過度依賴單一模態,從而造成AI所理解到的信息,與復雜的真實世界之間的很多信息錯位。
比如,當用戶跟Siri說“把剛才那張跟我和我母親的合照,微信發給她”時,由于這個指令需要涉及時間區間(剛才)、作用對象(合照)、人物關系(我和我媽),Siri如果沒有對相冊的視覺探知能力、對聯系人關系的深度理解,以及終端生態的能力打通,就很難執行。
不僅如此,在上面的例子中,Siri還得能夠結合用戶前一句話,準確分析出后半句中的“她”指代的是誰,才有可能完整正確的操作。
這也是其為何如今依舊使用寥寥的另一個原因:即便是語音,Siri的“光環”里,也很容易不理解、甚至丟失掉海量非語言的信息,例如語調、停頓,表情、肢體語言,以及說話時的上下文語境等等,這些都承載著人類真實交流時的“言外之意”。
![]()
而Siri只能處理被說出來的文字,卻無法理解我們很多說話時的“潛臺詞”,比如高興時說“算了”,跟煩躁地說“算了”,在真實生活中表達的意圖可能完全相反。
多模融合的感知交互,通過圖像、視頻、語音、文字、手勢等多維度信息的整合,可以幫助構建起對現實世界更加完整、準確、連貫的認知,從而打破單一模態下的信息壁壘,讓AI能夠更好地理解用戶的真實意圖。
Siri給智能助手挖的“坑”,直到多模態的到來,才看到了被填平的希望。
超能進化,AI終一展“手腳”
今年秋季,海內外眾多手機廠商的新品發布中,都不約而同地選擇了將多模態能力,作為其內置智能助手的重要迭代方向。但多模態對于AI硬件的意義和價值,顯然不只在手機屏幕的方寸之間。
從可穿戴到智能家電,再到車載應用,多模態AI助手正在從手機延伸至更廣闊的硬件生態,升級為能主動感知、理解環境并無縫服務的生活協同者。業內亦有消息傳出,圍繞多模態的應用,蘋果也正在籌備AI眼鏡項目,可見自己挖的坑,早晚得填。
但動作的快慢,或許昭示著新一輪技術革命,誰有可能先一步站在潮頭。
2024年,小度就對其核心操作系統進行了“換腦”,基于大模型實現了底層的全面重構。除了能夠提升既有產品體驗的性能表現外,通過打造AI原生化的技術底座,小度真正想要做的,一方面是能夠契合大模型技術的飛速迭代,同時也讓后續基于此的AI創新,更快部署到所有產品中去。
簡單來說,多模態是智能硬件的“大腦”,終端設備是承載能力、釋放價值的“手腳”。
日前,小度對外正式宣布其全系全量全生態升級“超能小度”,即多模態AI智能助手。從大家所熟知的“小度小度”,到如今的多模態AI智能助手,超能小度感知交互能力的進階,首先便是在傳統設備上,實現了“從單點到全局、從被動到主動”的躍遷。
以家用攝像機為例,從最早只有監控畫面,到AI的加入,可以實現一些基礎的像哭聲檢測、人臉識別等功能。如今有了更深層次的視覺智能,顯然可以做得更多。
![]()
在小度智能攝像機新品的發布中,還提到了關于“智能尋物”的設想:當用戶問“我的遙控器放哪了”,攝像機會先環視和查看客廳當前的實時視頻畫面,如果沒有找到,便會自動回溯之前記錄的視頻畫面,告知用戶遙控器最后出現的位置、時間,并給出對應畫面,“有圖有真相”地幫其快速回憶起遙控器的消失經過。
當然,除了傳統設備認知范式的革新,超能小度的智能升維,也給AI眼鏡這種硬件“新物種”,催生了更多可能。
一類走的是功能增強路線。
比如“AI識物”、“AI翻譯”在準確率和響應速度上,都有顯著提升。即將上線的“AI會議紀要”功能,增加了“智能洞察”模式,能夠智能分析會議質量、多發言人意圖、潛在爭議點等,并能給出更深入的優化建議和指引。
另一類,通俗點說,則是打開了新“視界”。
眼鏡作為第一視角設備,天然有解放雙手的優勢,當拎著一堆東西,又想要記個停車位、物業通知等等,就可以直接自動拍照記錄并生成“AI備忘”,不僅隨時都能查,還支持日程提醒、撥打電話等進一步的需求滿足;還有跟網易云音樂聯合打造的“氛圍歌單”功能,可根據用戶眼前看到的畫面,直接播放個性化的應景歌單,無需掏出手機。
“?度從誕?之?起,始終追求的是?機交互的革命”,在發布現場,?度科技CEO李瑩這樣介紹道。愿景如此,實現了多模態進化的小度,也真正從只會單一、被動響應指令的“工具人”,蛻變成為能夠主動思考、決策和執行的“好伙伴”。
而且,值得一提的是,超能小度的此次升級“管新更管舊”,不僅將覆蓋其全系新品,更支持數千萬臺小度的已售設備進行免費升級。
如今看來,小度在2024年,基于大模型對其技術底座,進行AI原生操作系統的全面重構,確是在謀劃超能小度這步大棋。
當AI助手,跟我們一起走入生活
AI助手的多模態升級,顯然不是大模型時代智能硬件發展的終局。
今年,包括蘋果在內的很多國內外科技大廠,同樣也意識到了這點。
8月,小米澎湃OS 3.0版本升級,并重點打造了超級小愛的多模態交互能力。隨后,榮耀在全球開發者大會上,也宣布推出其全新的AI智能體操作系統MagicOS 10。近日更有消息指出,蘋果決定引入谷歌Gemini大模型,讓新版Siri更智能、功能更強,并支持多模態交互,后續還將在其iOS 27、macOS 27等操作系統中進一步整合。
“在AI時代,所有硬件設備都值得,也必將被AI重塑”,李瑩表示,“我們秉持充分開放的態度,將‘超能小度’的能力賦能給更多行業伙伴,共同為用戶創造更智能、便捷、人性化的體驗。”
![]()
據介紹,在推動自有產品升級的同時,超能小度還以智能引擎的方式,在智慧酒店、智慧養老、智能家電、智能汽車、AI玩具等行業,實現了全面的落地應用。而本次小度與海爾智家達成戰略合作,相信也會給AI時代全新的生活方式,帶來更大的想象空間。
或許只有像超能小度這樣,真正讓AI能夠“走出來”,進入到更多場景、更廣生態,從而跟更多人一起走入真實的生活,14年前的蘋果發布會上,Siri給人們畫下的那個大餅,才有可能真正落地。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關注我們!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.