陳慶春/文
![]()
圖片由 Gemini Nano Banana Pro 生成
OpenAI成立的初衷,是奧爾特曼與馬斯克達成的一致:讓全世界人民平等地享受AI帶來的福利。幾乎有理想的公司,發展AI的初衷都是如此。
但他們漸漸發現,一個文本對話框,已經無法全面體現AI 的能力,更無法讓AI觸達所有人。AI 需要一個身體,自己走到全世界人民面前。不一定是人形機器人,可以是各種形態的AI 端側產品,比如手機、PC、平板、眼鏡,也可能是另一種我們現在還無法想象的全新形態。
在OpenAI發布ChatGPT的當年,奧爾特曼便開始著手設計適合生成式AI的端側產品,直到今年5 月,他不惜花費65億美元,正式收購了Jony Ive 創辦的硬件公司io Products。因為,AI 需要一個身體,乃至數個分身的需求,越來越迫切。
![]()
這封信發布于 OpenAI 官網,左為 John,右為奧爾特曼。
當大語言模型飛速迭代時,這種焦慮感就顯得越發的沉重。究竟該如何快速地將頂級聰明的AI帶給每一個人?
就在剛剛結束的一周,Meta、谷歌、微軟、亞馬遜、阿里巴巴、百度紛紛發布今年7-9 月份的第三季度財報,出人意外的是,如同OpenAI一樣,端側產品、AI硬件產品卻成為他們重要的披露對象,以及志在必得的業務領域。
這不是簡單的“大家都想賣設備”,而是整個科技行業正在發生一次終端范式的大遷移。是繼大語言模型入口之后,大公司對于AI時代“入口權”的升維決斗。
在這場新的決斗中,已經掌握了大規模硬件產品的企業,比如聯想集團、蘋果公司、三星,更有優勢,還是掌握了基礎大模型和系統入口的企業,更有優勢?
AI需要一個身體
一提到“入口權”,在互聯網時代,我們很自然地想到了PC,想到了聯想、惠普、戴爾;在移動時代,則是蘋果、三星、華為、小米。所有希望觸達用戶的任何能力(軟件),只能依賴這些終端表層接入。蘋果手機的過路費避之不及、逃之不掉,無時不刻不在提醒這個時代有一個入口,是蘋果。
但生成式AI(GenAI)時代,入口發生了根本性變化,一個顯著的特點是:我們可能不再需要App,而需要一個“隨時隨地可交互的智能體”。它就像你的分身,你的AI雙胞胎,擁有你的記憶、思想以及超出你的智力。這個智能體像你一樣,需要一個“物理身體”,必須能接觸物理世界。
如果AI只在云端:看不到你、聽不到你、理解不了上下文、無法控制真實設備,不是你的AI分身、智能體,只是云端客服。如果AI借助硬件:理解你周圍的物理世界、觀察你正在做什么、實時幫你處理信息、代你執行設備操作& 家庭設備操作、主動發現你需要什么。
那么,硬件就等于,智能體的“眼睛、耳朵、手腳以及存在方式”,其中涉及:麥克風(語音)、攝像頭(視覺)、屏幕(反饋)、傳感器(環境)、本地運行(隱私+ 低延遲)、常時在線(隨時叫隨時回應)。
誰控制硬件,誰控制這個智能體。才能實現所有大公司所設定的愿景:通過智能體及智能硬件,讓AI 平等地惠及每一個人。
這種轉變正在發生。中美科技巨頭,已經將手伸向了智能硬件。
在美國,OpenAI想創造一個全新的AI 類別終端,弱化屏幕、強化“環境感知+對話”;Amazon把“家”當成一個巨大“AI 機體”:音箱、中控屏、攝像頭、門鎖、機器人全部接Alexa+,同時手機優先,Pixel手機打造成“AI-first smartphone”,再把同樣的Gemini 能力向筆記本、XR 擴散;微軟希望讓PC再活一輪:“不是換一臺電腦,是換一類電腦(Copilot+ PC)”,聯想的AI PC是它綁定的最大合作伙伴;Meta押注“眼鏡+頭顯”路線,扎克伯格認為“長遠來看,大家會帶AI 眼鏡,而不是掏手機”。
在中國,阿里巴巴是最先在C端形成軟硬通吃戰略布局的互聯網大佬,夸克眼鏡是它的智能硬件觸手,最近又將“通義APP”改成“千問APP”,對標ChatGPT,整合阿里旗下電商、物流等資源,一并裝入硬件,形成統一入口;百度也已在智能眼鏡、自動駕駛汽車等關鍵智能硬件上做了布局;本就是PC全球大佬的聯想集團,更是早兩年前就邁出了AI PC的步伐,目前AI PC在個人電腦總出貨量中的占比已經超過30%,在全球Windows AI PC 市場穩居第一,其在中國市場發布的“天禧個人超級智能體”,平均周活躍度已達到40%。
當然,這只是開始,撬開時代大門的一個支點。但為什么是現在?
因為端側算力效率出現了革命性突破。如果把時間撥回3 年前:
本地設備算力跑不動大模型
能跑模型的
GPU
重達幾十公斤
手機只具備一點點弱
AI
推理能力
環境理解、長時記憶根本不可能本地完成
那時候,AI硬件設備是偽命題。但2023–2025年出現了三大突破,讓“AI硬件設備”成為現實:
突破1:大模型從百億參數→ 0.5–20B 端側可跑的架構,輕量大語言模型和多模態Nano 模型紛紛出現,比如,Gemini Nano、Meta Llama 3.2 3B/11B、Qwen1.5 系列、Qwen3 系列以及OpenAI 曝出的On-device 模型計劃,等等。這些模型可以在10–40 TOPS 的NPU 上流暢運行,讓多模態能力(圖像理解、語音、OCR)能端側化,這意味著手機、PC、眼鏡可以做以前必須云端做的事。
突破2:NPU/ AI加速器性能暴漲,約10倍級提升,2023年到2025年NPU增長速度堪比當年“GPU 起飛”。 而且功耗極低,幾瓦就能運行模型。比如高通X Elite 45 TOPS,蘋果M4 38 TOPS,Google Tensor G4 30+ TOPS,AMD超50 TOPS,英特爾Lunar Lake 48 TOPS。這說明,AI不是云獨占資源,已經“掉到”終端設備的芯片里了。
突破3:設備開始具備“持續感知”能力(實時攝像頭+ 麥克風+ 傳感器)。PC、手機、眼鏡、耳機正在變成:無縫拾取語音,實時看到你看到的,理解環境,記住你的行為、偏好、歷史,主動提醒、主動執行任務。設備第一次變成了“智能體容器”而不是“計算工具”。這就徹底改變了硬件的戰略地位。
![]()
因此,此時此刻的當下,AI需要一個“身體”,也具備了擁有一個身體的條件,它可以控制硬件的方式走向這個廣闊無垠的物理世界。那么,誰提供這個身體,誰就控制未來的入口。誰控制硬件,誰就控制了智能體。
一端還是多端?AI需要無數分身?
未來會不會出現一臺AI超級終端,它像互聯網時代的PC、移動時代的手機一樣,幾乎掌管整個時代?答案可能是否定的。
AI的未來不是一臺超級終端,而是一個分布式的智能體系統。AI 若只依賴一種設備,就注定不能成為“生活級智能體”。這不是技術問題,而是人類行為決定的。
首先,人的生活天然是“多場景的”,人類每天的活動跨越:移動、工作、家庭、社交、休息。這些場景對“交互方式”的需求完全不同:在車里,聲音與大屏最自然在戶外,眼鏡比手機更自然;在家,音箱比手機更自然;在工作區,PC 比手機更高效;在運動時,耳機比手機更自然。單一設備無法覆蓋人類所有生活場景。
其次,AI的本質是理解世界,而不是停在屏幕里——這決定了必須“多傳感器、多終端”。沒有任何單一設備能同時承擔:低功耗監聽,第一視角視覺,大屏處理,生理感知,家庭環境理解,運動中自然交互,駕駛場景交互。AI想“讀懂你的一天”,必須依賴多個設備分布式地感知你。
讓AI理解世界,每個設備必須承擔不同能力:
手機:主賬號
輸入輸出中心
眼鏡:第一視角視覺
耳機:低打擾語音入口
PC
:需要復雜操作的工作場景
家庭設備:環境信息、持久感知
可穿戴:生理與狀態感知
這些分工與人類神經結構極其相似:不是一個器官負責全部,而是多器官協同。最自然的AI必須“融入場景,而不是集中在一臺設備上”。
![]()
圖片由微信公眾號“AI 配圖”生成
第三,還要考慮能耗、散熱以及安全等細節問題。單設備無法解決能耗與散熱問題, AI 長時運行必須多終端分擔。 AI 的耗能結構決定它必須分散到不同設備上,而不是強塞到一臺里。
在隱私與安全方面:敏感任務必須端側分布執行,而不是集中在一個設備里。沒有人愿意把所有敏感數據集中在一臺設備里處理。
傳統交互,是“人找設備”。AI 交互,是“設備找人”。把所有AI 功能放進手機,是舊時代互聯網的思維(App 邏輯)。智能體時代的思維是“場景驅動”,不是“設備驅動”。
基于這個邏輯,OpenAI 創始人奧爾特曼正在重新思考AI 時代的硬件。OpenAI 在官宣收購oi 公司的時候,這樣說到:“現在,計算機能夠看見、思考和理解。盡管擁有這種前所未有的能力,我們的體驗仍然受傳統產品和界面的影響。”
奧爾特曼自己的判斷是:“使用技術的含義可能會發生深刻的變化。我希望我們能帶來一些30 年前我初次使用蘋果電腦時感受到的喜悅、奇跡和創造性精神。”
很巧合的是,就在奧爾特曼官宣之后不久。聯想集團董事長、CEO 楊元慶也發了一封神情急切的內部信,內部人士稱,“元慶(聯想內部都是直接稱呼名字)特別擔心高管們不能理解混合式人工智能戰略。”但在外部人士看來,他更擔心錯過這個理應屬于硬件廠家的最大時代機會。
這封內部信是這樣說的:
“我們不應該滿足于僅僅是單一設備(例如
AI PC
)、單一應用(例如服務機器人),甚至是單一生態(例如
Copilot
Gemini
)這樣的智能,盡管它們都是我們通向個性化混合式人工智能的重要一部分,也可以說是重要的路徑,比如
AI PC
現在能做到文生文、文生圖,能夠解決智能化的操作等等(例如智能控制、寫作等等),
Copilot
也可以在它的
PC
生態甚至手機生態里做一些智能化的交互和應用,但這些東西都不應該是全部。我們既不能被一些假象迷惑而滿足于此,比如認為
Copilot
就是個人智能,認為
AI PC
就是個人智能,更不能因為要向更高的高峰前行艱難而止步于此。
所以我們所向往的是,以人和企業為中心的智能,也就是所有的設備、應用、操作系統、生態都是服務于這個中心的,或者說
AI
是構筑于所有這些要素之上的,與人和企業更加息息相關的虛擬的存在,彷如你的替身、你的
twin
(人工智能雙胞胎)。它甚至要求跨設備、跨應用、跨操作系統
生態的能力,和基于這樣能力所形成的更多的原生應用方式,比如智能體。”
楊元慶急切的心情,真的是躍然紙上。可能你會覺得,將楊元慶與奧爾特曼放在一起,有種時代的錯覺。但這個時代就是這樣,給予了他們同樣的硬件機會。
![]()
聯想集團董事長兼CEO楊元慶在2025聯想創投CEO年會上分享下個 10 年的戰略愿景
很多人猜測,OpenAI計劃制造一個“超級終端”,但卻遭遇一系列問題,單個終端算力問題、隱私問題、能耗問題,導致這個“超級終端”面試的時間一拖再拖。再加上,先前Humane的AI Pin、Rabbit 的r1產品,都試圖用一個“超級終端”顛覆硬件產品,卻已紛紛失敗。奧爾特曼或許也應該像他自己所說的,要轉變思路。
一個很明顯的事實:AI 不會取代設備,而是讓所有設備“變成你的智能體身體”。未來的AI不是靠某一臺超級終端,而是依靠你身邊所有設備共同組成“數字身體”。未來不是“AI手機統治世界”。
未來是:一個云端大腦+ 多端小腦+ 多端傳感器+ 多端交互器官,共同組成你的AI智能體。誰能把這套系統打包好、協調好、體驗無縫,誰就贏下下一代科技平臺。
大廠角逐“AI多端”,誰的贏面大?
手機、眼鏡、家、車、機器人等等智能硬件,如何連成統一的智能體體驗?
聯想楊元慶的答案是,以人為核心,跨設備、跨應用、跨操作系統/生態地建立個人智能體,即所謂的“一體多端”戰略。這個智能體,聯想在中國稱之為“天禧超級智能體”,在中國之外稱之為“AI Now” 。谷歌稱之為“Alexa+”。小米要建的“人車家”生態,也與該邏輯一致。
![]()
他們共同的特點就是要給分散在各終端硬件的智能體,建立一個智能體網絡,將多個硬件拼湊出一個“AI人”的完整體驗。
可以簡單做個比喻,超級智能體相當于一個人的AI 雙胞胎,也就是AI 化的“人”,而分散在各個智能硬件中的個人智能體,相當于這個“AI人”的無數個分身。超級智能體就負責控制、連接、調度這些硬件分身,這整個過程都要基于云端算力、端側硬件算力、大模型算法以及連接協議來進行,也可以統稱為智能體網絡。
從技術落地來看,要做好完整的智能體體驗,至少需要這樣幾個關鍵技術:1、“云端大腦+ 端側小腦”的調度系統;2、跨設備任務接力和會話連續性;3、端側算力基礎,要多終端協同,每臺設備要有自理能力;4、安全、權限與隱私框架;5、開發者API和跨設備SDK;6、最后,要統一身份和設備圖譜,同一個賬號下,系統要知道:你有哪些設備、現在在線的是哪幾臺、彼此離多遠。
基于以上的技術框架,再來看大廠這次在“AI 多端”的角逐,輸贏便可一目了然了。
首選,是否有能力完成多端算力和云端算力,以及公共大模型、端側個人大模型的調度?也就是,什么時候在本地跑AI、什么時候丟給云端大模型,而且要讓所有設備看到同一份“人格”和記憶。這一層,本質是在做“一個人格,多設備入口”的調度。
這屬于最頂層的設計,就需要建立一個混合式人工智能架構。一來完成調度,二來保證隱私安全、可信計算。對于大廠來說,這幾乎不是難事,谷歌、Meta、OpenAI、阿里巴巴、聯想集團等等都是混合式人工智能架構。(詳情可以參見我之前的一篇文章:)
其次,覆蓋場景越多,多端計算及協同能力越強,贏面是否越大?如前所述,AI需要多個硬件理解物理世界,智能體時代的思維是 “場景驅動”。只有多場景,AI 拿到的數據才是完整的,才能剔除幻覺,獲得更精準的答案。
在全球范圍內,能同時覆蓋PC + 手機+ 平板+ XR的,其實只剩:Apple、三星、Google(理論可行但手機太弱)和聯想(全球出貨規模能和三星比肩)。這里不得不重點提到,聯想具備天然的“多端生態圖譜”基礎。這是許多AI 創業公司、甚至傳統互聯網公司都不具備的。
多場景終端覆蓋,很考驗一個企業的硬件制造能力。中國制造顯然更具優勢。聯想集團堅持以“中國+n”的模式打造全球供應鏈的能力,如今看來,變成了這個時代的最大紅利。目前,聯想是全球最完整的“多端硬件生產商”之一。聯想的硬件矩陣,比一般人想象得更寬:
AI PC
ThinkPad
Yoga
Legion
手機(
Motorola
平板(
Tab
系列)
可穿戴(
Moto Watch
VR/AR
(聯想
ThinkReality
系列)
家庭
IoT
更值得關注的是2B的端側能力。我們大多數人都是企業人,在企業工作基本需要專用的PC、會議設備、工作站、顯示大屏、移動辦公平板等等。只有將這些都連接起來,才是一個完整的“AI人”的軌跡和數據畫像。
所以,那些具備B端硬件能力的大廠,可能更有優勢。這里又要提到聯想集團,商用與行業級多端協同,是聯想的真正“護城河”。聯想Think 系列是全球第一大商用PC 品牌;大量企業采用聯想會議室解決方案、邊緣計算產品、工作站產品;聯想有自己的Lenovo Device Intelligence(LDI)和企業級設備管理平臺。聯想商用PC的占比一直高居50% 左右。
無論是2C還是2B,做大規模,都需要將端側硬件體驗做到極致,并擁有很強的供應鏈和渠道壁壘。一個反例是:谷歌,做硬件近10年,依然無法把硬件規模做上去,Pixel 是“工程師做的理想手機”,但谷歌不是一個“賣硬件的公司”。Pixel 就算再好,也只能引領風向而不是吃市場。供應鏈、質控、維修體系都與聯想這樣的規模的制造商比起來,差距巨大。
但并不意味著谷歌做不好AI 硬件,今年Pixel 10 系列手機的市場反響就很好。谷歌還有專屬的Tensor 芯片、強大的Gemini基礎大模型、系統定義權,以及非常完備的終端產品線,包括:Nest 系列智能家居設備、平板電腦、電視、無線耳機、AI眼鏡,等等。聯想集團要在世界范圍內與谷歌對壘,其制造供應鏈的優勢能有多大勝算,其實不好說。
![]()
再比如亞馬遜,在大模型時代,看似很低調,但實際上野心更大。今年亞馬遜用大模型全面升級了Echo系列以及Ring、Blink、Eero安防監控系列,和Astro家用機器人,并發布了新一代Alexa+,是基于大模型的新Alexa,強調更自然的對話、多步任務和個性化記憶。更重要的是,經過多年積累,亞馬遜已經擁有幾億臺Alexa設備裝機量,只要Alexa+的體驗夠好,它的AI 硬件升級幾乎是“順滑升級”,門檻比OpenAI那種新物種要低得多,成功概率相對高。
按照楊元慶的戰略規劃及愿景,聯想集團未來真正的對手不是三星、蘋果、華為,反而恰恰就是亞馬遜、谷歌,這些軟硬通吃的生態型企業。這是聯想的機會,也是聯想的挑戰。我們當然希望中國企業能贏。
最后,大廠角逐“多終端”,是否擁有跨系統、跨端、跨陣營的開放開源能力?在移動時代,蘋果很輕松地用手機、PC、平板、手表就實現了閉環體驗,但在大模型時代,這幾個端已無法滿足個體AI的個性化需求。所以,擁有完整體驗的個體AI,必須跨系統、跨端、跨陣營的開放開源。
曾經被稱為大雜燴的聯想,反而此時有了優勢。目前,聯想的Smart Connect技術,可以輕松跨平臺,如:Windows(主力PC)、Android(平板、手機)、ChromeOS(海外教育市場)、AR/VR 自有方案、IoT 設備。聯想能夠天然占據Windows + Android 的跨系統多終端協同主場。這是Apple 和Google 都無法替代的角色。
這種優勢已經體現在聯想集團的最新財報中:其一,在AI驅動下,整體營收和利潤仍保持雙位數同比增長,特別是凈利潤同比增長25%;其二,AI終端設備營收,在聯想整個的智能硬件業務(IDG)營收中的占比大幅提升至36%,同比提升17個百分點,已成為最具結構性意義的增長引擎之一。AI PC 更是改寫了全球PC增長停滯的大局面,也令聯想PC全球市場份額首次突破25%,領先第二名5.7個百分點,市場支配力繼續擴大。
![]()
每個時代都有每個時代的企業。未來10年,聯想將是PC入口、企業入口、多端協同中樞入口的強勁競爭者之一。(全文結束)
附:八大巨頭 AI 硬件戰略大比拼
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.