金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
英特爾,真是越來(lái)越會(huì)玩了——
因?yàn)樗?strong>優(yōu)化CPU這件事的痛點(diǎn),直接搞得像送外賣(mài)似的:
![]()
△英特爾市場(chǎng)部同學(xué)友情出演
視頻地址:
https://mp.weixin.qq.com/s/chZie2A11mX75ixQvWOaWw
在這個(gè)有趣的視頻中,我們看到了“CPU的痛點(diǎn)”和“送外賣(mài)”之間的聯(lián)系:
- 外賣(mài)送錯(cuò):緩存未命中,送錯(cuò)了就白跑;
- 用“猜”的方式送餐:分支預(yù)測(cè)失敗,先猜一步,猜錯(cuò)就得重來(lái);
- 等餐超時(shí):前端阻塞,不是我慢,是前面環(huán)節(jié)沒(méi)跟上;
- 爬樓梯送餐:微架構(gòu)熱點(diǎn),不是沒(méi)路可走,是都堵在一條路上。
形象是歸形象,但,何以解“優(yōu)”?
芯片老玩家英特爾給出的,是自己發(fā)明的一項(xiàng)技術(shù)——二進(jìn)制優(yōu)化(IBOT)。
簡(jiǎn)單來(lái)說(shuō),IBOT采用了一種在內(nèi)存內(nèi)動(dòng)態(tài)優(yōu)化代碼的方式,動(dòng)態(tài)去掃描CPU程序的核心卡點(diǎn),然后通過(guò)指令替換的方式把那些產(chǎn)生卡點(diǎn)的指令替換成解決性能卡點(diǎn)的指令,從而提升整體性能。
更直觀一點(diǎn)的,用沒(méi)用IBOT的CPU,就像下面的俄羅斯方塊:
![]()
左邊是沒(méi)有經(jīng)過(guò)優(yōu)化的處理器的運(yùn)行情況,可以看到很多不規(guī)則的形狀堆砌起來(lái)之后產(chǎn)生很多的空隙區(qū),稱(chēng)之為“CPU運(yùn)行氣泡”,在每個(gè)氣泡中CPU其實(shí)在空轉(zhuǎn),不能產(chǎn)生實(shí)際運(yùn)行效果。
右邊就是重新碼整齊之后的俄羅斯方塊,它把很多氣泡擠了出來(lái),讓空隙區(qū)更少,CPU執(zhí)行效率會(huì)更高。
如此優(yōu)化,到底有什么直接的作用呢?
答案是,和你用筆記本打游戲,息息相關(guān)。
CPU升級(jí),還發(fā)了個(gè)AI高靜本Plus
除了IBOT在軟件層面上進(jìn)行優(yōu)化之外,這次英特爾在硬件上也有一個(gè)升級(jí)動(dòng)作——
英特爾? 酷睿? Ultra 200HX Plus。
![]()
在架構(gòu)層面上,本次200HX Plus重點(diǎn)強(qiáng)化Uncore游戲性能,通過(guò)提升晶粒間(D2D)頻率900MHz至3GHz,突破Arrow Lake多Chiplet架構(gòu)通信瓶頸。
這使得游戲平均幀率更高,1% Low幀率表現(xiàn)更穩(wěn)定,確保游戲畫(huà)面更絲滑、運(yùn)行更流暢。
![]()
而我們剛才提到的IBOT,以《永劫無(wú)間》為例,游戲性能直接提升了19%。
![]()
更直接的,英特爾基于架構(gòu)和軟件層面的優(yōu)化,讓游戲本的體驗(yàn)也更上了一層樓。
![]()
首先是性能方面,現(xiàn)在你的游戲本,即便開(kāi)啟的是高靜模式,游戲體驗(yàn)和性能也和開(kāi)啟狂暴模式無(wú)異。
在現(xiàn)場(chǎng),左右兩臺(tái)筆記本在玩《黑神話悟空》時(shí)體感幾乎看不出來(lái)差異的情況下,散熱發(fā)出的聲音完全是兩個(gè)level:
![]()
△左:高靜模式;右:狂暴模式。
視頻地址:
https://mp.weixin.qq.com/s/chZie2A11mX75ixQvWOaWw
在聽(tīng)感方面,AI高靜游戲本Plus的噪音標(biāo)準(zhǔn)進(jìn)一步壓低到43dB以下,讓游戲本在雜亂的環(huán)境下也能有很好的體驗(yàn)。
同樣是在現(xiàn)場(chǎng),英特爾便展示了43dB和50多dB情況下體感的差異,來(lái)感受一下這個(gè)feel:
![]()
視頻地址:
https://mp.weixin.qq.com/s/chZie2A11mX75ixQvWOaWw
除此之外,觸感也是影響游戲體驗(yàn)的一大關(guān)鍵,因?yàn)橛行┯螒虮就嬷嬷蜁?huì)出現(xiàn)鍵盤(pán)發(fā)燙的情況。
但在AI高靜游戲本Plus這里,掌托等核心接觸區(qū)溫度是可以長(zhǎng)時(shí)間控制在40°C以下的。
![]()
視頻地址:
https://mp.weixin.qq.com/s/chZie2A11mX75ixQvWOaWw
可以看到,紅外槍展示掃出來(lái)的核心接觸器,溫度都控制下來(lái)了;而45°C以上區(qū)域,甚至是可以把三文魚(yú)的表皮給熱熟的……
并且在續(xù)航方面,AI高靜游戲本Plus現(xiàn)在可以續(xù)航時(shí)間提升至7小時(shí)以上!
因此整體來(lái)看,通過(guò)從底層CPU架構(gòu)和軟件的優(yōu)化,英特爾已經(jīng)把游戲體驗(yàn)這事拔到了一個(gè)新高度。
英特爾DCG老大:Agentic AI讓CPU重回舞臺(tái)中央
英特爾除了在酷睿有新動(dòng)作之外,這幾天數(shù)據(jù)中心方面,亦是如此——
去年新上任的英特爾公司執(zhí)行副總裁兼數(shù)據(jù)中心事業(yè)部(DCG)總經(jīng)理,Kevork Kechichian(下文簡(jiǎn)稱(chēng)KK),來(lái)北京了!
![]()
△Kevork Kechichian
量子位有幸和KK,從Agentic AI、產(chǎn)品與路線、競(jìng)爭(zhēng)、生態(tài)、組織文化、供應(yīng)鏈等方面進(jìn)行了一場(chǎng)深度對(duì)話。
上任僅9個(gè)月,KK給出的英特爾數(shù)據(jù)中心轉(zhuǎn)型答案,和酷睿Ultra 200HX Plus的優(yōu)化邏輯如出一轍:擠掉算力氣泡,拒絕紙面參數(shù),用真實(shí)落地解決行業(yè)痛點(diǎn)。
Agentic AI時(shí)代,CPU正在強(qiáng)勢(shì)回歸
眼下大模型行業(yè)最火的概念莫過(guò)于Agentic AI。當(dāng)行業(yè)從單純的對(duì)話推理,走向需要Agent去真正執(zhí)行復(fù)雜任務(wù)、提升生產(chǎn)力時(shí),算力的需求結(jié)構(gòu)也發(fā)生了微妙的變化。
KK在交流中直言不諱地表示這對(duì)英特爾來(lái)說(shuō)是一個(gè)極其利好的轉(zhuǎn)變。
他指出,在早期的基礎(chǔ)模型推理中,CPU與GPU的占比很低。但隨著Agentic AI的爆發(fā),一個(gè)調(diào)度核心可能需要觸發(fā)成百上千個(gè)Agent,無(wú)論是串行還是并行處理,都需要強(qiáng)大的調(diào)度與編排能力,因此,CPU的使用率正在成倍激增。
KK還預(yù)測(cè)說(shuō):
我的預(yù)測(cè)是,未來(lái)CPU與GPU的比例將達(dá)到1:1。
在這種趨勢(shì)下,英特爾在數(shù)據(jù)中心領(lǐng)域積累了近三十年的企業(yè)級(jí)工作負(fù)載經(jīng)驗(yàn),瞬間成為了最核心的護(hù)城河。面對(duì)Agentic AI流水線,英特爾的思路非常明確:
針對(duì)小于1000億參數(shù)的模型,直接利用至強(qiáng)(Xeon)內(nèi)置的AMX等向量引擎就能高效搞定,根本不需要昂貴的獨(dú)立加速器;而對(duì)于更大規(guī)模的模型,英特爾也在積極規(guī)劃多層級(jí)的GPU和其他AI加速器產(chǎn)品線。
在這個(gè)過(guò)程中,英特爾吸取了過(guò)去“硬件很強(qiáng)但軟件難用”的教訓(xùn)。現(xiàn)在的首要任務(wù)是對(duì)開(kāi)發(fā)者絕對(duì)友好。不用再讓幾百個(gè)工程師花半年時(shí)間去適配框架,英特爾的底層庫(kù)已經(jīng)做好了準(zhǔn)備,讓算力的部署變得幾乎透明。
上任9個(gè)月的“殺伐果斷”
算力底座的邏輯理順了,但如何保證英特爾這頭大象能輕快起舞?這就要談到KK上任這9個(gè)月以來(lái)的硬核操作了。
當(dāng)我剛接手時(shí),團(tuán)隊(duì)告訴我有很多決策卡點(diǎn)。我的第一反應(yīng)是,這些爛攤子不能留。
KK的動(dòng)作堪稱(chēng)雷厲風(fēng)行。在上任不到60天的時(shí)間里,他直接砍掉了3個(gè)備受業(yè)界關(guān)注的平臺(tái)項(xiàng)目。原因很簡(jiǎn)單:
在研判了路線圖和競(jìng)爭(zhēng)力后,KK發(fā)現(xiàn)這些產(chǎn)品如果能提前6個(gè)季度發(fā)布會(huì)是好產(chǎn)品,但放在當(dāng)前的節(jié)點(diǎn),它們已經(jīng)失去了時(shí)間上的競(jìng)爭(zhēng)力。與其讓合作伙伴投入數(shù)億美元去陪跑一個(gè)沒(méi)有競(jìng)爭(zhēng)力的平臺(tái),不如快刀斬亂麻。
砍掉舊項(xiàng)目的同時(shí),KK對(duì)現(xiàn)有的路線圖按下了加速鍵,將下一代產(chǎn)品的進(jìn)度提前了1到2個(gè)季度。
同時(shí),他把目光死死盯住了優(yōu)化二字。
當(dāng)客戶(hù)反饋在競(jìng)品平臺(tái)上跑出的數(shù)據(jù)更好時(shí),KK立刻調(diào)動(dòng)軟件團(tuán)隊(duì),跑到客戶(hù)的真實(shí)業(yè)務(wù)環(huán)境里去做針對(duì)性?xún)?yōu)化。
不要總?cè)ッ枥L未來(lái),先把現(xiàn)有的解決方案優(yōu)化到極致,這是我們目前戰(zhàn)略的基石。
談競(jìng)爭(zhēng)與生態(tài)
如今的數(shù)據(jù)中心市場(chǎng)可謂群狼環(huán)伺,英偉達(dá)和Arm都在大舉進(jìn)軍CPU領(lǐng)域。面對(duì)多出來(lái)的競(jìng)爭(zhēng)對(duì)手,KK顯得非常從容,甚至覺(jué)得這是一種贊美。KK一針見(jiàn)血地指出:
大家都開(kāi)始做類(lèi)似至強(qiáng)的架構(gòu),說(shuō)明我們堅(jiān)持了三十年的方向是對(duì)的。
![]()
英特爾的核心優(yōu)勢(shì)在于幾十年積累的軟件層和基礎(chǔ)設(shè)施經(jīng)驗(yàn)。數(shù)據(jù)中心追求的是極限的穩(wěn)定性和正常運(yùn)行時(shí)間(Uptime),英特爾的系統(tǒng)是在成千上萬(wàn)個(gè)節(jié)點(diǎn)的真實(shí)業(yè)務(wù)數(shù)據(jù)中打磨出來(lái)的,而很多跨界的新玩家,目前還只能依賴(lài)于合成數(shù)據(jù)進(jìn)行測(cè)試。
在談及和谷歌的合作時(shí),KK也重申了這一點(diǎn):谷歌在TPU上取得了巨大成功,但他們依然選擇加深與英特爾的合作,定制化IPU,這本身就是對(duì)英特爾x86架構(gòu)作為數(shù)據(jù)中心基石地位的再次印證。
而在推理時(shí)代,芯片公司最深的護(hù)城河到底是什么?
KK給出的答案非常務(wù)實(shí):無(wú)縫部署的能力。
當(dāng)你建好數(shù)據(jù)中心,按下開(kāi)關(guān)的那一刻,客戶(hù)能不能立刻開(kāi)始產(chǎn)生效益?如果我有一個(gè)4000億參數(shù)的模型,換上新硬件后,能不能在24小時(shí)內(nèi)跑通所有優(yōu)化庫(kù)?這才是真正的護(hù)城河。
并且KK給整個(gè)生態(tài)吃下了一顆定心丸:“雖然我們?cè)谔峁┫到y(tǒng)級(jí)的解決方案,但英特爾永遠(yuǎn)不會(huì)與我們的客戶(hù)競(jìng)爭(zhēng)。這是底線。”
找回工程師文化
面對(duì)外界“英特爾需要重拾偉大工程師文化”的呼聲,本身就是技術(shù)背景出身的KK給出了他的三劑良藥:
- 頂層架構(gòu)師的視野:確保資深的技術(shù)大牛(Fellow和架構(gòu)師)來(lái)定義必須要做的事。
- 極度的緊迫感:產(chǎn)品不僅要在功能上對(duì)齊,在價(jià)格和上市時(shí)間上必須做到極致的“按時(shí)交付”。
- 消滅多任務(wù):這是KK帶來(lái)的最大改變之一。“沒(méi)有人能真正做到多任務(wù)處理,那只會(huì)浪費(fèi)時(shí)間和焦點(diǎn)。”現(xiàn)在,英特爾內(nèi)部的項(xiàng)目,都必須由一群“除了這個(gè)項(xiàng)目什么都不用想”的人來(lái)專(zhuān)職推進(jìn)。
KK在交流的最后坦言:
我可以坐在這里跟你聊上幾個(gè)小時(shí)的戰(zhàn)略和技術(shù),但真正的證明,只能是我們把產(chǎn)品實(shí)打?qū)嵉亟桓冻鰜?lái)。
正如英特爾內(nèi)部現(xiàn)在最明確的口號(hào):2026年,是交付之年(Year of Delivery)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.