去年9月底,我們三易生活在Intel Tech Tour(技術之旅)活動中,提前接觸到了英特爾的18A制程工藝,以及使用這一工藝的消費級和服務器CPU產品線。
![]()
不過那時候,由于相關芯片大多還處于測試階段,所以雖然“摸”到了實物,但實際得到的產品信息大多還是偏向架構、制程之類的理論值。
好在,英特爾方面顯然對他們新的消費級處理器信心十足。所以就在2026年剛開始,他們就在CES 2026(國際消費電子展)上,聯合一眾OEM廠商展出了大量基于第三代酷睿Ultra處理器的量產產品。僅僅幾天后,我們也得到了更詳細、基于量產產品和參考平臺的各種實測成績及細節信息。
![]()
當然,因為這些數據絕大多數其實已經在不久前結束的CES期間公布過,所以我們這次并不打算做簡單的數據“復述”,而是會從中挖掘出一些更細節,可能沒人注意到的信息。
跑分的微妙變化,其中卻藏著關鍵信息
如果大家有仔細看去年秋季揭曉的相關資料就會發現,英特爾在當時雖然已經給出了新架構與LunarLake、Arrowlake的性能對比數據,但在彼時的對比圖表里,一方面并未明確指出所用處理器的具體型號,另一方面所用的測試軟件也是對內存帶寬敏感的SPEC。這就不免“落下口實”,讓人容易以為英特爾是在有意制造數據差異。
![]()
但是在最新的官方數據中,英特爾已經“改正”了這些問題。一方面現在他們明確了參與對比的處理器分別是各架構的頂配型號,另一方面也將測試軟件換成了更偏實際應用,且對內存速度沒那么敏感的CINEBENCH 2024。
![]()
結果在看似“不利”的條件下,第三代酷睿Ultra(準確來說,是其頂配型號388H)相比LunarLake(288V)的同功耗多核性能,反而從此前的領先50%以上變成了領先超過60%。哪怕是對比“看起來”P核數量更多(6P+8E+2LPE)的ArrowLake(285H),新一代酷睿Ultra也快了10%。
![]()
那么這意味著什么呢?簡單來說,這就代表英特爾的E核、特別是LPE核在經過了數代的發展后,如今的IPC實際上已經越來越接近規模大得多的P核了。而且這還是在其P核、E核的峰值主頻,比前代都更低的前提下所取得的領先。
![]()
既然如此,未來我們會不會看到英特爾在消費級轉向“全小核”+“超多核”設計,或是像當年以發展型P6(酷睿)取代P7(奔騰4)路線那樣,用小核作為主導重新推出“單一架構”的新處理器呢?從目前的信息來看,這個可能性似乎變得越來越大了。
核顯進步超預期,更重要的是老產品也能獲利
除了CPU部分的進步比去年秋季公布的數據更進一步之外,英特爾在CES 2026上公布的核顯實測性能,也較去年剛披露時有了進一步的優化。
![]()
具體來說,擁有12核“Xe3”核心的ARC B390核顯,在45W TDP下的平均游戲性能,就已經可以比60W TDP的RTX4050獨顯高出至少10%。
![]()
請注意,這里有兩個細節。一是英特爾明確表示,消費者現在更喜歡看“游戲實測”、而不是“理論跑分”,所以他們更改了顯卡測試的呈現方式,不再強調3DMARK之類的跑分成績,而是直接用游戲實測數據說話。
第二點就在于,英特爾公布的這些數據,甚至還是在沒有開啟多幀生成的前提下測得,而這就是他們目前最有“底氣”之處。因為無論英偉達的RTX40系列、還是AMD的旗艦核顯(Radeon 8060s),都因為各種各樣的原因無緣使用各家最新的多幀生成功能。
![]()
相比之下,第三代酷睿Ultra處理器的核顯,反而成為了目前在這個級別里,唯一自帶多幀生成,甚至是支持XeSS3硬件4倍幀生成的方案。如果英特爾真的想要在游戲幀率上“作弊”,完全可以打開這個功能來做對比。但他們并沒有這么做。
![]()
此外我們還從英特爾方面了解到,ARC B390的4倍幀生成功能并非“獨占”,它同樣也會下放給英特爾過去的舊款核顯以及獨顯產品。具體來說,只要是MeteorLake或之后型號處理器的核顯,以及全系ARC獨顯,都將獲得這一新功能的加持。
很顯然,可以說英特爾這是看準了競爭對手目前產品線的弱點“有備而來”,但這又能怪誰呢?只能說英偉達和AMD在對于老產品的支持力度上,如今確實不如英特爾做得有誠意。
NPU算力相同、性能卻有差?英特爾揭露了真相
最后,來看看第三代酷睿Ultra處理器在AI方面的一些官方數據,以及我們從中挖掘出的有趣細節。
![]()
根據英特爾方面目前的說法,第三代酷睿Ultra最高可以提供180TOPs的“平臺算力”。其中120TOPs來自GPU,50TOPs源自NPU,剩下10TOPs則由CPU提供。
有看過我們三易生活此前一些相關內容的朋友可能還記得,對于絕大多數的PC來說,所謂“平臺算力”這個說法其實都算得上是“耍流氓”。因為在這些系統里,不同的部件往往并不能真正協同去計算一個AI項目。但英特爾是個例外,因為他們從一開始就有自家的異構應用接口(One API),只要應用程序支持,就可以發揮出處理器不同模塊的“算力”。
![]()
而且在第三代酷睿Ultra上,英特爾也格外強調了其AI引擎設計上的兩個細節。一是它的核顯與NPU都各自擁有獨立的矩陣計算單元,且各自都能訪問完整的系統內存池;二是它的CPU、GPU和NPU都支持INT8、FP16和FP32計算格式,因此才能確保真正的AI“異構融合”。很顯然,這也是瞄準了競品在硬件架構上的“硬傷”。
但英特爾在AI性能上曝光的“瓜”,還沒這么簡單。比如他們表示,大家都用NPU運行同樣大小的大語言模型,第三代酷睿Ultra的速度可以達到AMD銳龍AI9 HX370的4.3倍;而用NPU計算相同的FP32浮點項目,第三代酷睿Ultra的速度也有高通驍龍X Elite 84-100型的2.6倍速度。
![]()
這里我們我們提醒一下大家,第三代酷睿Ultra的NPU“理論算力”是50TOPs,而AMD和高通被被拿來對比的處理器,它們集成的NPU“理論算力”同樣也是50TOPs。為什么明明理論算力相同的NPU,實際測試的計算速度卻有好幾倍的差異呢?
![]()
這就不得不說到目前芯片行業在統計“算力”時經常耍的貓膩了,那就是大家普遍都只會用自家芯片“最擅長”的數據格式去聲稱算力水平。比如用低精度的INT4或FP6來統計算力,所以在遇到INT8或FP32的模型時,執行速度自然就會“縮水”數倍。
反之,當英特爾能夠拿出明明是相同“TOPs”值,實際跑起來卻要快上幾倍的AI成績時,似乎也表明他們的芯片架構設計,確實要更務實、更“實誠”些。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.