第三代酷睿Ultra跑分解析：英特爾還是太“老實”

2026-04-28 供應鏈管理智能手機榮耀小米科技手機行業

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

"multi_version":false去年9月底，我們三易生活在Intel Tech Tour（技術之旅）活動中，提前接觸到了英特爾的18A制程工藝，以及使用這一工藝的消費級和服務器CPU產品線。

不過那時候，由于相關芯片大多還處于測試階段，所以雖然“摸”到了實物，但實際得到的產品信息大多還是偏向架構、制程之類的理論值。
好在，英特爾方面顯然對他們新的消費級處理器信心十足。所以就在2026年剛開始，他們就在CES 2026（國際消費電子展）上，聯合一眾OEM廠商展出了大量基于第三代酷睿Ultra處理器的量產產品。僅僅幾天后，我們也得到了更詳細、基于量產產品和參考平臺的各種實測成績及細節信息。

當然，因為這些數據絕大多數其實已經在不久前結束的CES期間公布過，所以我們這次并不打算做簡單的數據“復述” ，而是會從中挖掘出一些更細節，可能沒人注意到的信息。
跑分的微妙變化，其中卻藏著關鍵信息
如果大家有仔細看去年秋季揭曉的相關資料就會發現，英特爾在當時雖然已經給出了新架構與LunarLake、Arrowlake的性能對比數據，但在彼時的對比圖表里，一方面并未明確指出所用處理器的具體型號，另一方面所用的測試軟件也是對內存帶寬敏感的SPEC 。這就不免“落下口實” ，讓人容易以為英特爾是在有意制造數據差異。

但是在最新的官方數據中，英特爾已經“改正”了這些問題。一方面現在他們明確了參與對比的處理器分別是各架構的頂配型號，另一方面也將測試軟件換成了更偏實際應用，且對內存速度沒那么敏感的CINEBENCH 2024 。

結果在看似“不利”的條件下，第三代酷睿Ultra（準確來說，是其頂配型號388H）相比LunarLake（288V）的同功耗多核性能，反而從此前的領先50%以上變成了領先超過60% 。哪怕是對比“看起來”P核數量更多（6P+8E+2LPE）的ArrowLake（285H），新一代酷睿Ultra也快了10% 。

那么這意味著什么呢？簡單來說，這就代表英特爾的E核、特別是LPE核在經過了數代的發展后，如今的IPC實際上已經越來越接近規模大得多的P核了。而且這還是在其P核、E核的峰值主頻，比前代都更低的前提下所取得的領先。

既然如此，未來我們會不會看到英特爾在消費級轉向“全小核”+“超多核”設計，或是像當年以發展型P6（酷睿）取代P7（奔騰4）路線那樣，用小核作為主導重新推出“單一架構”的新處理器呢？從目前的信息來看，這個可能性似乎變得越來越大了。
核顯進步超預期，更重要的是老產品也能獲利
除了CPU部分的進步比去年秋季公布的數據更進一步之外，英特爾在CES 2026上公布的核顯實測性能，也較去年剛披露時有了進一步的優化。

具體來說，擁有12核“Xe3”核心的ARC B390核顯，在45W TDP下的平均游戲性能，就已經可以比60W TDP的RTX4050獨顯高出至少10% 。

請注意，這里有兩個細節。一是英特爾明確表示，消費者現在更喜歡看“游戲實測”、而不是“理論跑分” ，所以他們更改了顯卡測試的呈現方式，不再強調3DMARK之類的跑分成績，而是直接用游戲實測數據說話。
第二點就在于，英特爾公布的這些數據，甚至還是在沒有開啟多幀生成的前提下測得，而這就是他們目前最有“底氣”之處。因為無論英偉達的RTX40系列、還是AMD的旗艦核顯（Radeon 8060s），都因為各種各樣的原因無緣使用各家最新的多幀生成功能。

相比之下，第三代酷睿Ultra處理器的核顯，反而成為了目前在這個級別里，唯一自帶多幀生成，甚至是支持XeSS3硬件4倍幀生成的方案。如果英特爾真的想要在游戲幀率上“作弊” ，完全可以打開這個功能來做對比。但他們并沒有這么做。

此外我們還從英特爾方面了解到， ARC B390的4倍幀生成功能并非“獨占” ，它同樣也會下放給英特爾過去的舊款核顯以及獨顯產品。具體來說，只要是MeteorLake或之后型號處理器的核顯，以及全系ARC獨顯，都將獲得這一新功能的加持。
很顯然，可以說英特爾這是看準了競爭對手目前產品線的弱點“有備而來” ，但這又能怪誰呢？只能說英偉達和AMD在對于老產品的支持力度上，如今確實不如英特爾做得有誠意。
NPU算力相同、性能卻有差？英特爾揭露了真相
最后，來看看第三代酷睿Ultra處理器在AI方面的一些官方數據，以及我們從中挖掘出的有趣細節。

根據英特爾方面目前的說法，第三代酷睿Ultra最高可以提供180TOPs的“平臺算力” 。其中120TOPs來自GPU ， 50TOPs源自NPU ，剩下10TOPs則由CPU提供。
有看過我們三易生活此前一些相關內容的朋友可能還記得，對于絕大多數的PC來說，所謂“平臺算力”這個說法其實都算得上是“耍流氓” 。因為在這些系統里，不同的部件往往并不能真正協同去計算一個AI項目。但英特爾是個例外，因為他們從一開始就有自家的異構應用接口（One API），只要應用程序支持，就可以發揮出處理器不同模塊的“算力” 。
【第三代酷睿Ultra跑分解析：英特爾還是太“老實”】
而且在第三代酷睿Ultra上，英特爾也格外強調了其AI引擎設計上的兩個細節。一是它的核顯與NPU都各自擁有獨立的矩陣計算單元，且各自都能訪問完整的系統內存池；二是它的CPU、GPU和NPU都支持INT8、FP16和FP32計算格式，因此才能確保真正的AI“異構融合” 。很顯然，這也是瞄準了競品在硬件架構上的“硬傷” 。
但英特爾在AI性能上曝光的“瓜” ，還沒這么簡單。比如他們表示，大家都

用NPU運行同樣大小的大語言模型，第三代酷睿Ultra的速度可以達到AMD銳龍AI9 HX370的4.3倍；而用NPU計算相同的FP32浮點項目，第三代酷睿Ultra的速度也有高通驍龍X Elite 84-100型的2.6倍速度。

這里我們我們提醒一下大家，第三代酷睿Ultra的NPU“理論算力”是50TOPs ，而AMD和高通被被拿來對比的處理器，它們集成的NPU“理論算力”同樣也是50TOPs 。為什么明明理論算力相同的NPU ，實際測試的計算速度卻有好幾倍的差異呢？

這就不得不說到目前芯片行業在統計“算力”時經常耍的貓膩了，那就是大家普遍都只會用自家芯片“最擅長”的數據格式去聲稱算力水平。比如用低精度的INT4或FP6來統計算力，所以在遇到INT8或FP32的模型時，執行速度自然就會“縮水”數倍。
反之，當英特爾能夠拿出明明是相同“TOPs”值，實際跑起來卻要快上幾倍的AI成績時，似乎也表明他們的芯片架構設計，確實要更務實、更“實誠”些。

推薦閱讀

上一篇：2025年手機行業，誰在高端路上“撲街”，誰在AI里“修仙”？

下一篇：買拍照手機？記住這三樣，2億像素本質確實沒啥用！