第三代酷睿Ultra跑分解析:英特爾還是太“老實”

第三代酷睿Ultra跑分解析:英特爾還是太“老實”

文章圖片

第三代酷睿Ultra跑分解析:英特爾還是太“老實”

文章圖片

第三代酷睿Ultra跑分解析:英特爾還是太“老實”

文章圖片

第三代酷睿Ultra跑分解析:英特爾還是太“老實”

文章圖片

第三代酷睿Ultra跑分解析:英特爾還是太“老實”

文章圖片

第三代酷睿Ultra跑分解析:英特爾還是太“老實”

文章圖片

第三代酷睿Ultra跑分解析:英特爾還是太“老實”

文章圖片

"multi_version":false去年9月底 , 我們三易生活在Intel Tech Tour(技術之旅)活動中 , 提前接觸到了英特爾的18A制程工藝 , 以及使用這一工藝的消費級和服務器CPU產品線 。

不過那時候 , 由于相關芯片大多還處于測試階段 , 所以雖然“摸”到了實物 , 但實際得到的產品信息大多還是偏向架構、制程之類的理論值 。
好在 , 英特爾方面顯然對他們新的消費級處理器信心十足 。 所以就在2026年剛開始 , 他們就在CES 2026(國際消費電子展)上 , 聯合一眾OEM廠商展出了大量基于第三代酷睿Ultra處理器的量產產品 。 僅僅幾天后 , 我們也得到了更詳細、基于量產產品和參考平臺的各種實測成績及細節信息 。

當然 , 因為這些數據絕大多數其實已經在不久前結束的CES期間公布過 , 所以我們這次并不打算做簡單的數據“復述” , 而是會從中挖掘出一些更細節 , 可能沒人注意到的信息 。
跑分的微妙變化 , 其中卻藏著關鍵信息
如果大家有仔細看去年秋季揭曉的相關資料就會發現 , 英特爾在當時雖然已經給出了新架構與LunarLake、Arrowlake的性能對比數據 , 但在彼時的對比圖表里 , 一方面并未明確指出所用處理器的具體型號 , 另一方面所用的測試軟件也是對內存帶寬敏感的SPEC 。 這就不免“落下口實” , 讓人容易以為英特爾是在有意制造數據差異 。

但是在最新的官方數據中 , 英特爾已經“改正”了這些問題 。 一方面現在他們明確了參與對比的處理器分別是各架構的頂配型號 , 另一方面也將測試軟件換成了更偏實際應用 , 且對內存速度沒那么敏感的CINEBENCH 2024 。

結果在看似“不利”的條件下 , 第三代酷睿Ultra(準確來說 , 是其頂配型號388H)相比LunarLake(288V)的同功耗多核性能 , 反而從此前的領先50%以上變成了領先超過60% 。 哪怕是對比“看起來”P核數量更多(6P+8E+2LPE)的ArrowLake(285H) , 新一代酷睿Ultra也快了10% 。

那么這意味著什么呢?簡單來說 , 這就代表英特爾的E核、特別是LPE核在經過了數代的發展后 , 如今的IPC實際上已經越來越接近規模大得多的P核了 。 而且這還是在其P核、E核的峰值主頻 , 比前代都更低的前提下所取得的領先 。

既然如此 , 未來我們會不會看到英特爾在消費級轉向“全小核”+“超多核”設計 , 或是像當年以發展型P6(酷睿)取代P7(奔騰4)路線那樣 , 用小核作為主導重新推出“單一架構”的新處理器呢?從目前的信息來看 , 這個可能性似乎變得越來越大了 。
核顯進步超預期 , 更重要的是老產品也能獲利
除了CPU部分的進步比去年秋季公布的數據更進一步之外 , 英特爾在CES 2026上公布的核顯實測性能 , 也較去年剛披露時有了進一步的優化 。

具體來說 , 擁有12核“Xe3”核心的ARC B390核顯 , 在45W TDP下的平均游戲性能 , 就已經可以比60W TDP的RTX4050獨顯高出至少10% 。



請注意 , 這里有兩個細節 。 一是英特爾明確表示 , 消費者現在更喜歡看“游戲實測”、而不是“理論跑分” , 所以他們更改了顯卡測試的呈現方式 , 不再強調3DMARK之類的跑分成績 , 而是直接用游戲實測數據說話 。
第二點就在于 , 英特爾公布的這些數據 , 甚至還是在沒有開啟多幀生成的前提下測得 , 而這就是他們目前最有“底氣”之處 。 因為無論英偉達的RTX40系列、還是AMD的旗艦核顯(Radeon 8060s) , 都因為各種各樣的原因無緣使用各家最新的多幀生成功能 。



相比之下 , 第三代酷睿Ultra處理器的核顯 , 反而成為了目前在這個級別里 , 唯一自帶多幀生成 , 甚至是支持XeSS3硬件4倍幀生成的方案 。 如果英特爾真的想要在游戲幀率上“作弊” , 完全可以打開這個功能來做對比 。 但他們并沒有這么做 。

此外我們還從英特爾方面了解到 , ARC B390的4倍幀生成功能并非“獨占” , 它同樣也會下放給英特爾過去的舊款核顯以及獨顯產品 。 具體來說 , 只要是MeteorLake或之后型號處理器的核顯 , 以及全系ARC獨顯 , 都將獲得這一新功能的加持 。
很顯然 , 可以說英特爾這是看準了競爭對手目前產品線的弱點“有備而來” , 但這又能怪誰呢?只能說英偉達和AMD在對于老產品的支持力度上 , 如今確實不如英特爾做得有誠意 。
NPU算力相同、性能卻有差?英特爾揭露了真相
最后 , 來看看第三代酷睿Ultra處理器在AI方面的一些官方數據 , 以及我們從中挖掘出的有趣細節 。

根據英特爾方面目前的說法 , 第三代酷睿Ultra最高可以提供180TOPs的“平臺算力” 。 其中120TOPs來自GPU , 50TOPs源自NPU , 剩下10TOPs則由CPU提供 。
有看過我們三易生活此前一些相關內容的朋友可能還記得 , 對于絕大多數的PC來說 , 所謂“平臺算力”這個說法其實都算得上是“耍流氓” 。 因為在這些系統里 , 不同的部件往往并不能真正協同去計算一個AI項目 。 但英特爾是個例外 , 因為他們從一開始就有自家的異構應用接口(One API) , 只要應用程序支持 , 就可以發揮出處理器不同模塊的“算力” 。
【第三代酷睿Ultra跑分解析:英特爾還是太“老實”】
而且在第三代酷睿Ultra上 , 英特爾也格外強調了其AI引擎設計上的兩個細節 。 一是它的核顯與NPU都各自擁有獨立的矩陣計算單元 , 且各自都能訪問完整的系統內存池;二是它的CPU、GPU和NPU都支持INT8、FP16和FP32計算格式 , 因此才能確保真正的AI“異構融合” 。 很顯然 , 這也是瞄準了競品在硬件架構上的“硬傷” 。
但英特爾在AI性能上曝光的“瓜” , 還沒這么簡單 。 比如他們表示 , 大家都

用NPU運行同樣大小的大語言模型 , 第三代酷睿Ultra的速度可以達到AMD銳龍AI9 HX370的4.3倍;而用NPU計算相同的FP32浮點項目 , 第三代酷睿Ultra的速度也有高通驍龍X Elite 84-100型的2.6倍速度 。

這里我們我們提醒一下大家 , 第三代酷睿Ultra的NPU“理論算力”是50TOPs , 而AMD和高通被被拿來對比的處理器 , 它們集成的NPU“理論算力”同樣也是50TOPs 。 為什么明明理論算力相同的NPU , 實際測試的計算速度卻有好幾倍的差異呢?

這就不得不說到目前芯片行業在統計“算力”時經常耍的貓膩了 , 那就是大家普遍都只會用自家芯片“最擅長”的數據格式去聲稱算力水平 。 比如用低精度的INT4或FP6來統計算力 , 所以在遇到INT8或FP32的模型時 , 執行速度自然就會“縮水”數倍 。
反之 , 當英特爾能夠拿出明明是相同“TOPs”值 , 實際跑起來卻要快上幾倍的AI成績時 , 似乎也表明他們的芯片架構設計 , 確實要更務實、更“實誠”些 。

    推薦閱讀