Arm全新IP解析:功耗值得關注,小核前景堪憂

Arm全新IP解析:功耗值得關注,小核前景堪憂

文章圖片

Arm全新IP解析:功耗值得關注,小核前景堪憂

文章圖片

Arm全新IP解析:功耗值得關注,小核前景堪憂

文章圖片

Arm全新IP解析:功耗值得關注,小核前景堪憂

文章圖片

Arm全新IP解析:功耗值得關注,小核前景堪憂

文章圖片

Arm全新IP解析:功耗值得關注,小核前景堪憂

最近這幾天 , Arm在上海召開Arm UNLOCKED峰會 , 正式發布了面向移動端的Arm Lumex計算子系統(Compute Subsystem CSS) 。
什么是Lumex CSS?用最簡單的話來說 , 它其實就是Arm如今的一種“營銷概念” 。 Lumex CSS至少包括Arm全新的C1系列CPU架構設計、G1系列GPU架構設計、C1-DSU核間總線設計 , 以及其他一些周邊系統IP設計 , 全部“打包”起來的產物 。

需要注意的是 , Lumex CSS并不等于完整的SoC架構授權 , 因為它本身并不包括NPU、基帶、電源管理、ISP等許多常見移動平臺的必備組件 。 這也是為什么今年“Arm CSS”這個概念最開始引發外界關注時 , 就有不少人辟謠“即便買了完整的Arm CSS , 也沒法直接做成手機SoC”的原因 。

當然 , 從目前網絡中流傳的部分信息來看 , 現有的各一線大廠 , 基本都是基于Arm的架構、甚至指令集授權去做二次開發 。 所以Lumex作為“官方公版”的意義 , 本質上還是與過去一樣 , 主要針對的是自研能力不足的中小芯片廠商 。
但即便如此 , 這并不意味著此次公布的Lumex CSS對于關注手機行業 , 對下一代移動設備平臺好奇的朋友來說就沒有意義了 , 因為深入探究其中的內容 , 還是可以發現不少有趣的、值得一講的東西 。
產品命名邏輯大改 , 但實際效果還有待商榷
首先正如前文中已經提及的那樣 , Arm Lumex CSS這次包含了全新的CPU和GPU IP 。 而且與過去Arm經?!爸桓麓蠛?、不換代小核”的操作不同 , 這一次他們不僅將全部的CPU、GPU架構都進行了換代 , 并且將整個產品命名體系都做了很大的調整 。

具體來說 , Arm發布了四款新的CPU IP , 分別是C1-Ultra、C1-Premium、C1-Pro和C1-Nano 。
從定位來看 , C1-Ultra代表的是旗艦SoC里的“超大核” , 也就是接替現在Cortex-X925的位置 。
C1-Premium代表的是“次旗艦大核” , Arm對它的解釋是架構與超大核相同 , 但緩存沒那么大 , 且使用密度庫(也就是主頻會更低、但能耗也更低)制造 。 換句話說 , 它其實相當于是將聯發科之前用過的Cortex-X4m“轉了正” , 正式獨立為一條CPU產品線 。

剩下的C1-Pro和C1-Nano就很好理解了 , 它們分別繼承了Cortex-A725和Cortex-A520的產品定位 。
與此同時 , Arm還發布了名為“Mali G1”的GPU IP家族 。 它從最入門的版本到最高配型號之間倒是并無架構區別 , 而僅以著色器核心數量進行版本區分 。 其核心數量可在1核心到24核心之間進行定制 , 并根據核心數量的不同 , 被區別為G1-Ultra、G1-Premium、G1-Pro至少三個級別 。
但這里Arm既沒有提到每個版本之間具體的核心數量標志差異 , 也并未說明是否存在入門款的“G1”或“G1-Nano” 。
新IP性能普遍提升 , 不過功耗值得注意
其實從命名邏輯來說 , Arm這一輪新品體系很顯然是想要表達它們“全新的”、“與過去不同”的身份 。 另一方面 , 與過去的三位數字命名法相比 , 新的IP命名規律顯然是想要讓未來換代之后的“代次區分”變得更明顯 。 比如將來的G2、G3 , 大家很快就能知道比現在的G1更新 , 的確就會比現在X925、A710、A520這樣的命名來得更易區分“新舊”關系 。
但Arm現在的這種命名方式也帶來了一個問題 , 那就是消費者更難直觀地判斷同代次之間的核心性能高低程度了 。 是的 , C1-Ultra當然要比C1-Nano快得多 , 但具體“快多少”呢 , 就更不方便進行判斷了 。
而且哪怕是對比上代產品 , Arm也并沒有將新IP的性能進步幅度完全說清 。

比如他們聲稱 , 與前代“超大核”Cortex-X925相比 , C1-Ultra的IPC(單時鐘周期性能)提升了12% , 微架構性能表現提升了26% 。
但Arm方面卻沒有給出C1-Premium相比于前代“次旗艦超大核”的性能改進幅度具體數據 。 雖然這可能是因為X925本身就沒有次旗艦變體 , 要對比就只能找出前前代的X4m , 但也不排除新的次旗艦架構進步幅度沒那么大、對比數據不夠好看的可能 。

相比之下 , 他們對于C1-Pro的性能進步幅度給出的數據又變得具體了起來 。 根據Arm方面的說法 , 與Cortex-A725相比 , C1-Pro在同等性能下的功耗要低26%;如果是達到同等功耗 , 那么C1-Pro的性能將可以比Cortex-A725塊11% 。 同時如果兩者均設定為相同的主頻 , 則C1-Pro的性能最高可以比Cortex-A725高出16% 。
從這三組數據就可以知道 , 在相同主頻的前提下 , 新的C1-Pro大核功耗其實是會比Cortex-A725略高一點的 , 但因為性能進步更大 , 所以算起來能效比依然是上漲了 。
最后 , 則是“小核心”C1-Nano 。 Arm對于它的性能數據給得比較詳細 , 但可惜從這些數據來看 , C1-Nano本身的改進并沒有將重點放在性能上 , 而是更多地體現為面積的縮小、功耗的降低 , 以及支持最新的指令集 。

按照Arm方面的說法 , 在SPECint2017中 , C1-Nano對比Cortex-A520綜合跑分提升大約為5.5% 。 在處理相同程序的前提下 , 它的能效提升了26% 。

【Arm全新IP解析:功耗值得關注,小核前景堪憂】最后 , 則是Mali G1-Ultra GPU 。 Arm方面表示 , 它在跑分軟件和游戲中的性能相比上一代(G925)提升了20% , 同時單幀功耗降低了9% 。 那么經過計算就可知 , 此時它的整體功耗其實是上漲了的 , 漲幅約為9.2% 。 好在此時G1-Ultra的光追性能可以達到前代的兩倍 , 對于未來可能出現的“重光追”手游來說 , 它依然有望帶來遠超20%的幀率提升幅度 。
新的旗艦手機注定更快 , 但入門款則前途未卜
說了這么多 , 那么Arm的這一批新架構對于即將到來的新一代智能手機以及SoC來說 , 意味著什么呢?
首先必須要注意的一點 , 是無論在Arm的規劃還是目前出現的傳言中 , 新的旗艦移動平臺都不可能使用C1-Nano“小核心” 。 Arm的說法 , 是頂級旗艦可能會使用兩顆C1-Ultra搭配六顆C1-Pro , 我們甚至不排除廠商減少“中核(C1-Pro)”數量、加入更多的“次大核(C1-Premium)” , 來換取更高跑分成績的可能 。

綜合前面的分析以及行業里近年的動向來看 , 除非臺積電的N3P工藝再度“發威” , 否則在各家大概率會在進一步提高旗艦SoC峰值主頻的前提下 , 基于新CPU、新GPU的新款旗艦平臺 , 峰值功耗恐怕會有進一步的上漲、而非下降 。

當然大家倒也不必緊張 , 因為新架構的IPC確實是提升了 , 這也就意味著在跑分之外的場景、包括重負載游戲 , 只要不出現新的“性能殺手” , 那么新旗艦的實際運行頻率注定會比現在的平臺更低 。 結果就是日常使用的能效肯定會有顯著改善 , 甚至重負載游戲功耗都有可能會進一步降低 。
相較之下 , 更讓人擔心的反倒是那些單純基于C1-Nano的低功耗設備 。 雖然目前的各種證據顯示 , 新架構客觀上對比Cortex-A520的確有所改進 , 但一方面它的性能進步幅度顯然比其他的“大核”們要小許多 。 另一方面 , 隨著越來越多的旗艦、次旗艦平臺“棄用”CPU小核 , 無論軟件開發者、芯片設計廠商 , 甚至是未來的Arm , 都有可能會對小核的改進越來越失去“動力” 。

要知道在隔壁蘋果的Apple Watch里 , 驅動手表的CPU架構早就已經是源自A16能效核的““Sawtooth”方案 , 也就是縮小版的“中核(定位更接近A725或這次的C1-Pro)”了 。 對于主流消費電子產品來說 , 純粹低功耗“小核”的退場 , 很有可能已經只是時間問題 。
【本文圖片來自網絡】

    推薦閱讀