手機AI愈發重要,可為何廠商不再宣傳NPU算力

手機AI愈發重要,可為何廠商不再宣傳NPU算力

文章圖片

手機AI愈發重要,可為何廠商不再宣傳NPU算力

文章圖片

手機AI愈發重要,可為何廠商不再宣傳NPU算力

文章圖片

手機AI愈發重要,可為何廠商不再宣傳NPU算力

文章圖片

手機AI愈發重要,可為何廠商不再宣傳NPU算力

文章圖片


眾所周知 , 對于如今的智能手機行業來說 , “AI”已經成為了各大廠商最常掛在嘴邊的宣傳點 。
一方面 , 各頭部手機品牌目前都會自稱有“自研AI大模型” , 并通過各種各樣的“性能優化方案” , 在手機上實現了或主打影像、或用于日常生活、或是輔助游戲體驗的“AI功能” 。

另一方面 , 縱觀上游的芯片廠商 , 他們在宣發新款SoC時 , 如今也普遍會有關于NPU架構改進、能效提升 , 以及聯合各種AI大模型做端側性能優化的演示環節 。

但如果大家還記得前些年的智能手機宣發就會意識到一件事 , 在“手機AI”還未普及的年代 , 彼時相關廠商都會在宣發他們的早期“NPU”時 , 明確給出性能(算力)指標 。 這樣一來 , 盡管那個時候NPU“能做的事情”非常有限 , 但消費者起碼一眼就能看出不同品牌以及不同代次SoC之間 , 在NPU性能上的差異與進步幅度 。

相比之下 , 如今的手機SoC性能要強得多 , NPU也更先進、可以支持更多的“端側AI”功能了 , 但各大廠商在宣發時卻普遍只會做具體的“功能演示” 。 所有廠商、其中包括手機廠商和上游芯片廠商 , 似乎都普遍對于“NPU算力數字”這個看起來更直觀 , 更能讓普通消費者也可以直接對比優劣的參數閉口不談了 。
那么這又是為什么呢?
是NPU算力“出問題”了嗎?這樣說其實不完全錯
基于樸素的常識 , 大家都知道許多時候當某個數據突然中斷公布時 , 往往就意味著它可能變得不太好看了 。
這一點 , 對于手機里的NPU來說似乎也是成立的 。 比如以高通為例 , 2019年的驍龍855是首款公開宣傳NPU算力的產品 , 當時它的算力是7TOPs 。 之后換代的驍龍865、驍龍888、驍龍8 Gen1官方都有公布這一數據 , 分別是15TOPs、26TOPs、52TOPs 。

但是在驍龍8 Gen1之后 , 高通方面便不再公布NPU的“算力數字” 。 通過公開技術資料我們得知 , 2024年發布的驍龍8至尊版 , NPU算力是80TOPs , 到了今年剛剛換代的第五代驍龍8至尊版 , 這個數字則是100TOPs 。
發現了什么問題嗎?盡管高通這兩代旗艦SoC的NPU性能 , 在行業中依然是“遙遙領先” , 但這就意味著從驍龍8 Gen2到驍龍8 Gen3的這兩代 , NPU的“算力數字”進步速度確實可能是慢了下來 。

從這份統計數據中就可以看出 , 高通的NPU性能領先幅度很大
當然 , 這只是高通一家的情況 。 從我們三易生活掌握的數據來看 , 其他幾家主流手機芯片廠商在“NPU算力數字”這個方面 , 可能要比高通更難堪 。 所以當高通都“領頭”、不再公開宣傳NPU的算力時 , 其他的“友商”自然也就更有理由“從善如流”了 。
為什么NPU性能進步變慢了?不止關乎芯片設計
從相關數據中不難發現 , 最早幾代手機SoC里的NPU , 很明顯呈現出幾乎每次換代都“算力翻倍”的態勢 。 到了最近兩年 , NPU的“算力”進步速度 , 顯然就沒那么快了 。

關于這種現象 , 一個很容易想到的理由 , 是早期的NPU本身在設計上留了更多“余量” , 所以可以做到每次換代算力翻倍 。 但這種“代代翻倍”的設計 , 隨著后期半導體制程成本的上漲、再加上廠商需要將更多的功耗分配給新架構的CPU和GPU , 所以自然就沒法那么“任性”地維系下去了 。
但如果大家有關注過彼時手機廠商的市場宣傳就會發現 , 在他們停止宣傳NPU的“算力數字”后 , 實際上幾乎依然會在每次芯片換代時宣稱 , 新的NPU比前代“性能翻倍” 。

很顯然 , 現在大家已經知道 , 如今的NPU單從“硬件算力”來看 , 遠遠還做不到每次更新都翻倍的地步 。 那么這個“性能翻倍”是從何說起的呢?簡單來說 , 這其實是因為過去的“手機AI”和現在的“手機AI” , 在技術內涵、或者說所處理的任務類型上 , 已經發生了很大的變化 , 所以對NPU的設計需求也截然不同了 。
舉例來說 , 早期的“手機AI”幾乎都集中在“計算視覺”領域 , 比如用攝像頭來進行面部識別、拍照時的自動場景優化 , 甚至包括播放視頻時自動畫面增強等 。 這些技術就需要NPU有很強的圖像信號吞吐量 , 所以最早的NPU幾乎完全將重心放在了純粹的“峰值算力”上 , 要的就是在最短的時間里“算完” 。 由于其余的時候NPU很少會參與手機的日常工作 , 所以能效比差點也無所謂 。

但現在的情況已經發生了極大的變化 。 由于如今手機的“AI功能”不再局限于計算視覺 , 而是更多地集中在“內容生成”方面 , 比如AI生文、AI生畫、甚至包括拍照時用AI去“生成”缺失的細節 。 再加上AI功能越來越多、系統日常調用NPU的場合愈發頻繁 , 這就使得現在的NPU一方面在底層架構上需要針對生成式AI任務做出修改 , 另一方面它們也必須比過去更注重長時間運行時的能效比 。
打個比方來說 , 最近一些機型已經開始用NPU來協助GPU , 進行游戲中的“超幀超分”處理 。 很顯然 , 如果這時候NPU還采用以前那種“爆發式”的性能設計思路 , 肯定是沒法滿足需求的 。
手機的NPU還會繼續進步嗎?會 , 但思路已然不同
當然 , 在針對新的AI應用需求調整了底層設計后 , 如今可以看到不管是哪家芯片廠商 , 他們的NPU“硬件性能”實際上在最近這兩年 , 還是重新回到了增長的軌道上 。 只不過由于各種各樣的限制 , 如今的手機NPU顯然沒法像以前那樣 , 做到每一代硬件算力都直接“翻番”了 。

難道說以后就完全沒法“指望”手機里的NPU , 再有大幅度的性能提升嗎?
從現有的信息來看 , 倒也不至于 , 但肯定不會像以前那樣 , 純粹靠“堆規模”和提升頻率來解決問題了 。 比如 , 部分手機廠商會通過將他們的私有算法“固化”進NPU , 相當于用算法來直接定制硬件 , 來提升NPU在執行特定任務時的計算效率 。

對于更多的品牌來說 , 與大模型進行技術合作 , 深度調校AI功能在NPU上的兼容性和執行速度 , 也是當下提升NPU性能的主要方式 。 比如就在最近這幾天 , 三星就與Nota AI達成合作 , 要通過軟件優化的方式讓Exynos 2500的NPU(算力59TOPs)在實際AI執行速度上 , “追平”第五代驍龍8至尊版上的那顆100TOPs算力NPU 。
雖然我們對于這樣的“優化”究竟能否實現有點懷疑 , 但它至少表明 , 對于如今手機SoC里的NPU設計來說 , 軟件優化所能實現的效果 , 甚至可能會比單純的硬件設計更為重要 。
【手機AI愈發重要,可為何廠商不再宣傳NPU算力】【本文部分圖片來自網絡】

    推薦閱讀