性能強過臺式機處理器!這顆銳龍AI神U強到逆天

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

【性能強過臺式機處理器!這顆銳龍AI神U強到逆天】性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片

性能強過臺式機處理器!這顆銳龍AI神U強到逆天

文章圖片


從規格來看 , 這顆處理器cTDP為45-120W , 能兼顧性能和能耗的需求 。 內部包含了一個16核32線程的4nm Zen5 CPU核心 , 最高加速頻率5.1GHz , 總緩存高達80MB , 以及峰值AI算力為50TOPs的超低功耗NPU核心 , 支持Windows 11 AI+PC的諸多系統級本地AI功能 。 而與重度AI計算息息相關的則是集成的Radeon 8060s超大GPU核心 , 擁有40組RDNA 3.5架構CU計算單元 , 2560個流處理器 , 并且配備了AMD獨顯中才有的infinity Cache用以進一步提升顯存帶寬降低延遲 。
AMD銳龍AI Max+ PRO 395可以支持最高128GB統一內存 , 不同于傳統APU最高只能劃撥一半內存給顯存它可以支持最高96GB GPU專屬顯存 , 而結合AMD APU可以永遠調用系統剩余內存的50%這一邏輯 , 這顆內置GPU最高可以調用的顯存高達112GB , 相當于4張多4090顯卡!所以對于非高并發、只需要超大顯存的本地AI推理計算需求 , 過去你需要多張至少一萬元的高端顯卡 , 而如今算上CPU、內存、機箱、顯卡、電源整機都不到兩萬元 , 體積僅有3L左右 。
下面我們來看看它的理論性能與實際應用性能表現 。
其實此前我們測試過銳龍AI Max+ 395處理器的性能 , 而銳龍AI Max+ PRO 395與前者規格相同 , 只是增加了AMD PRO企業級安全管理技術 , 所以就看機器模具的散熱設計是否能進一步幫助性能得到釋放 。 首先從CINEBENCH R23和2024測試來看 , 在R23測試標準下 , 單核得分1938 , 多核得分37708;2024標準下單核得分110 , 多核得分1881 。 多核性能都比此前我們測試的成績要高出不少 。
究其原因 , 測試平臺給了銳龍AI Max+ PRO 395更加強勁的功耗釋放 。 通過AIDA 64 FPU CPU單烤機測試可以看到 , 這顆處理器的長時穩定功耗釋放基本達到了120W附近 , 但平均核心溫度只有95.5℃ , 可見測試平臺的整機散熱調校還是相當給力的 , 這確保了銳龍AI Max+ PRO 395在性能釋放上更加游刃有余 。
銳龍AI Max+ PRO 395支持128GB LPDDR5x 8000高速內存 , 其讀取速度高達119.74GB/s , 寫入速度高達211.65GB/s , 拷貝速度高達149.46GB/s , 速度極快 。
銳龍AI Max+ PRO 395集成了Radeon 8060S iGPU , 這顆GPU本身性能相當不錯 , 但AMD為了能讓它跑大參數量模型 , 可以通過調用內存做顯存來提升顯存容量 。 它擁有2560個流處理器 , 核心頻率高達2900MHz , 是目前最強的集成顯卡之一 。 我們手上的設備將顯存分配了64GB專屬 , 加上可以調用剩余64G內存的一半 , 理論上這顆GPU目前可以調用的顯存高達96GB
接下來我們看看3DMark測試成績 , Time Spy以及Fire Strike E圖形性能分別達到了11418和14267分 , 從集成顯卡角度來說 , 這樣的跑分是相當超模的規格 , 而且理論圖形性能達到了RTX 4060獨顯的水準 。 但若是論跑大語言模型的能力 , 別說RTX 4060 , 就是RTx 5090來了也不是它的對手 。
參考UL Procyon的Ryzen AI NPU Integer測試以及Windows ML ONNX GPU Float 16性能測試 , 前者得分高達1761分 , 后者達到了953分 , 單從理論跑分來看 , 銳龍AI Max+ PRO 395的NPU和GPU AI算力也是當前AI PC領域的頂尖水準 。
理論性能了解之后 , 我們來看看實際應用側的性能表現 。
首先是生產力應用 , 這里參考UL Procyon的圖片編輯和視頻編輯測試 , 可以看到銳龍AI Max+ PRO 395的性能相當彪悍 , 圖片編輯得分8386 , 視頻編輯得分22441 , 整體效率相當高 , 滿足重負載生產力應用不成問題 。
就比如D5渲染器這種工程設計類軟件 , 我們分別測試了工程圖和1080p視頻渲染 , 前者耗時僅為1分30秒 , 后者也僅用了5分57秒 。 此前 , 這種專業領域的渲染任務必須要放到專業臺式工作站上去做 , 而現在 , 一些迷你主機在銳龍AI Max+ PRO 395平臺的加持下就可以輕松完成 , 不得不感慨時代和技術的變化 。
在超凡的生產力效率之外 , 銳龍AI Max+ PRO 395最為驚艷的還是極其優異的AI算力支持 。 往前倒1-2年 , 我們都很難想像能夠在即使是最頂級的集成顯卡平臺上去跑AI , 這就是為什么銳龍AI Max+系列是真正具備革命意義本地AI硬件平臺 , 它為很多面向AI本地部署、AIGC、AI專業內容創意、科學計算、軟件開發等應用場景的企業用戶、開發者和個人用戶提供了經濟又實用的低成本解決方案 , 同時兼容運行眾多軟件 , 通過了多種ISV認證 。
同時 , AMD與Amuse AI合作 , 還為銳龍AI PC打造了專門的AIGC工具Amuse , 通過它你可以快速部署適配AMD銳龍平臺的AIGC大模型 , 除了可以做文生圖、圖生圖 , 還可以做文生視頻 , 而且支持調用AMD NPU進行超分辨率輔助或獨立采用NPU來完成圖像生成 , 是目前非常好用且易用的AIGC應用 。
這里我們使用同樣的一段提示詞 , 分別在不同的大模型中做了文生圖體驗 , 精度不高的模型最快5秒鐘就能生成一張圖片 , 而高精度模型也只需37.4秒就能生成一張1024×1024規格的圖片 。
另外我們還使用locomotion模型體驗了文生視頻 , 耗時30.6秒鐘完成了下面GIF圖所示的一段視頻素材 , 整體效果說實話還是相當讓人滿意的 。
最后我們通過LM Studio部署了七款不同參數規模的常用大語言模型 , 以下GIF圖為1倍速錄制 , 運行的大模型是OpenAI旗下的gpt-oss-120b , 大約45 token/s左右的生成速度 , 非常快 , 足夠滿足用戶的本地化AI助手應用需求了 。 由于是本地化部署 , 自然沒有網絡延遲 , 也不用付費購買tokens流量 , 還不用擔心數據隱私泄露的問題 。
另外我們還統計了七款大模型的生成速度 , qwen3-30b-a3b混合專家模型生成速度達到了61.48tokens/s , 接下來是qwen2.5-omni-7b和openai/gpt-oss-120b , 生成速度分別為44.94 tokens/s和38.57 tokens/s;Llama4-scout-17b和qwen3-235b-a22b生成速度分別為15.72 tokens/s和13.66 tokens/s , 也能很好地滿足日常應用需求 。 要知道受限于單卡顯存 , 常見頂級獨顯也都只有24或32GB顯卡 , 是很難部署和流暢運行這類超大參數的大模型的 , 而銳龍AI Max+ PRO 395平臺不僅能順利部署和加載 , 甚至真正能夠跑得動、跑得快 。
在AI時代到來之后 , AMD推出的銳龍AI Max+ PRO 395平臺可謂是技驚四座 , 它與迷你主機的聯手 , 可以說是給想要研究AI、學習AI、實用AI的企業用戶、開發者和個人用戶提供了相當靠譜的硬件平臺 , 用戶無需花費數萬甚至數十萬元去購買AI一體機 , 只需要一臺搭載銳龍AI Max+ PRO 395的迷你主機 , 兩萬左右的價格即可解決普通的AI算力部署需求 。
(10520360)

    推薦閱讀