性能強過臺式機處理器！這顆銳龍AI神U強到逆天

2026-04-26 it芯片人工智能顯卡 AMD cpu ai

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

文章圖片

【性能強過臺式機處理器！這顆銳龍AI神U強到逆天】

文章圖片

文章圖片

文章圖片

從規格來看，這顆處理器cTDP為45-120W ，能兼顧性能和能耗的需求。內部包含了一個16核32線程的4nm Zen5 CPU核心，最高加速頻率5.1GHz ，總緩存高達80MB ，以及峰值AI算力為50TOPs的超低功耗NPU核心，支持Windows 11 AI+PC的諸多系統級本地AI功能。而與重度AI計算息息相關的則是集成的Radeon 8060s超大GPU核心，擁有40組RDNA 3.5架構CU計算單元， 2560個流處理器，并且配備了AMD獨顯中才有的infinity Cache用以進一步提升顯存帶寬降低延遲。
AMD銳龍AI Max+ PRO 395可以支持最高128GB統一內存，不同于傳統APU最高只能劃撥一半內存給顯存它可以支持最高96GB GPU專屬顯存，而結合AMD APU可以永遠調用系統剩余內存的50%這一邏輯，這顆內置GPU最高可以調用的顯存高達112GB ，相當于4張多4090顯卡！所以對于非高并發、只需要超大顯存的本地AI推理計算需求，過去你需要多張至少一萬元的高端顯卡，而如今算上CPU、內存、機箱、顯卡、電源整機都不到兩萬元，體積僅有3L左右。
下面我們來看看它的理論性能與實際應用性能表現。
其實此前我們測試過銳龍AI Max+ 395處理器的性能，而銳龍AI Max+ PRO 395與前者規格相同，只是增加了AMD PRO企業級安全管理技術，所以就看機器模具的散熱設計是否能進一步幫助性能得到釋放。首先從CINEBENCH R23和2024測試來看，在R23測試標準下，單核得分1938 ，多核得分37708；2024標準下單核得分110 ，多核得分1881 。多核性能都比此前我們測試的成績要高出不少。
究其原因，測試平臺給了銳龍AI Max+ PRO 395更加強勁的功耗釋放。通過AIDA 64 FPU CPU單烤機測試可以看到，這顆處理器的長時穩定功耗釋放基本達到了120W附近，但平均核心溫度只有95.5℃ ，可見測試平臺的整機散熱調校還是相當給力的，這確保了銳龍AI Max+ PRO 395在性能釋放上更加游刃有余。
銳龍AI Max+ PRO 395支持128GB LPDDR5x 8000高速內存，其讀取速度高達119.74GB/s ，寫入速度高達211.65GB/s ，拷貝速度高達149.46GB/s ，速度極快。
銳龍AI Max+ PRO 395集成了Radeon 8060S iGPU ，這顆GPU本身性能相當不錯，但AMD為了能讓它跑大參數量模型，可以通過調用內存做顯存來提升顯存容量。它擁有2560個流處理器，核心頻率高達2900MHz ，是目前最強的集成顯卡之一。我們手上的設備將顯存分配了64GB專屬，加上可以調用剩余64G內存的一半，理論上這顆GPU目前可以調用的顯存高達96GB
接下來我們看看3DMark測試成績， Time Spy以及Fire Strike E圖形性能分別達到了11418和14267分，從集成顯卡角度來說，這樣的跑分是相當超模的規格，而且理論圖形性能達到了RTX 4060獨顯的水準。但若是論跑大語言模型的能力，別說RTX 4060 ，就是RTx 5090來了也不是它的對手。
參考UL Procyon的Ryzen AI NPU Integer測試以及Windows ML ONNX GPU Float 16性能測試，前者得分高達1761分，后者達到了953分，單從理論跑分來看，銳龍AI Max+ PRO 395的NPU和GPU AI算力也是當前AI PC領域的頂尖水準。
理論性能了解之后，我們來看看實際應用側的性能表現。
首先是生產力應用，這里參考UL Procyon的圖片編輯和視頻編輯測試，可以看到銳龍AI Max+ PRO 395的性能相當彪悍，圖片編輯得分8386 ，視頻編輯得分22441 ，整體效率相當高，滿足重負載生產力應用不成問題。
就比如D5渲染器這種工程設計類軟件，我們分別測試了工程圖和1080p視頻渲染，前者耗時僅為1分30秒，后者也僅用了5分57秒。此前，這種專業領域的渲染任務必須要放到專業臺式工作站上去做，而現在，一些迷你主機在銳龍AI Max+ PRO 395平臺的加持下就可以輕松完成，不得不感慨時代和技術的變化。
在超凡的生產力效率之外，銳龍AI Max+ PRO 395最為驚艷的還是極其優異的AI算力支持。往前倒1-2年，我們都很難想像能夠在即使是最頂級的集成顯卡平臺上去跑AI ，這就是為什么銳龍AI Max+系列是真正具備革命意義本地AI硬件平臺，它為很多面向AI本地部署、AIGC、AI專業內容創意、科學計算、軟件開發等應用場景的企業用戶、開發者和個人用戶提供了經濟又實用的低成本解決方案，同時兼容運行眾多軟件，通過了多種ISV認證。
同時， AMD與Amuse AI合作，還為銳龍AI PC打造了專門的AIGC工具Amuse ，通過它你可以快速部署適配AMD銳龍平臺的AIGC大模型，除了可以做文生圖、圖生圖，還可以做文生視頻，而且支持調用AMD NPU進行超分辨率輔助或獨立采用NPU來完成圖像生成，是目前非常好用且易用的AIGC應用。
這里我們使用同樣的一段提示詞，分別在不同的大模型中做了文生圖體驗，精度不高的模型最快5秒鐘就能生成一張圖片，而高精度模型也只需37.4秒就能生成一張1024×1024規格的圖片。
另外我們還使用locomotion模型體驗了文生視頻，耗時30.6秒鐘完成了下面GIF圖所示的一段視頻素材，整體效果說實話還是相當讓人滿意的。
最后我們通過LM Studio部署了七款不同參數規模的常用大語言模型，以下GIF圖為1倍速錄制，運行的大模型是OpenAI旗下的gpt-oss-120b ，大約45 token/s左右的生成速度，非常快，足夠滿足用戶的本地化AI助手應用需求了。由于是本地化部署，自然沒有網絡延遲，也不用付費購買tokens流量，還不用擔心數據隱私泄露的問題。
另外我們還統計了七款大模型的生成速度， qwen3-30b-a3b混合專家模型生成速度達到了61.48tokens/s ，接下來是qwen2.5-omni-7b和openai/gpt-oss-120b ，生成速度分別為44.94 tokens/s和38.57 tokens/s；Llama4-scout-17b和qwen3-235b-a22b生成速度分別為15.72 tokens/s和13.66 tokens/s ，也能很好地滿足日常應用需求。要知道受限于單卡顯存，常見頂級獨顯也都只有24或32GB顯卡，是很難部署和流暢運行這類超大參數的大模型的，而銳龍AI Max+ PRO 395平臺不僅能順利部署和加載，甚至真正能夠跑得動、跑得快。
在AI時代到來之后， AMD推出的銳龍AI Max+ PRO 395平臺可謂是技驚四座，它與迷你主機的聯手，可以說是給想要研究AI、學習AI、實用AI的企業用戶、開發者和個人用戶提供了相當靠譜的硬件平臺，用戶無需花費數萬甚至數十萬元去購買AI一體機，只需要一臺搭載銳龍AI Max+ PRO 395的迷你主機，兩萬左右的價格即可解決普通的AI算力部署需求。
(10520360)

推薦閱讀

上一篇：老電視越看越糊？國慶不花一分錢，調出 “新機級” 畫質！

下一篇：2億像素裁切出的400mm夠強嗎？小米15 Ultra航展攝影體驗分享