RISC-V:賦能智能通用計算時代

RISC-V:賦能智能通用計算時代

文章圖片


本文由半導體產業縱橫(ID:ICVIEWS)編譯自semiwiki
人工智能/機器學習的進步正在為通用計算注入智能 。

Andes Technology總裁兼首席技術官Charlie Su在2025年RISC-V北美峰會上發表了精彩的主題演講 , 他斷言RISC-V已做好充分準備 , 引領蓬勃發展的智能通用計算領域 。 這一新興范式將人工智能和機器學習集成到日常計算設備中 , 涵蓋從AI賦能的個人電腦和智能手機到邊緣服務器、軟件定義車輛和機器人平臺等 。 Charlie Su強調 , 人工智能/機器學習的進步正在為通用計算注入智能 , 從而推動個人應用、工廠自動化、監控、無人機和自動駕駛(ADAS 0-4級)等領域的應用 。 他預測 , 作為應用賦能平臺的機器人 , 其規??赡軙^智能手機市場 。 為了支持這一發展 , 智能通用計算需要一個強大的生態系統 , 以支持通用任務和大規模人工智能/機器學習 , 涵蓋軟件和硬件 。
Charlie Su重點強調了RISC-V在推動大規模AI/ML創新方面的作用 。 Meta的訓練和推理加速器(MTIA)就是一個典型的例子 。 MTIA利用了Andes的向量和標量內核以及自動化自定義擴展(ACE)框架 , 詳情請參見ISCA 2023 。 自2023年以來 , Meta的數據中心已部署了兩代基于RISC-V處理器并帶有自動化擴展的MTIA 。 其他采用基于SRAM的內存計算(CI-ME)的加速器包括服務器解決方案(例如RiVos AI SoC)、云服務(SAPEON)、基于光子學的AI和ADAS系統 。 這些加速器由Andes的AX46MPV、AX45MPV、NX27V和AX65等內核驅動 , 展現了RISC-V在高性能AI領域的多功能性 。
RISC-V軟件生態系統正在快速成熟 , 這得益于 RISE(RISC-V 軟件生態系統)等舉措的推動 。 RISE 旨在加速開源軟件開發、提升軟件質量 , 并協調云和物聯網設備的相關工作 。 目前 , RISC-V 已支持 Java 22/21 , 其工具涵蓋編譯器(LLVM、GCC、GLIBC)、系統庫(FFmpeg、OpenBLAS)、內核/虛擬化(Linux、Android、性能配置文件)等 。 其主要成員包括 Andes、Google、Intel、NVIDIA、Qualcomm 和 Samsung 。 Debian 對開源的支持也印證了 RISC-V 的成熟度 , 在超過 64000 個軟件包中 , RISC-V的構建成功率高達98.4% , 位列第三 。 Metanoia 的 5G O-RAN 軟件架構進一步展現了模塊化、完全開源的半交鑰匙解決方案的優勢 。
Andes的處理器產品線專為當今時代量身打造 。 AX46MPV 提供強大的計算能力和高效的控制 , 兼容 RVA22+標準 , 包括AIA和SV38/48/57虛擬化 。 它采用雙發射方式處理向量/標量指令 , 配備向量處理單元 (VPU) , VLEN/DLEN范圍為128至1024位 , 支持int4 至int64和bf16/fp16 至64 格式 , 并增強了歸約求和功能 。 多核支持最高可達 16 核 , 通過雙發射加載/存儲提升內存性能 , 擁有強大的卓越性能 , 以及可處理多個 OOO 請求的高速向量內存 (HVM) 接口 。 與AX45MPV相比 , 其性能提升包括:SpecInt2006測試成績提升約 18%(得分5.65) , 關鍵向量庫(libvec、libnn)性能提升超過 2 倍 , 帶寬提升 40% 。
AX66是一款中端應用處理器 , 符合RVA23標準 , 具備雙向量流水線(VLEN=128)、4 寬前端解碼、128 項 ROB、8 條執行流水線以及 TAGE-L 分支預測器 。 它支持最多8個核心、32MB 共享 L3 緩存(大部分為獨占緩存)以及 128/256 位 AXI4 接口 , 并支持IOMMU、APLIC和CHI 。 向量性能在 libnn 密鑰函數方面提升超過10倍(平均 9.6 倍) , 在 libvec 方面提升超過4倍(平均 3.55 倍) , 加密性能也顯著提升(SHA-256 提升 4.7 倍 , AES-128提升10.5倍 , SM4提升6.4倍) 。 帶寬提升25% 。
針對高端應用需求 , Cuzco 系列處理器可擴展至 20 SpecInt2k6/GHz , 并采用專利的基于時間的調度技術(通過時間資源矩陣實現) , 從而提高指令執行效率并降低功耗 。 該系列處理器符合 RVA23 標準 , 具備 8 路解碼、256 個 ROB 條目、8 條流水線(每個切片 2 條)、高級分支預測、私有 L1/L2 緩存、高達 256MB 的共享 L3 緩存、最多 8 個核心的多處理器以及 CHI/256 位 MMIO 。 早期 5nm 工藝的目標頻率為 2.5GHz , 而目前的 SpecInt2006 性能約為 18/GHz , CPU 使用 700 萬個門 , 2MB L2 緩存使用 450 萬個門 。
Andes通過AndesAIRE增強了生態系統 , AndesAIRE是一款“AI 無處不在”的端到端解決方案 , 包括IDE、NN SDK、編譯器(MLIR、TVM)、解釋器(ONNX Runtime、PyTorch)以及 AndLA 1350 等加速器 。 操作系統支持全面:RISC-V 規范(RVA22/23 配置文件、SoC 平臺)、Linux 發行版(Debian、Fedora、Ubuntu , 經 Andes 驗證)、上游內核特性(strace/ftrace、Perf、HIGHMEM、CPU 熱插拔、持續掛起到 RAM 和 PowerBrake)、引導加載程序(U-Boot、OpenSBI)以及 RTOS(FreeRTOS、Zephyr、Thread-X) 。
*聲明:本文系原作者創作 。 文章內容系其個人觀點 , 我方轉載僅為分享與討論 , 不代表我方贊成或認同 , 如有異議 , 請聯系后臺 。
【RISC-V:賦能智能通用計算時代】想要獲取半導體產業的前沿洞見、技術速遞、趨勢解析 , 關注我們!

    推薦閱讀