
文章圖片

文章圖片

文章圖片

文章圖片
2025 年 11 月 13 日 , 中國(guó)上海訊 - 國(guó)內(nèi)領(lǐng)先的芯片IP設(shè)計(jì)與服務(wù)提供商安謀科技(中國(guó))有限公司(以下簡(jiǎn)稱(chēng)“安謀科技Arm China”)今日宣布 , 在上海舉辦“周易”X3 NPU IP新品發(fā)布會(huì) 。 作為安謀科技Arm China“All in AI”產(chǎn)品戰(zhàn)略下誕生的首款重磅產(chǎn)品 , 以及“AI Arm CHINA”戰(zhàn)略發(fā)展方向的關(guān)鍵實(shí)踐 , “周易”X3 NPU IP基于專(zhuān)為大模型而生的最新DSP+DSA架構(gòu) , 致力于打造端側(cè)AI計(jì)算效率新標(biāo)桿 , 在性能、功能與易用性等方面全面躍升 , 面向基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、智能物聯(lián)網(wǎng)四大領(lǐng)域 , 為加速卡、智能座艙、ADAS(高級(jí)駕駛輔助系統(tǒng))、具身智能、AI PC、AI手機(jī)、智能網(wǎng)關(guān)、智能IPC(網(wǎng)絡(luò)攝像機(jī))等設(shè)備帶來(lái)前所未有的AI計(jì)算體驗(yàn) 。
安謀科技Arm China產(chǎn)品研發(fā)副總裁劉浩
安謀科技Arm China產(chǎn)品研發(fā)副總裁劉浩表示:“在‘All in AI’產(chǎn)品戰(zhàn)略的指引下 , 我們將持續(xù)加大投入 , 以前瞻性視野整合頂尖研發(fā)資源 , 秉持開(kāi)放合作理念 , 為生態(tài)伙伴提供業(yè)界領(lǐng)先的從硬件、軟件到服務(wù)的端到端解決方案 , 全力賦能伙伴的產(chǎn)品創(chuàng)新和商業(yè)化落地 。 ”
“周易”X3 NPU IP新品發(fā)布會(huì)現(xiàn)場(chǎng)
性能躍遷——前瞻五年布局 , 讓端側(cè)大模型“跑得穩(wěn)、答得順”在半導(dǎo)體IP領(lǐng)域 , “面向未來(lái)5年的產(chǎn)品方向進(jìn)行前瞻布局”已成為行業(yè)共識(shí)——涵蓋IP研發(fā)、芯片及終端產(chǎn)品研發(fā)量產(chǎn) 。 安謀科技Arm China深諳這一規(guī)律 , 前瞻性地在“周易”X3中采用兼顧C(jī)NN與Transformer的通用架構(gòu)設(shè)計(jì) , 支持全算力類(lèi)型并增強(qiáng)浮點(diǎn)運(yùn)算FLOPS , 助力實(shí)現(xiàn)從定點(diǎn)到浮點(diǎn)計(jì)算的關(guān)鍵轉(zhuǎn)變 , 并滿足大模型計(jì)算需求 , 為未來(lái)5年Gen AI、Agentic AI與Physical AI的端側(cè)落地奠定技術(shù)基石 。
隨著AI大模型技術(shù)的飛速發(fā)展 , 智能手機(jī)、AI PC和智能汽車(chē)等端側(cè)設(shè)備正迎來(lái)AI能力的爆發(fā)性需求 。 從多模態(tài)語(yǔ)音助手到實(shí)時(shí)圖像生成 , 從智能座艙交互到輔助駕駛決策 , 端側(cè)設(shè)備需要承載越來(lái)越復(fù)雜的AI計(jì)算任務(wù) 。 然而 , 端側(cè)AI部署面臨算力受限、能效要求高、帶寬瓶頸、開(kāi)發(fā)門(mén)檻高等多重挑戰(zhàn)——如何在有限的功耗和算力資源下實(shí)現(xiàn)大模型的高效運(yùn)行 , 成為行業(yè)亟需突破的關(guān)鍵難題 。
“周易”X3基于專(zhuān)為大模型而生的最新DSP+DSA架構(gòu) , 從計(jì)算效率、帶寬、精度適配、任務(wù)處理四大維度實(shí)現(xiàn)升級(jí) , 精準(zhǔn)解決端側(cè)AI大模型運(yùn)行難題 , 打造端側(cè)AI計(jì)算效率的新標(biāo)桿 。
其單Cluster最高支持4個(gè)Core , 擁有8~80 FP8 TFLOPS算力且可靈活配置 , 單Core帶寬高達(dá)256GB/s 。 相較于“周易”X2產(chǎn)品 , “周易”X3的CNN模型性能提升30%~50% , 多核算力線性度達(dá)到70%~80% 。 在同算力規(guī)格下 , AIGC大模型能力較上一代產(chǎn)品實(shí)現(xiàn)10倍增長(zhǎng) , 這得益于16倍的FP16 TFLOPS、4倍的計(jì)算核心帶寬、超過(guò)10倍的Softmax和LayerNorm性能提升共同驅(qū)動(dòng) 。
借助這些優(yōu)化 , 端側(cè)大模型推理將更高效:在Llama2 7B大模型實(shí)測(cè)中 , “周易”X3 NPU IP在Prefill階段算力利用率高達(dá)72% , 并在安謀科技Arm China自研的解壓硬件WDC的加持下 , 實(shí)現(xiàn)Decode階段有效帶寬利用率超100% , 遠(yuǎn)超行業(yè)平均水平 , 滿足大模型解碼階段的高吞吐需求 。
“周易”X3 NPU IP新品亮點(diǎn)
此外 , “周易”X3在架構(gòu)層面實(shí)現(xiàn)了多項(xiàng)創(chuàng)新 , 集成以下關(guān)鍵特性:
- 集成自研解壓硬件WDC:使大模型Weight軟件無(wú)損壓縮后通過(guò)硬件解壓能獲得額外15%~20%等效帶寬提升 。
- 新增端側(cè)大模型運(yùn)行必備的W4A8/W4A16計(jì)算加速模式:對(duì)模型權(quán)重進(jìn)行低比特量化 , 大幅降低帶寬消耗 , 支持云端大模型向端側(cè)的高效遷移 。
- 集成AI專(zhuān)屬硬件引擎AIFF(AI Fixed-Function)與專(zhuān)用硬化調(diào)度器:實(shí)現(xiàn)超低至0.5%的CPU負(fù)載與低調(diào)度延遲 , 靈活支持端側(cè)多任務(wù)場(chǎng)景和任意優(yōu)先級(jí)調(diào)度場(chǎng)景 , 確保高優(yōu)先級(jí)任務(wù)的即時(shí)響應(yīng) 。
- 支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度融合計(jì)算 , 強(qiáng)浮點(diǎn)計(jì)算:可靈活適配智能手機(jī)邊緣部署、AI PC推理、智能汽車(chē)等從傳統(tǒng)CNN到前沿大模型的數(shù)據(jù)類(lèi)型需求 , 平衡性能與能效 。
安謀科技Arm China產(chǎn)品總監(jiān)鮑敏祺指出:“‘周易’X3遵循‘軟硬協(xié)同、全周期服務(wù)與成就客戶’的產(chǎn)品準(zhǔn)則 , 提供從硬件、軟件到售后服務(wù)的全鏈路支持 , 以前瞻性設(shè)計(jì)、專(zhuān)業(yè)團(tuán)隊(duì)交付與深度服務(wù)投入 , 全面助力客戶產(chǎn)品成功與商業(yè)化落地 。 ”
軟硬協(xié)同——從“好用”到“用好 ” , Compass“金牌輔助”提升開(kāi)發(fā)效率“周易”X3 NPU IP不僅提供高性能硬件 , 還配套完善易用的“周易”Compass AI軟件平臺(tái) , 通過(guò)“軟硬一體”的協(xié)同設(shè)計(jì) , 讓開(kāi)發(fā)者從“好用”到“用好” , 顯著提升開(kāi)發(fā)部署效率 。
Compass AI軟件平臺(tái)通過(guò)覆蓋開(kāi)發(fā)全流程的工具鏈、極致的易用性?xún)?yōu)化與開(kāi)放的生態(tài)布局 , 破解端側(cè)AI開(kāi)發(fā)“適配難、周期長(zhǎng)、門(mén)檻高”的痛點(diǎn) 。 作為核心工具 , 平臺(tái)中的NN Compiler(神經(jīng)網(wǎng)絡(luò)編譯器)集成Parser(模型解析)、Optimizer(優(yōu)化器)、GBuilder(生成器)及AIPULLM(大模型運(yùn)行工具) , 可實(shí)現(xiàn)主流模型的高效轉(zhuǎn)化、自動(dòng)化優(yōu)化與部署配置生成 , 并具備以下核心能力:
- 廣泛的框架與模型支持:支持超160種算子與270種模型 , 兼容TensorFlow、ONNX、PyTorch、Hugging Face等主流AI框架 , 提供開(kāi)箱即用的Model Zoo 。
- 創(chuàng)新的Hugging Face模型“一鍵部署”:通過(guò)AIPULLM工具鏈 , 直接支持Hugging Face格式模型 , 實(shí)現(xiàn)“一站式”轉(zhuǎn)化與部署 , 極大降低開(kāi)發(fā)門(mén)檻 。
- 先進(jìn)的模型推理優(yōu)化:實(shí)現(xiàn)業(yè)界領(lǐng)先的大模型動(dòng)態(tài)shape支持 , 高效處理任意長(zhǎng)度輸入序列;同時(shí)提供包括Tensor/Channel/Token Level多樣量化方式 , 以及GPTQ等大模型主流量化方案 , 并增加對(duì)LLM/VLM/VLA及MoE等模型的高性能支持 , 保障推理精度并實(shí)現(xiàn)云到端快速遷移 。
- 靈活的開(kāi)發(fā)者賦能:提供多種開(kāi)放接口 , 支持用戶模型與自定義算子的開(kāi)發(fā)與調(diào)試;配備豐富的調(diào)試工具與Bit精度軟件仿真平臺(tái) , 支持多層次白盒開(kāi)發(fā)與性能調(diào)優(yōu) , 極大簡(jiǎn)化算法移植與部署 。
- 全面的系統(tǒng)與異構(gòu)兼容:支持Android、Linux、RTOS、QNX等多種操作系統(tǒng) , 并通過(guò)TVM/ONNX實(shí)現(xiàn)SoC異構(gòu)計(jì)算 , 高效調(diào)度CPU、GPU、NPU等計(jì)算資源 。
“周易”NPU Compass AI軟件平臺(tái)
不僅如此 , 安謀科技Arm China技術(shù)團(tuán)隊(duì)還圍繞“周易”X3 NPU IP和Compass AI軟件平臺(tái)的軟硬件協(xié)同進(jìn)行精心設(shè)計(jì)和反復(fù)論證 , 目標(biāo)是提升客戶最終落地方案的效率和能效 。 例如 , 在“周易”X3 NPU IP的AIFF模塊軟硬件設(shè)計(jì)中 , 硬件端充分結(jié)合軟件使用場(chǎng)景 , 通過(guò)增大總線帶寬、增加DMA(直接內(nèi)存訪問(wèn))的outstanding(未處理的指令或數(shù)據(jù)請(qǐng)求)等方式提升數(shù)據(jù)搬運(yùn)、數(shù)據(jù)并行效率 , 軟件端則針對(duì)硬件特性設(shè)計(jì)專(zhuān)屬使用模式 , 如對(duì)模型進(jìn)行合理切分以充分發(fā)揮多核并行優(yōu)勢(shì) 。
安謀科技Arm China NPU產(chǎn)品線負(fù)責(zé)人兼首席架構(gòu)師舒浩博士
【從無(wú)形IP到AI萬(wàn)象,安謀科技Arm China“周易”X3 NPU 發(fā)布!】安謀科技Arm China NPU產(chǎn)品線負(fù)責(zé)人兼首席架構(gòu)師舒浩博士認(rèn)為:“‘周易’X3的產(chǎn)品優(yōu)勢(shì) , 源于通用、靈活、高效且軟硬協(xié)同的系統(tǒng)架構(gòu)設(shè)計(jì) , 這一設(shè)計(jì)使其兼具廣泛的行業(yè)適用性與靈活的邊端側(cè)AI應(yīng)用場(chǎng)景匹配能力 。 ”
多場(chǎng)景落地——從無(wú)形IP到AI萬(wàn)象 , 端側(cè)智能觸手可及新一代“周易”X3 NPU IP將端側(cè)智能的邊界拓展至更廣闊的應(yīng)用場(chǎng)景 , 面向基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、智能物聯(lián)網(wǎng)四大領(lǐng)域 , 精準(zhǔn)匹配當(dāng)前爆發(fā)的端側(cè)AI需求 , 可廣泛應(yīng)用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機(jī)、智能網(wǎng)關(guān)、智能IPC等AI設(shè)備:
- 基礎(chǔ)設(shè)施領(lǐng)域:在加速卡場(chǎng)景中 , “周易”X3 NPU IP支持CNN與大模型等多樣結(jié)構(gòu)的AI模型高效加速 , 為數(shù)據(jù)中心及邊緣計(jì)算節(jié)點(diǎn)提供核心算力 。
- 智能汽車(chē)領(lǐng)域:“周易”X3 NPU IP同時(shí)賦能智能駕駛與智能座艙:在ADAS系統(tǒng)中 , 可為自動(dòng)泊車(chē)等輔助駕駛功能提供高性能AI算力支持;在IVI(車(chē)載信息娛樂(lè)系統(tǒng))中 , 支持基于語(yǔ)音與車(chē)內(nèi)外視頻圖像輸入的智能互動(dòng) 。
- 移動(dòng)終端領(lǐng)域:在AI PC、AI手機(jī)上 , “周易”X3 NPU IP可實(shí)現(xiàn)超分渲染 , 提升顯示分辨率 , 并支持基于大模型的AI Agent應(yīng)用 , 為用戶帶來(lái)更智能、更流暢的交互體驗(yàn) 。
- 智能物聯(lián)網(wǎng)領(lǐng)域:在智能網(wǎng)關(guān)、智能IPC等設(shè)備中 , “周易”X3 NPU IP支持本地AI推理 , 實(shí)現(xiàn)更快響應(yīng)與更智能的終端體驗(yàn) , 滿足邊緣設(shè)備對(duì)實(shí)時(shí)性與隱私保護(hù)的高要求 。
此次發(fā)布會(huì)現(xiàn)場(chǎng)系統(tǒng)展示了“周易”NPU產(chǎn)品家族的技術(shù)演進(jìn)與落地成果 , 生動(dòng)詮釋其如何將無(wú)形的算力轉(zhuǎn)化為觸手可及的智能體驗(yàn) 。
- “周易”Z1:算力0.32~3.75 TOPS , 賦能AIoT場(chǎng)景 , 廣泛支持人臉識(shí)別、人臉及人體關(guān)鍵點(diǎn)檢測(cè)和文字識(shí)別等 , 且已進(jìn)入AI智能音箱等多種產(chǎn)品 。
- “周易”Z2/Z3:算力1.25~5 TOPS , 面向AIoT、入門(mén)級(jí)座艙等市場(chǎng) , 支持前視輔助駕駛方案、艙泊一體方案及安全儀表盤(pán)方案 , 以及圖像超分辨率優(yōu)化等 。
- “周易”X1:算力10 TOPS , 面向高端AIoT、汽車(chē)座艙等市場(chǎng) , 支持駕駛員監(jiān)控、乘客監(jiān)控、自動(dòng)泊車(chē)、AVM 360環(huán)視 , 以及AI圖像降噪等 。
- “周易”X2:算力10-30 TOPS , 面向高端AIoT、AI PC、AI Pad、手機(jī)等市場(chǎng) , 現(xiàn)場(chǎng)展示了運(yùn)行Stable Diffusion v1.5的文生圖能力 , 運(yùn)行CLIP的文搜圖能力 , 可實(shí)現(xiàn)端側(cè)多模態(tài)AI流暢運(yùn)行 。
- “周易”X3:算力8-80 FP8 TFLOPS , 面向基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、AIoT等市場(chǎng) , 現(xiàn)場(chǎng)展示了基于“周易”X3的主流大模型效果 , 包括運(yùn)行DeepSeek-R1-Distill-Qwen-1.5B模型的文生文AI流暢對(duì)話 , 運(yùn)行Stable Diffusion v1.5的文生圖效果 , 運(yùn)行MiniCPM v2.6模型的圖片識(shí)別及圖生文多模態(tài)應(yīng)用等 , 均展現(xiàn)出優(yōu)異的端側(cè)大模型推理性能 。
“周易”X3 NPU IP新品發(fā)布會(huì)現(xiàn)場(chǎng)
“周易”X3 NPU IP的發(fā)布 , 標(biāo)志著安謀科技Arm China“All in AI”產(chǎn)品戰(zhàn)略的正式開(kāi)啟 。 安謀科技Arm China以“AI Arm CHINA”為戰(zhàn)略發(fā)展方向 , 積極響應(yīng)“AI+”行動(dòng)計(jì)劃 , 持續(xù)深耕技術(shù)領(lǐng)域創(chuàng)新 , 同時(shí)攜手伙伴共建開(kāi)放生態(tài) , 加快構(gòu)建國(guó)內(nèi)“AI+”產(chǎn)業(yè)升級(jí)的智能計(jì)算基石 , 為千行百業(yè)智能化轉(zhuǎn)型提供更強(qiáng)IP“核芯”動(dòng)力 。
推薦閱讀
- 從“給答案”到“教動(dòng)腦”:這屆小學(xué)生被AI教會(huì)主動(dòng)思考
- 誰(shuí)也沒(méi)想到,又貴又丑的iPhone17 Pro Max,霸榜雙11
- 從芯片到自演化智能體:百度最硬AI云完成關(guān)鍵拼圖
- 百度亮出秘密武器:一個(gè)自我演化的AI,給出了人類(lèi)做不到的最優(yōu)解
- 消息稱(chēng)三星三折疊屏手機(jī)已生產(chǎn)2萬(wàn)到3萬(wàn)部 有望年內(nèi)發(fā)布
- 百鏡大戰(zhàn)一年,依視路、Tim到底看中了Rokid樂(lè)奇什么?
- 清華團(tuán)隊(duì):1.5B 模型新基線!用「最笨」的 RL 配方達(dá)到頂尖性能
- 想讓手機(jī)多用三年?聽(tīng)我一句勸:系統(tǒng)別亂升,電量用到紅
- AMD CEO蘇姿豐:全球AI數(shù)據(jù)中心市場(chǎng)規(guī)模在2030年將達(dá)到1萬(wàn)億美元
- 高端銷(xiāo)量第一!華為智能門(mén)鎖到底做對(duì)了什么?
