
文章圖片

本文由半導體產業縱橫(ID:ICVIEWS)綜合
M50的發布 , 只是一個開始 。
“端邊AI” , 早已不是一個新穎詞匯 。
當 AI 大模型從數據中心的 “超級計算機” 里走出來 , 試圖鉆進你的手機、汽車和辦公電腦時 , 真正的挑戰才剛剛顯現:端邊設備的“算力天花板” 。
輕量化模型讓大模型能“擠” 進端邊設備 , 但傳統芯片要么算力不夠支撐流暢運行 , 要么功耗太高讓設備續航驟降—— 就像給自行車裝了跑車發動機 , 要么跑不起來 , 要么很快耗盡能量 。
那么 , 為什么在端邊領域的應用中 , 傳統芯片顯得力不從心?
傳統芯片在端邊AI 場景中表現乏力 , 本質上是 “設計目標與場景需求的錯位” 。 傳統通用芯片(如 CPU、普通 GPU)的架構邏輯 , 是為通用計算場景設計的 —— 它們需要兼顧辦公、娛樂、基礎運算等多元需求 , 無法針對端邊 AI 的核心訴求(低功耗下的高效推理)做深度優化 。
因此 , 用傳統通用芯片在端邊設備做AI 計算 , 容易陷入“性能與功耗的矛盾” 。 舉個例子 , 智能攝像頭的供電通常不超過5W , 若用傳統 GPU 做圖像識別 , 要么因功耗超標頻繁死機 , 要么因降頻導致識別準確率下降 。
如今大模型向端邊下沉的趨勢已經明確 , 用戶需要大模型在端邊設備上實現“本地快速響應” , 但端邊設備的物理約束(功耗、體積、成本)又給芯片套上了枷鎖 。
后摩智能即將落地的存算一體端邊 AI 芯片 , 正是要打破這個困局 。 它不是簡單提升算力參數 , 而是用架構創新重構了計算邏輯 , 讓端邊設備能真正“扛住” 大模型的運行需求 。
后摩智能 M50 芯片 , 最新登場7月25日 , WAIC 2025 前夕 , 后摩智能正式發布全新端邊大模型 AI 芯片——后摩漫界M50 , 同步推出力擎系列M.2卡、力謀系列加速卡及計算盒子等硬件組合 , 形成覆蓋移動終端與邊緣場景的完整產品矩陣 。
性能方面 , M50 芯片實現了160TOPS@INT8、100TFLOPS@bFP16 的物理算力 , 搭配最大 48GB 內存與153.6 GB/s 的超高帶寬 , 典型功耗僅 10W , 相當于手機快充的功率 , 就能讓PC、智能語音設備、機器人等智能移動終端高效運行1.5B 到 70B 參數的本地大模型 , 真正實現了\"高算力、低功耗、即插即用\" 。
這已是后摩智能推出的第二代端邊大模型AI 芯片 。
2024年6月 , 后摩智能推出了首款端邊大模型AI芯片——后摩漫界 M30 。 這款芯片算力達到100TOPS , 典型功耗僅為12W , 能夠支持包括ChatGLM、Llama2、通義千問在內的多種大模型 。
當前大模型行業正經歷深刻變革 , ChatGPT 僅用 2 年便達成 Google 11 年積累的年搜索量規模 , 超級應用用戶破億的時間從手機時代的 16 年壓縮至 ChatGPT 的 2 周 。 行業已進入\"推理密度\"與\"能耗密度\"雙重敏感階段 , 未來五年推理成本將占大模型全生命周期 80% 以上 。 在端邊大模型部署\"最后一公里\"的競爭 , 或將成為決定未來產業格局的重要拐點 。
上述兩款產品 , 便是后摩智能在這一行業變革浪潮中交出的答卷 , 也是其深耕端邊大模型 AI 芯片領域的有力見證 。
然而 , 在端邊大模型落地中 , 底層芯片僅靠堆砌算力參數遠遠不夠—— 當算力需求與功耗、體積的約束持續碰撞 , 架構創新正愈發成為破局的關鍵 。
存算一體:端邊大模型的“關鍵一躍”后摩智能也有著它與眾不同的解法 , 便是存算一體 。
存算一體端邊芯片的核心是將“存儲” 與 “計算” 功能在硬件層面深度融合 , 打破傳統芯片中 “數據在存儲器與計算單元間頻繁搬運” 的架構限制 , 從而提升數據處理效率、降低功耗 。
簡單來說 , 就是把傳統芯片里“分離的計算單元和存儲單元” 融合成一個整體 —— 就像把廚房和餐廳合并 , 廚師做完菜能直接端上桌 , 省去了傳菜環節 。
從技術邏輯看 , 傳統芯片的計算單元和存儲單元是分離的 , 處理數據時需要先從存儲器讀取數據 , 計算完成后再寫回 , 這個過程會產生延遲和能量損耗 。 而存算一體技術讓數據可以在存儲單元內部直接完成計算 , 減少了數據搬運的環節—— 這對端邊場景至關重要 , 因為端邊設備往往受限于體積、功耗(比如攝像頭、邊緣網關) , 同時又需要快速處理本地數據(如實時圖像識別、邊緣推理) 。
從端邊場景適配來看 , 這類芯片能更好滿足“低功耗”“低延遲” 需求:一方面 , 省去數據搬運的能耗 , 契合端邊設備的續航要求;另一方面 , 本地直接計算縮短了響應時間 , 符合端邊場景對實時性的要求(比如工業傳感器的即時數據反?。 ?。 此外 , 存算一體架構還能通過簡化數據流轉 , 降低數據在傳輸過程中的安全風險 , 這也貼合端邊場景 “數據本地化安全” 的核心訴求 。
存算一體芯片的價值 , 不止于解決當下的落地難題 , 更在于它重新定義了端邊大模型的“可能性邊界” 。
過去 , 端邊大模型的應用只能在“低算力、低體驗” 和 “高成本、高功耗” 之間二選一 。 而后摩智能的存算一體芯片 , 讓端邊設備有了“低成本、低功耗、高性能” 的三角平衡能力 。
M50 芯片作為這項技術的集大成之作 , 其第二代SRAM-CIM雙端口存算架構能讓權重加載和矩陣計算同時進行 , 支持多精度混合運算 , 可兼顧模型部署的各項需求;后摩智能自主研發的第二代 IPU 架構——天璇 , 通過壓縮自適應計算周期實現彈性計算(Elastic Computing) , 最高可提供 160% 的加速效果;通過內建的高速多芯互聯技術 , 可實現算力與帶寬擴展;同時適配后摩智能新一代編譯器后摩大道 , 可根據芯片架構自動選擇最優算子 , 無需開發者手動嘗試;支持浮點運算 , 無需量化參數和精度調優 。 和傳統架構相比 , M50 的能效提升 5~10 倍 , 完美適配了端邊設備\"算得快又吃得少\"的需求 。
后摩智能 CEO 吳強博士向半導體產業縱橫表示:在存算一體技術研發中 , 后摩智能在其自研二代存算一體技術創新中也取得諸多突破 , 包括雙端口存算架構、靈活的存算分離可測性設計、8bit/16bit混合精度設計以及雙電源軌設計等 , 在基于存算一體技術的端邊AI芯片中 , 后摩智能是一位創新性的先行者 。
這種架構創新為行業提供了新的技術路線 。 當存算一體證明“不用追先進制程也能提升性能” , 端邊芯片的競爭將從“參數比拼” 轉向 “效率優化”—— 誰能更精準地匹配大模型的計算特性 , 誰能更好地適配端邊設備的物理約束 , 誰就能占據先機 。
除了 M50 芯片 , 后摩智能此次發布的產品矩陣形成了覆蓋端側到邊緣的多元算力方案 。 力擎LQ50 M.2 卡以口香糖大小的標準 M.2 規格 , 為 AI PC、AI Stick、陪伴機器人等移動終端提供 \"即插即用\" 的端側 AI 能力 , 支持 7B/8B 模型推理超 25tokens/s;力擎LQ50 Duo M.2 卡集成雙 M50 芯片 , 以 320TOPS 算力突破 14B/32B 大模型端側部署瓶頸;力謀LM5050 加速卡與力謀LM5070 加速卡分別集成 2 顆、4 顆 M50 芯片 , 為單機及超大模型推理提供高密度算力 , 最高達 640TOPS;BX50 計算盒子則以緊湊機身適配邊緣場景 , 支持 32 路視頻分析與本地大模型運行 。
這些產品可廣泛應用于消費終端、智能辦公、智能工業等多元領域 , 且均能在離線狀態下實現全流程本地處理 , 從源頭杜絕數據聯網傳輸風險 。 例如在消費終端 , 賦能筆記本、平板電腦、學習機等設備本地大模型推理能力 , 無需聯網即可完成智能交互、內容生成等任務 , 用戶隱私數據全程閉環留存;智能辦公場景中 , 智能會議系統在斷網環境下仍能實現多語種翻譯、紀要生成 , 會議內容不觸云、不泄露;智能工業領域 , 產線質檢與車路云協同通過本地算力完成實時分析決策 , 生產數據與運營信息在設備端閉環處理 , 避免云端傳輸隱患 。 后摩智能通過存算一體技術與大模型的深度融合 , 推動 AI 大模型在端邊側實現 “離線可用、數據留痕不外露” , 構建起 “低功耗、高安全、好體驗” 的端邊智能新生態 。
結語大模型向端邊下沉的過程 , 就像當年計算機從機房走向桌面—— 真正的爆發點 , 不是技術概念的出現 , 而是適配場景的硬件基礎設施成熟 。
后摩智能的存算一體芯片 , 正是這樣的基礎設施 。 它用扎實的架構創新著手解決“落地最后一公里” 的問題 。
面向未來 , 后摩智能已啟動下一代 DRAM-PIM 技術研發 , 通過將計算單元直接嵌入 DRAM 陣列 , 使計算與存儲的協同更加緊密高效 。 該技術將突破 1TB/s 片內帶寬 , 能效較現有水平再提升三倍 , 推動百億參數大模型在終端設備實現普及 , 讓更強大的 AI 算力能夠融入 PC、平板等日常設備 。
這樣的技術方向和發展愿景也得到了重量級產業方和國有資本的認可 , 近兩年以來 , 后摩智能已經獲得了中國移動產業鏈發展基金、北京市人工智能基金 , 北京市亦莊產業升級基金、中國國有企業混改基金等多家機構的投資 , 為在端邊大模型芯片領域的持續創新提供了有力支撐 。 后摩智能 CEO 吳強博士表示:“M50 的發布只是一個開始 , 我們的目標是讓大模型算力像電力一樣隨處可得、隨取隨用 , 真正走進每一條產線、每一臺設備、每一個人的指尖 。 ”
*聲明:本文系原作者創作 。 文章內容系其個人觀點 , 我方轉載僅為分享與討論 , 不代表我方贊成或認同 , 如有異議 , 請聯系后臺 。
【160TOPS 算力國產芯片發布,后摩智能:讓AI算力像電一樣方便好用】想要獲取半導體產業的前沿洞見、技術速遞、趨勢解析 , 關注我們!
推薦閱讀
- A800、H800都低到這個價了,這個暑假搞了點算力福利
- 無懼封禁,Cursor最佳國產平替誕生,徹底告別代碼泄露風險
- 小米16 Ultra影像被確認:HP9升級版+國產大底主攝,實力強的飛起
- 國產5nm工藝,良率70%接近三星首代3nm? 沒有EUV怎么做到的?
- 100%全國產且首發遙遙領先超猛新技術,華為Mate80大瓜曝出!
- 致敬iPhone5!國產廠商推出4寸手機,攝像頭能旋轉還能秒變黑莓
- 勇奪中國第一!國產旗艦機還要看華為:Pura 70系列總銷量達1316萬臺
- 國產算力進駐頂尖高校,讓校級平臺跑出產業速度,鯤鵬昇騰背后助力
- 2025全球折疊屏手機出貨量預估,國產發力,三星份額或進一步減少
- 馬斯克放大招!xAI 五年狂砸 5000 萬塊 H100 等效算力
