
文章圖片
谷歌(Google)正式宣布推出 Coral NPU , 一個面向邊緣人工智能(Edge AI)的開源全棧平臺 。 這一平臺旨在解決當前邊緣 AI 設備面臨的核心挑戰 , 使大型、現代的人工智能模型(LLMs)直接嵌入到智能手表、耳機和各類傳感器等對功耗極度敏感的微型設備中 , 并首次實現在智能手表、耳機或傳感器等小型設備上實現全天候運行 。
(來源:Github Coralnpu)
近年來 , 云端大模型的強大創造力、推理和輔助能力已經從根本上重塑了我們對技術的期望 。 谷歌認為 , 下一個重大的技術飛躍 , 不在于讓模型更大 , 而在于讓智能更貼近我們 。
要讓 AI 成為真正的貼身助手 , 主動幫我們規劃日程、實時翻譯對話、或理解我們的物理環境 , 它就必須在我們佩戴和攜帶的設備上運行 。 這就導向了當前行業的核心挑戰:如何將“環境 AI”(ambient AI)植入電池容量極其有限的邊緣設備 , 使其在實現全天候輔助的同時 , 確保用戶數據的絕對隱私 。
Coral NPU 的目標就是實現極致的能源效率 , 讓 AI 模型在僅消耗幾毫瓦功率的情況下運行 , 從而擺脫對云端連接的依賴 , 并從根本上增強設備的隱私保護能力 。
谷歌指出 , 要將 AI 從云端遷移到個人設備 , 首先要解決三個根深蒂固的難題:一是性能鴻溝 , 即現代模型所需的龐大算力與微型設備有限資源之間的矛盾;二是碎片化的成本 , 即面對硬件與軟件工具鏈的嚴重碎片化 , 開發者需要為一個充斥著各種專有處理器的、高度碎片化的市場編譯和優化 ML 模型 , 而這一過程極其困難且成本高昂;三是用戶信任 , 面對數據傳輸至云端處理帶來的隱私泄露風險 , 個人 AI 必須將個人數據的隱私與安全置于首位 。
傳統上 , 低功耗邊緣設備的開發者面臨一個根本性的權衡:要么選擇通用 CPU , 它們靈活且軟件支持廣泛 , 但缺乏針對 ML 工作負載的專用架構 , 導致性能低下且能效比差;要么選擇專用加速器 , 它們 ML 效率高 , 但“不靈活、難以編程 , 且不適合通用任務” 。
其次 , 這種硬件困境被一個高度碎片化的軟件生態系統放大了 。 CPU 和 ML 模塊的編程模型截然不同 , 開發者常常被迫使用專有編譯器和復雜的指令緩沖 。 這造成了陡峭的學習曲線 , 使行業長期缺乏一個成熟的、能有效支持多種 ML 開發框架的低功耗架構 。
傳統的芯片設計思路是圍繞通用 CPU 構建 , 再“外掛”一個 AI 加速器 。 這種架構在處理“常駐”的、持續性的 AI 任務時效率低下 。 Coral NPU 的出現則開辟了一條新的思路 。 它不再以 CPU 為中心 , 而是將負責運行神經網絡核心數學運算的“矩陣引擎”置于芯片設計的核心位置 。 這一神經處理單元(NPU)架構 , 結合了一個小型的 RISC-V 控制核心 和一個 RVV 1.0 向量單元 , 未來還將推出量化外乘矩陣單元 。
【谷歌推出開源全棧NPU新架構,旨在實現大模型在終端的低功耗運行】
這種以“AI 優先”(AI-first)為先的架構 , Coral NPU 旨在實現極高的能效比 。 其目標性能是每秒執行約 5120 億次操作(512GOPS) , 而功耗則控制在毫瓦級別 。 這種性能與功耗的平衡 , 對于需要 24/7 全天候運行 AI 功能且電池容量極其有限的小型 AI 設備而言 , 堪稱一次飛躍 。
(來源:Google for Developers)
同時 , Coral NPU 還是一個“全棧”平臺 。 為了解決工具鏈碎片化的問題 , 谷歌為其配備了一個統一的編譯器堆棧 。 該堆棧基于 MLIR、IREE 和 TensorFlow Lite Micro 等開源技術 。 其核心優勢在于 , 開發者只需編寫一次模型代碼 , 就能在任何基于 Coral NPU 架構的芯片上運行 , 真正實現模型的跨硬件無縫遷移 。 這極大地降低了開發門檻 , 使開發者無需再為每一個品牌的硬件重寫和優化代碼 。
在解決“信任赤字”方面 , Coral NPU 的一個核心原則是通過“硬件強制安全”(hardware-enforced security)來建立用戶信任 。 其架構正在被設計為支持像 CHERI 這樣的新興技術 , 該技術能提供細粒度的內存級安全和可擴展的軟件分區 。 谷歌希望通過這種方法 , 將敏感的 AI 模型和個人數據隔離在一個“硬件強制的沙箱”中 , 以有效抵御基于內存的攻擊 。
谷歌將 Coral NPU 視為邊緣 AI 的新開放標準 , 而這一愿景已開始落地 。 據悉 , 芯片設計公司 Synaptics 已經開始采用這種新設計來構建其下一代芯片 , 證明了該平臺不僅僅停留在理論階段 。 Coral NPU 的開源和全棧特性 , 有望催生下一代真正智能且持久續航的邊緣設備 , 從根本上改變用戶與可穿戴設備和傳感器的交互方式 。
參考資料:
1.https://developers.googleblog.com/en/introducing-coral-npu-a-full-stack-platform-for-edge-ai/
2.https://research.google/blog/coral-npu-a-full-stack-platform-for-edge-ai/
3.https://github.com/google-coral/coralnpu
運營/排版:何晨龍
推薦閱讀
- ICCV 2025 | 擴散模型生成手寫體文本行的首次實戰,效果驚艷還開源
- NeurIPS 2025 | CMU、清華、UTAustin開源ReinFlow
- 僅0.9B!百度新開源模型一夜登頂,識別109種語言,綜合分全球第一
- Mini-ITX玩家新玩具+1!銘瑄推出“終結者B850 BKB”顯卡背插主板
- 谷歌×耶魯聯手發布抗癌神器,AI推理精準狙擊「隱身」癌細胞
- 對標高德掃街榜 美團宣布推出“市井煙火榜” 評分體系升級
- Oracle增強AI智能體平臺與微軟谷歌競爭
- 微軟為Windows 11推出全新Copilot自動化功能
- 谷歌DeepMind與核聚變初創公司合作的真實原因
- 400元遙操95%機械臂!上海交大推出開源項目U-Arm
