
文章圖片

文章圖片

文章圖片

文章圖片
機器之心報道
編輯:Panda、澤南
AI 行業很多人相信 , 我們正在或已經進入所謂的「AI 下半場」 。 在這一輪 AI 的浪潮中 , 硬件的競爭早已不再是單純的算力比拼 , 而是一場圍繞軟件、開發者與生態的「護城河」之戰 。 當國產 AI 生態的轉型成為科技領域的時代呼聲 , 華為昇騰及其異構計算架構 CANN 正站在了這場變革的聚光燈下 。
2025 年 8 月 5 日 , 華為輪值董事長徐直軍宣布 , 昇騰硬件使能的 CANN 將全面開源開放 , 并承諾在 12 月 30 日前完成 。
這并非一次簡單的技術路線調整 , 而是國產 AI 基礎設施在生態戰略上一次深刻的自我革命 。 它標志著昇騰正試圖打破過去由硬件廠商自上而下主導的封閉模式 , 轉而擁抱一種更開放、更依賴社區共建、也更不確定的未來 。 這不僅是對行業領導者 CUDA 所建立的強大壁壘發起的挑戰 , 更是對自身的一次考驗:從「可用」到「首選」的道路 , 關鍵不再僅僅是技術的迭代 , 更在于能否真正構建起一個讓開發者愿意參與進來的繁榮生態 。
為了探尋 CANN 開源的真實意義 , 以及它將為整個生態帶來怎樣的機遇與挑戰 , 我們與三位身處不同位置的核心開發者與觀察者進行了深度對話 。 他們分別是:
蘇統華教授 , 哈爾濱工業大學計算學部軟件學院副院長 。 作為國內最早開展 CUDA 科研和教學 , 也是最早投入昇騰生態的高校學者之一 , 他既是前沿的科研探索者 , 也是一線的人才培養者 。 李秀紅先生 , 無問芯穹技術副總裁 。 他從 AI 基礎設施提供商的視角出發 , 對一個計算生態如何構建「最大公約數」有著深刻的商業與技術洞察 。 陳昀博士 , 華南理工大學的青年研究者 。 他奮戰在最底層的算子開發領域 , 專注于挖掘硬件的極致性能 , 代表了硬核開發者對底層工具最直接的訴求 。對于 CANN 開源的意義 , 他們的觀點精準地回應了我們開篇的判斷 。 在蘇統華教授看來 , 要讓國產平臺真正繁榮 , 關鍵在于吸引學術圈進行「原生創新」 , 當引領性的新模型誕生于此 , 生態自然會吸引全球的目光 。 而李秀紅先生則指出 , 一個成功的生態本質上是要為最廣泛的開發者構建穩定、通用、高效的底層工具 , 找到「最大公約數」 。 而對于陳昀博士這樣奮戰在一線的算子開發者來說 , 開源意味著底層不再是黑箱 , 那些曾阻礙性能優化的瓶頸將有機會被徹底打破 。
他們的觀點 , 共同構成了一幅關于 CANN 開源與國產 AI 生態未來的全景圖 。 本文將深入一線 , 通過這些核心開發者與教育者的視角 , 共同探尋答案 。
從「磚」到「大廈」
一線開發者眼中的 CANN 演進與挑戰
「如果一個 AI 框架或大模型是一座宏偉的大廈 , 那么算子就是其中的每一塊磚 。 」陳昀博士如此形容他所從事的工作 。 作為一名奮戰在最底層的算子開發者 , 他與團隊日復一日地打磨著這些「磚塊」 , 確保它們堅固、高效 , 從而為整個昇騰 AI 生態這座「大廈」提供堅實的基石 。
不過 , 這座「大廈」的構建并非一帆風順 。 在 CANN 全面開源之前 , 開發者們走過的是一段「摸著石頭過河」的艱難探索之路 。 他們既是先行者 , 也是拓荒者 , 親身體驗了從零到一的全部陣痛 , 也見證了 CANN 在磨礪中逐步成長的完整軌跡 。
吃螃蟹的人:在刀耕火種中前行
回顧 CANN 的早期階段 , 幾乎所有親歷者都用了「艱難」二字來形容 。 蘇統華教授將第一批開發者比作「吃螃蟹的人」 , 這不僅意味著先行一步的機遇 , 更伴隨著「吃一口可能把牙給崩一塊」的巨大風險 。
這種風險首先源于極高的技術門檻 。 在 2018 年發布的 1.0 版本中 , CANN 甚至要求開發者在接近匯編的層面進行編程 , 這無異于「刀耕火種」般的原始開發模式 , 生產效率極低 。 對于陳昀博士這樣的算子開發者而言 , 即便在后續版本中 , 許多工作也需要依賴基礎 API 進行「從流水排布到內存調度」的全手動調優 , 每一行代碼的優化都極其費時費力 。
CANN 是連接 AI 框架與昇騰芯片的底層架構
更嚴峻的挑戰 , 來自平臺自身架構的劇烈迭代 。 蘇教授分享了一段令人印象深刻的經歷:他的團隊曾花費一年時間為 CANN 編寫應用案例并集結成書 , 卻在最終審核時被告知「底層的軟件已經全部推倒重來了」 。 這一句「自己把自己革命了」的背后 , 是整個團隊又花了一年時間 , 將所有案例重做一遍的巨大付出 。
這正是早期生態建設最真實的縮影 —— 在缺乏穩定架構和成熟工具的條件下 , 第一批開發者憑借著拓荒者的精神 , 為昇騰奠定了最來之不易的基礎 。
磨礪出的利器:在黑暗中摸索的光
然而 , 即便在充滿挑戰的拓荒期 , CANN 也在不斷進化 , 并為開發者磨礪出了一批強大的工具 , 成為他們在黑暗中摸索時的「光」 。
Ascend C 編程語言就是一個決定性的進步 。 蘇統華教授指出 , 早期的 TIK 和 TBE 方案「用起來還是比較費勁 , 性能比較差」 , 而新推出的 Ascend C 「其實就已經跟現在的 CUDA C 基本上對標了」 。 對于開發者而言 , 這意味著一種更現代化、更符合主流習慣的編程范式的確立 。
其中 , 性能分析工具 Profiling 更是在開發者社區中獲得了極高的評價 。 它能夠將 NPU 的利用率、指令周期、帶寬瓶頸等底層信息完全可視化 。 當成功將一個算子的利用率從 50% 逼近 90% 的理論峰值時 , 那種成就感是無與倫比的 。 正如陳昀博士所形容的 , 「那種感覺就很像是爬山…… 當你征服一座大山時 , 那一刻感覺之前所有的調試和試錯都值了 。 」 這種來自一線開發者的真實喜悅 , 正是驅動生態不斷向前的最樸素動力 。
性能分析工具 Profiling 中的計算內存熱力圖
經過數年迭代 , CANN 的工具鏈已具備相當的完備性 , 整體上滿足了開發者 80% 以上的需求 。 然而 , 局部的「點狀」優勢 , 依然無法完全解決系統性的「面狀」難題 。
突破瓶頸 , 開發者需要「最大公約數」
當訓練不再收斂 , 當高級調試需求無法滿足時 , 開發者依然會感受到「黑箱」帶來的束縛 。 一個典型且棘手的場景是 , 模型在昇騰上無法復現與其他框架一致的精度 , 收斂結果可能相差十幾個百分點 , 但由于底層信息不透明 , 開發者很難定位問題根源 。 蘇教授坦言 , 這種「找不到原因 , 也不好找」的困境 , 曾讓很多參與其中的學生備受打擊 。
這種挫敗感 , 源于開發者無法完全掌控自己的代碼 。 從技術上看 , 當時的工具鏈仍有明顯短板 , 例如缺少 GDB 那種強大的斷點回溯功能 , 高級分布式調試的教程也相對匱乏 , 使得性能優化在很大程度上依賴于經驗和猜測 。
這種系統性的不便 , 還體現在軟件架構的敏捷性上 。 其中一個核心痛點是過去 CANN 的軟件包過于龐大和耦合 , 導致開發者無法進行靈活、快速的迭代 。 這種架構上的限制 , 使得即使是一個小功能的更新 , 也需要依賴整個平臺的版本發布 , 極大地拖慢了創新速度 。
李秀紅先生一語道破了問題的核心:「開發者用芯片 , 是想在上面創造東西 。 如果他的表達能力被各種限制 , 他是非常痛苦的 , 相當于天然的創造力被遏制住了 。 」 他提出的「最大公約數」概念 , 正是所有計算生態的終極追求:一個成功的生態 , 必須為最廣泛的開發者群體提供最穩定、通用、高效的底層工具 , 將復雜的硬件細節封裝起來 , 讓開發者能聚焦于應用創新本身 。
一個計算生態的終極價值 , 是賦能開發者 , 而非限制開發者 。 從這個角度看 , CANN 的早期演進正是一個在不斷提供強大工具的同時 , 又不斷遭遇系統性瓶頸 , 并最終走向全面開放的必然過程 。 將生態的主導權交還給開發者 , 讓他們能看清、能修改、能共建 , 這不僅是回應他們的訴求 , 更是 CANN 從「可用」邁向「首選」的必由之路 。
從我們的視角看 , CANN 的這段早期演進史幾乎是所有挑戰行業巨頭的國產基礎軟件都必須經歷的「成人禮」 。 它揭示了一個深刻的規律:一個計算生態的構建 , 初期或許可以依賴少數「拓荒者」的信念和高強度投入 , 但其長期的生命力 , 必然源于一個開放、透明、能夠激發集體智慧的體系 。 CANN 所遭遇的系統性瓶頸 , 正是這種封閉模式走到盡頭的必然結果 , 這也使其后續的「全面開源」顯得順理成章 , 甚至可以說是一種必然 。
破壁與賦能
開源將為開發者帶來什么?
「開源是起點 , 而不是終點 。 」這幾乎是所有受訪者的共識 。
當華為宣布 CANN 將全面開源時 , 這不僅僅是一次技術策略的調整 , 更是一場深刻的生態理念變革 。 對于身處其中的開發者而言 , 開源的核心價值在于破壁與賦能 。
「破壁」意味著打破技術黑箱與信任壁壘 , 讓平臺變得透明、可控;而「賦能」則是在此基礎上 , 將創新的主動權從平臺所有者真正地交還到每一位開發者手中 。 這正是 CANN 全面開源所要講述的核心故事 。
技術破壁:從黑箱到透明的革命
對于長期與底層硬件和代碼打交道的開發者來說 , 一個黑箱系統是他們施展拳腳最大的障礙 。 CANN 的全面開源 , 首先帶來的就是一場透明度的革命 。
過去 , 這些底層機制只能依賴官方文檔的描述 , 開發者無法精確地進行自定義擴展 。 而開源意味著包括編譯器、運行時在內的核心組件代碼將完全可見;開發者可以直接洞察硬件的運行邏輯 , 從而進行更深層次、更精準的性能優化 。
這種透明度將直接解決過去開發中遇到的諸多頑疾 。 例如 , 過去在不同 CANN 版本間進行移植時 , 開發者常常會遇到 IR (Intermediate Representation) 生成不匹配的難題 , 開源之后 , 通過 fork 并修改底層代碼來加速迭代將成為可能 。 蘇統華教授也認為 , 開源的最大價值在于 , 當企業客戶在實際應用中遇到深層次問題時 , 不再需要等待華為數月甚至半年的版本更新 , 而是可以自己動手或借助社區的力量快速解決 。
從黑箱到透明的轉變 , 不僅是技術上的開放 , 更是賦予了開發者前所未有的自由度和掌控力 。
值得一提的是 , 華為此次所承諾的「全面開源」 , 其深度和廣度甚至超越了當前的行業領導者 。 英偉達 CUDA 雖然擁有龐大的生態 , 但其核心組件并未完全開放 。 我們認為 , 這背后是兩種截然不同的生態理念:英偉達更偏向于企業級用戶和商業價值 , 而全面開源后的 CANN 則能提供更大的探索和創新空間 —— 這正是 CANN 全面開源所要賦予開發者的核心價值 。
生態賦能:當使用者成為貢獻者
如果說技術透明是開源的「里子」 , 那么生態的賦能則是更具深遠影響的「面子」 。 CANN 的開源正在為整個國產 AI 生態注入新的活力 。
首先 , 開源為產學研的深度融合提供了前所未有的機遇 。 蘇統華教授將開源的生態形容為一個巨大的「問題寶庫」:「原來我們是看不到的 , 不知道它好與壞;現在一測就能知道 , 比如這個內存消耗特別大 , 我給它做一個改進 —— 那可能就能發一篇論文 , 就是一個成果 。 」 開源讓高校的研究者能夠直面產業的真實痛點 , 將解決實際問題轉化為科研成果 , 從而形成良性循環 。
陳昀博士所在的團隊正是這一模式的積極踐行者 。 作為高校研究者 , 他們不受短期商業壓力的束縛 , 得以專注在更高質量、更具前瞻性的算法開發上 , 并將這些高質量的算子原型通過開源社區貢獻給 CANN , 為整個昇騰「大廈」添磚加瓦 。
陳昀博士在華為全聯接大會做了主題為「讓昇騰算子開發便捷 10 倍 , 我與 CATALASS 成長之路」的開發經驗分享
其次 , 開源是培養下一代開發者的最佳土壤 。 正如陳昀博士所言:「我們以前用 CUDA 可能只是一個單純的使用者 , 但現在 CANN 開源 , 我們可以從使用者轉化為一個貢獻者 。 」這種身份的轉變可為青年開發者提供黃金機遇 , 讓他們能夠在真實的、世界級的項目中鍛煉自己 , 其成長遠非封閉開發所能比擬 。
更重要的是 , 要讓一個生態真正繁榮 , 創新力量必然源自社區 。 李秀紅先生以 CUDA 生態中的 FlashAttention 為例 , 指出很多革命性的工具并非由英偉達官方規劃 , 而是第三方開發者基于開放平臺創造出來的 。 CANN 的開源 , 正是希望改變過去社區問題高度依賴少數官方專家的模式 , 讓更多外部力量能夠參與進來 , 最終形成一個自生長的、充滿活力的創新社區 。
降低門檻:讓高性能計算觸手可及
除了技術透明和生態賦能 , 降低開發門檻 , 讓更多人能夠輕松利用強大的算力 , 是開源帶來的最直接的紅利 。
對于深入底層的性能優化專家而言 , 像 CATLASS 這類算子模板庫的出現 , 堪稱 Game Changer 。 它將開發門檻「從硬件專家級直接降到了模板調參級」 , 過去可能需要一個多月才能手動寫出的內核 , 現在利用模板庫「可能一周多就可以組裝一個高性能矩陣層了 , 效率提升至少 5 到 10 倍」 。 而全面開源無疑將加速這類高效易用工具的誕生和迭代 。
與此同時 , 更高層次的易用性探索也在同步進行 。 蘇統華教授的團隊正在構建一套昇騰算子的 Python 編程體系 , 致力于讓開發者能更便捷高效地調用昇騰算力;其中不僅包括前端 AsNumpy , 還有作為后端的高性能 Ascend C 算子庫 OpenBOAT , 以及用于算子性能評測的便捷工具 AscOpTest 。 對于大量習慣使用 Python 的 AI 算法工程師而言 , 這意味著他們無需深入學習 C++ 或復雜的硬件知識 , 就能直接享受到昇騰 NPU 帶來的強大算力 。
蘇統華教授在華為全聯接大會的「CANN 全面開源開放」技術分論壇上分享了「校企協同 , 開源賦能」的核心理念
除了在開源工具上身體力行 , 蘇統華教授同樣致力于開發者知識體系的構建以及更基礎的人才培養工作 。 作為國內最早開展 GPU 計算教學的學者之一 , 他將豐富的經驗帶到了昇騰生態的建設中 。 他的團隊不僅編寫了國內第一本關于 Ascend C 的教材 , 還陸續推出了多本圍繞 CANN 的著作 , 填補了系統性學習資料的空白 。 比如去年他與華為昇騰技術專家陳仲銘(B 站知名 AI 科普 UP 主 ZOMI 醬)合著的《AI 系統》一書 , 其中專門對 CANN 進行了系統性介紹 。
無論是為專家打造的底層算子模板庫 , 還是為大眾鋪設的上層 Python 編程接口 , 其背后都離不開一種高效的創新模式 —— 產學研的深度協同 。 正是通過這種緊密的校企合作 , CANN 生態得以將學界的理論創新與產業界的真實需求相結合 , 共同打造出真正能降低開發者入門門檻的實用工具和系統性教材 。 這不僅加速了前沿技術的普及 , 更形成了一個良性循環:高校為生態注入創新活力與新生力量 , 企業則為學術研究提供寶貴的實踐土壤和資源 。 這一模式 , 正是 CANN 生態能夠讓頂尖專家和算法新人都能各取所需 , 最終實現「讓一線開發者可以聚焦算法 , 而不是去聚焦底層調優」這一共同目標的關鍵 。
構建最大公約數
CANN 的生態戰略與未來展望
如果說打造一系列強大的開發工具是 CANN 在「術」層面的精進 , 那么全面開源則是一場「道」層面的系統性變革 。 這并非一次孤立的技術發布 , 而是一場深刻的生態戰略選擇 。 其最終目標是要將李秀紅先生所說的「為開發者構建最大公約數」從一種工具層面的追求上升為整個生態的指導哲學 , 讓開發者能夠聚焦于應用創新本身 。
這種戰略選擇的背后是一種對生態邊界的清晰認知 。 也就是說 , 平臺方的核心任務是提供穩定、高效且值得信賴的底層能力 , 而非試圖包攬上層應用的一切 。 只有這樣 , 才能為社區的「原生創新」留出最廣闊的生長空間 。
正是基于這種「有所為 , 有所不為」的理念 , 華為圍繞 CANN 展開了一系列系統性的生態建設布局 , 其核心思想清晰而堅定:將生態的主導權交還給開發者 。
這一戰略體現在多個層面 。 首先是更敏捷的架構:針對開發者反映的軟件包臃腫、迭代緩慢等問題 , CANN 正在進行徹底的「分層解耦」 。 這一理念具有雙重含義:
組件的解耦 。 這直接回應了開發者長期以來對「軟件包過于龐大和耦合」的關切 。 CANN 將過去的大軟件包拆分為 20 多個更細顆粒度的組件包 , 允許開發者按需更新 , 甚至圍繞某個特定的小組件進行創新和修復 , 極大地提升了開發的靈活性與敏捷性 。 開放策略的分層 。 CANN 根據不同層級的特性采取了差異化的開放模式 。 對于需要最大化創新自由度的運行時/驅動、編譯器和編程語言(如 Ascend C) , CANN 將進行徹底的全量代碼開源 。 而對于需要承上啟下、保持長期穩定性的虛擬指令集 , 則選擇開放接口 。 這種設計 , 既通過接口的穩定性保護了上層生態的兼容性 , 又通過核心組件的代碼級開放 , 為社區的深度定制和創新提供了最廣闊的空間 。
CANN 的多層架構示意圖 , 其中不同的層級有不同的開源策略
其次是更開放的姿態:為了最大程度降低開發者的遷移成本 , CANN 團隊在適配 PyTorch、TensorFlow、vLLM 等主流 AI 框架和加速庫上投入了巨大精力 , 力求實現「零感知」遷移 。 同時 , 通過成立 CANN 技術指導委員會 , 吸納來自高校、企業的外部專家共同決策 , 標志著 CANN 正從企業主導走向真正的社區共治 。 目前 , 該委員會共有 26 位成員 , 包括蘇統華教授與華南理工大學陸璐教授兩位高校學者以及多位來自華為、訊飛、移動等企業的研究者 。
在華為全聯接大會 2025 期間 , 華為昇騰計算業務總裁張迪煊宣布正式成立了「CANN 技術指導委員會」 , 為后面 CANN 的全面開源和社區化運作奠定了基礎 。
最后是更系統的人才培養:華為深知生態的根基在于人 。 為此 , 華為實施了一系列舉措 , 包括通過鯤鵬昇騰科教創新孵化中心等平臺與國內 16 所頂尖高校合作 , 提供算力資助支持高校課題組老師開展科研創新研究 , 開設鯤鵬昇騰相關課程推進基于國產技術路線的完整人才培養體系 。 與此同時 , 華為還通過舉辦 CANN 訓練營、昇騰 AI 原生創新算子挑戰賽等一系列開發者活動和昇騰開發者計劃等激勵活動 , 將生態的觸角從高校延伸至更廣泛的開發者社區 , 加速人才的聚集與成長 。
昇騰 AI 原生創新算子挑戰賽 S7 賽季即將開賽
至于未來 , CANN 當前階段的重要任務是對標 CUDA , 補齊功能短板 。 但所有受訪者都清醒地認識到 , CANN 的終點并不僅僅是成為一個替代品 。 國產 AI 生態要想真正繁榮 , 必須擁有自己的「原生創新」能力 。 正如我們所采訪的專家們普遍認為的 , 當下一個類似 FlashAttention 的革命性創新誕生于 CANN 生態時 , 它才能真正從追趕者變為引領者 。
CANN 詳細的開源計劃已在華為全聯接大會公布:
9 月底 , CANN 全量算子將開源到 GitCode 社區; 12 月底 , 領域加速庫、圖引擎、Ascend C、MindIE 等軟件代碼也會陸續上倉 , 完成昇騰軟件開源開放 , 全球共享 , 共同定義技術標準和發展方向 。華為還承諾「將每年投入 1500P 算力和 3 萬片開發板 , 與全球開發者共創、共享昇騰開源生態 。 」
藍圖已經繪就 , 資源也將到位 , 這座屬于國產 AI 生態的「宏偉大廈」 , 正等待著開發者社區添磚加瓦 。
新篇章
將與開發者共同書寫
從需要手動調優的「拓荒時代」 , 到即將全面開源的「共建時代」 , CANN 的演進之路正是國產 AI 基礎軟件自立自強的一個縮影 。
CANN 的全面開源 , 不僅是代碼的開放 , 更是發展模式和創新機會的開放 。 這背后 , 我們看到的是一種深刻的理念變遷:國產基礎軟件的競爭 , 正從過去單純追求技術指標的對標 , 轉向構建一個開放、透明、值得信賴的開發者社區 。 這不再僅僅是華為一家的戰略 , 更是整個行業走向成熟的標志 。 它將評判標準從「我們能做出什么」 , 轉向了「開發者愿意用我們創造什么」 。
而這座「大廈」能否真正建成 , 最終取決于開發者的選擇 。 一個繁榮的生態應是何種模樣?李秀紅先生指明了平臺方的根本任務:「你只要把你基礎軟件做好 , 第三方的創新就能基于這些基礎軟件生長出來 。 」蘇統華教授則給出了一個質樸而深刻的答案:「越多人去想辦法(貢獻) , 這個生態就越快繁榮起來 , 就容易做大 。 」而如何讓更多人愿意參與進來?陳昀博士指明了路徑:「真的需要去構建一個開發者友好的社區 , 要去完善很多的文檔以及教程 , 還有一些示例倉庫 , 讓全球開發者零門檻上手…… 形成雪球效應 。 」
【「從追趕者到引領者,路有多遠?」 我們和CANN一線開發者聊了聊】這正是所有生態建設者共同努力的方向 。 當底層的「磚塊」經由千萬開發者之手共同打磨 , 當創新的思想在這片開放的土壤上自由生根發芽 , 屬于國產 AI 生態的「宏偉大廈」終將拔地而起 。 而這座大廈的未來 , 正由像蘇統華教授、李秀紅先生、陳昀博士這樣的開發者們書寫著 。
推薦閱讀
- 純視覺VLA方案從有限數據中學到強大的空間泛化能力
- 面對開不完的會,我們距離「信息自由」還有多久?
- 8000mAh!剛公布這頂配直屏,可能是米粉最愛的「MIX」手機
- 從自研架構統一到生態軟件完善,驍龍高調秀“肌肉”
- 拆解新 iPhone 的「高原」設計,以及「可替換電池」的線索
- iOS 26.1 隱藏彩蛋曝光,蘋果給 ChatGPT 們造了個新「C 口」
- 榮耀放大招!羅巍親曝AiMAGE“絕密項目”即將登場:從未見過,甚至不敢想
- Meta最新研究RecoWorld,從「猜你喜歡」到「聽你指令」
- 168 元一年的「小紅卡」,是小紅書打破本地生活紅海的鑰匙
- 估值840億AI實驗室再放大招,他們要給大模型戴上「緊箍咒」
