
文章圖片

文章圖片

英偉達曾經的壁壘 , 正在一個個消失?
“逢山開路 , 遇河搭橋” , 中國的硬科技公司這幾年都生出了這番本事 。
8月5日 , 華為輪值董事長徐直軍在會上宣布華為昇騰硬件使能CANN全面開源開放 , Mind系列應用使能套件及工具鏈全面開源 , 支持用戶自主的深度挖潛和自定義開發 , 加速廣大開發者的創新步伐 , 讓昇騰更好用、更易用 。
同時 , 徐直軍強調:華為AI戰略的核心是算力 , 并堅持昇騰硬件變現 。
其中 , 最值得關注的是CANN開源的消息 。 CANN的全稱是“神經網絡異構計算架構”(Compute Architecture for Neural Networks) , 它的角色 , 是把上層AI訓練框架(如PyTorch、TensorFlow、MindSpore等)和底層昇騰芯片連接起來的橋梁 , 讓開發者不用關心芯片細節就能調用底層算力 。
與CANN作用類似的 , 還有英偉達的CUDA、AMD的ROCm、摩爾線程的MUSA以及寒武紀的Neuware等等 。 但最知名和影響力最大的還是CUDA , 它與英偉達的硬件產品構成了企業的核心護城河 。
華為在這個時間點 , 選擇開源CANN , 旨在跨過英偉達已經修建了18年之久的護城河 —— CUDA 。 那么 , 英偉達的CUDA是如何發展起來的呢?華為作為挑戰者 , 又將面臨哪些機遇和困難?
1
CUDA帶來的改變
【華為開源CANN,要跨過英偉達又一條護城河?】英偉達的CUDA(Compute Unified Device Architecture)是其統一計算設備架構的簡稱 。 它讓開發者能夠利用英偉達GPU的并行計算能力 , 來處理圖形渲染之外更廣泛的計算任務(即GPGPU , 通用圖形處理器計算) 。
在CUDA出現之前 , 幾乎所有計算任務都完全依賴CPU 。 科學家和工程師們早就發現了GPU的巨大計算潛力 , 相比于CPU擅長處理復雜任務 , GPU則擅長簡單的批量工作 。
簡單來說 , CPU就像一個頂級大廚 , 煎炒烹炸樣樣精通 , 能做佛跳墻(處理復雜任務) 。 但他一次只能專心做一道菜(串行處理 , 核心數量少但很強) 。 你讓他同時做50道菜 , 他會一道一道地做 , 雖然每道都做得很快很好 , 但總時間會很長 。
而GPU就像是一群訓練有素的幫廚小弟 , 每個小弟可能只會切菜 , 或者只會顛勺(處理簡單、重復的任務) 。 但他們人極多(擁有成千上萬個核心) 。 你讓他們把50斤土豆全部切成絲 , 他們一人負責幾個土豆 , 同時開切 , 一瞬間就完成了(并行處理) 。
現在 , 你想讓那一群幫廚小弟(GPU) 去幫你做一道新菜 , 油燜大蝦 。 你沒法直接對他們下指令 , 因為他們只懂基本的廚房行話(圖形指令) 。 這個時候 , 你需要一位“翻譯官” , 將這道新菜拆解成更為簡單的步驟讓幫廚小弟可以理解并執行 。
這個“翻譯官”就是CUDA!
(圖源:英偉達官方博客)
在CUDA誕生前 , 想用 GPU 做通用計算得繞過圖形API(如 OpenGL) , 把計算問題“偽裝”成圖形渲染問題 , 極其麻煩和低效 。 CUDA的革命性在于它允許開發者直接用類C的語言(后來支持C++、Fortran、Python等)來編寫在GPU上運行的代碼(稱為內核 kernel) 。 英偉達也為其GPU設計了相應的硬件架構來支持這種計算模式 。
總的來說 , CUDA的核心價值在于 , 通過軟硬件協同設計 , 將GPU變成了一個大規模并行數據計算的強大處理器 , 而不僅僅是圖形加速卡 。
2
英偉達的CUDA護城河
2006年 , 英偉達正式發布了CUDA架構 , 并在2017年推出了CUDA SDK 1.0 。 GeForce 8800 GTX(G80 芯片)是首款支持CUDA的GPU , 首席科學家David Kirk將其視為異構運算新時代的開始 。
在隨后的幾年里 , 英偉達陸續推出了Tesla產品線(計算卡) , 并持續更新Fermi、Volta、Maxwell等架構 , 不斷提升雙精度性能、引入統一內存等特性 , 并大力在高校和科研機構中推廣CUDA 。
在科研領域 , 尤其是深度學習的相關研究 , 需要大量的矩陣運算 , GPU的并行特性非常適合 。 于是在2017年 , 英偉達在Volta架構中引入了Tensor Core , 專門用于加速AI訓練和推理中的混合精度矩陣乘加運算 。 此后的Ampere、Hopper、Blackwell架構不斷強化Tensor Core和AI性能 。 CUDA生態也日益龐大 , 圍繞它構建了cuDNN、TensorRT、CUDA-X等眾多加速庫和工具 , 形成了深厚的軟硬件生態護城河 。
(原創:據公開資料整理)
CUDA的成功 , 不僅在于技術本身 , 更在于其構建的龐大生態系統 。 數百萬開發者、大量的學術研究、商業應用都基于CUDA , 這種網絡效應和遷移成本使得其他廠商難以在短期內撼動其地位 。
相關從業人士也表示 , “CUDA生態系統埋藏著巨大的遷移成本 , 它充當PyTorch和英偉達GPU之間的橋梁 。 從CUDA遷移的開發者通常必須重寫大量代碼 , 被迫使用不太成熟的替代庫 。 此外 , 開發者還會失去圍繞CUDA發展起來的龐大故障排除社區的支持 。 ”
野村證券近期發布的報告顯示 , 目前英偉達GPU占AI服務器市場80%以上市場份額 。 然而近年來 , 隨著中美摩擦的升級 , 美國對中國實施了嚴格的AI限制措施 , 英偉達在中國的市場份額持續下滑 。
“美國針對中國的AI出口管制是失敗的 。 ”據路透社、法新社等媒體5月21日報道 , 英偉達公司首席執行官黃仁勛當天在臺北國際電腦展上表示 , 英偉達在中國的市場份額已經從美國前總統拜登剛上任時的95%下滑到了目前的50% 。 對于美國實施的AI限制措施 , 黃仁勛再次直言 , 美國這項策略“完全錯誤” , “如果限制令的目標是確保美國保持領先 , 那么按照目前的規定來看 , 這反而會導致我們失去領先地位” 。
在美國的限制令下 , 中國芯片廠商得到了發展的空間 。 其中 , 華為昇騰無疑抓住了這個機會 。
3
華為的機會和挑戰
昇騰(Ascend)芯片是華為(海思)自研的、專門面向高性能AI計算的NPU(神經網絡處理器)芯片 。昇騰芯片是一個大系列 , 主要包括昇騰310和昇騰910兩個子系列 。
在2018年的華為全聯接大會上 , 華為輪值CEO徐直軍首次闡述了他們的AI戰略 , 并正式公布了昇騰910和昇騰310兩款AI芯片 。 當時 , 實體展示的 , 是昇騰310 。一年后 , 2019年8月 , 華為又正式推出了昇騰910 。
除了硬件之外 , 華為也致力于構建昇騰計算產業生態 , 包括圍繞著昇騰計算技術和產品體系所開展的學術、技術、公益及商業活動 , 產生的知識和產品以及各種合作伙伴——主要包括原始設備制造商OEM、原始設計制造商ODM、 獨立硬件開發商IHV、咨詢與解決方案集成商C&SI、獨立軟件開發商ISV、云服務提供商XaaS等 。
而CANN , 則是最基礎的昇騰計算軟硬件體系中的核心之一 。
(圖源:昇騰計算產業發展白皮書)
然而 , 相較于CUDA , CANN在開發者規模、架構成熟度和生態完善度方面 , 均存在差距 。 這在很大程度上影響到昇騰芯片的易用性 , 用戶在生態路線選擇上更傾向于前者 。
為了擴大生態圈 , CANN逐步兼容了更多AI框架 。 截至目前 , CANN已支持包括PyTorch、MindSpore、TensorFlow、飛槳、ONNX、計圖、OpenCV和OpenMMLab等深度學習框架與第三方庫 。
為了縮小差距 , 讓客戶適應新生態 , 據去年9月外媒的報道 , 華為效仿英偉達最初推廣CUDA的策略 , 向百度、科大訊飛和騰訊派遣了工程團隊 , 幫助他們在CANN環境中重現和優化現有的基于CUDA的訓練代碼 。
同時 , 華為也在與高校積極合作 。 例如 , 西北工業大學的徐韜教授及其課題組 , 將昇騰CANN等專項課程融入教學體系 , 高校開發者得以直面昇騰處理器優化的實際需求 , 系統掌握從算法設計到硬件適配的全鏈條技能 。
為了進一步加速生態的建構 , 華為表示 , 來自AI領軍企業、伙伴、高校與科研機構的代表共同探討了如何更好地構建開源開放的昇騰生態 , 共同發起了《CANN開源開放生態共建倡議》 , 以凝聚產業力量 , 共探AI邊界 , 共建昇騰生態 。
華為專家在接受媒體采訪時表示 , “我們堅持CANN實現分層深度開放 , 從最底層的算子開發層 , 到模型開發層、推理層 , 進一步兼容三方開源框架 , 讓運行在三方框架、推理引擎上的模型/應用遷移至昇騰無需修改 。 面向應用開發層 , 我們將面向應用開發提供更多SDK , 讓應用部署更便捷 , 模型訓練和推理更高效 。 ”
與之相對的 , CUDA實際上是閉源的 。 其編譯器NVCC、數學庫以及深度學習加速庫等 , 均僅以二進制庫形式提供 。 開發者無法修改底層邏輯 , 只能依賴英偉達的優化更新 。 此外 , CUDA僅支持英偉達GPU , 通過硬件指令集和驅動層實現軟硬件協同 。 由于CUDA與硬件深度綁定 , 加之英偉達通過EULA協議禁止其他硬件廠商直接接入CUDA接口 , 迫使其他廠商不得不開發獨立的生態體系 , 導致性能與易用性存在顯著差距 。
相比CUDA閉源 , 此次CANN開源 , 無疑是華為希望盡快擴大CANN生態圈的最新舉措 。 然而 , 想要挑戰英偉達通過技術先發、生態閉環和商業控制而形成的壟斷地位 , 華為還有很長的路要走 。
4
寫在最后
在美國實施技術封鎖的背景下 , 昇騰芯片的推出 , 為中國構建自主的AI計算基礎設施提供了重要的支撐 。 然而去年5月 , 中國工程院院士孫凝暉表示 , 華為走的中式封閉壟斷的路線 , 難以對抗西式的封閉壟斷 。 這番言論 , 當時在網絡上引發了巨大爭議 。
在孫凝暉院士看來 , 目前全球高水平的CPU設計、GPU設計、操作系統設計已經被美國所壟斷 , 中國要想在這些領域取得突破 , 就需要用開源模式去打破西方的生態壟斷 , 降低企業擁有核心技術的門檻 , 讓每個企業都能低成本地做自己的芯片 , 形成智能芯片的汪洋大海 , 滿足無處不在的智能需求 。 用開放形成統一的技術體系 , 我國企業與全球化力量聯合起來共建基于國際標準的統一智能計算軟件棧 , 形成企業競爭前共享機制 , 共享高質量數據庫 , 共享開源通用底座大模型 。 簡單來說 , 就是必須要依靠全產業鏈的共同發展 , 而非單純的依靠一兩家企業所構建的封閉體系 。
此次華為宣布“昇騰硬件使能CANN全面開源開放 , Mind系列應用使能套件及工具鏈全面開源” , 無疑是一次重大的戰略轉向 。 開源CANN是構建生態的正確且關鍵的一步 , 但開源之后的社區建設和運營能力將是更大的考驗 。 這需要華為持續投入 , 并真正以開放、透明、協作的方式與全球開發者社區互動 。
正如徐直軍在昇騰峰會所言:“開源不是終點 , 而是生態共建的起點 。 ”
推薦閱讀
- 格力“勁敵”進場!華為鴻蒙空調來了,比小米更難對付!
- 華為智慧屏 MateTV發布多項新技術,想讓用戶“像玩手機一樣玩電視”丨最前線
- 華為新品官宣:8月22日,全新開售
- 華為放棄高利潤,從1999元跌至1146元,256GB+一億像素+鴻蒙OS
- 中國百元機銷量榜更新:華為第五,OPPO第三,第一名遙遙領先
- 推動算力價值釋放 華為舉報xPN伙伴大會
- 華為擎云L540x體驗:自主創新生產力再進化,讓政企辦公更快更安全
- 華為在阿聯酋推出新品,可防竊聽,老外直呼wow!
- 2025年55-65寸電視推薦,華為智慧屏這兩款性價比高口碑好
- 華為史上哪代 Nova 手機最經典——對標藍綠廠而生的線下新星進化史
