任正非沒有吹牛:華為用384顆AI芯片集群,性能超過英偉達

任正非沒有吹牛:華為用384顆AI芯片集群,性能超過英偉達

文章圖片

任正非沒有吹牛:華為用384顆AI芯片集群,性能超過英偉達

大家記得不記得 , 在6月份的時候 , 任正非在受媒體采訪時表示 , 華為的單芯片是落后英偉達一代的 , 但通過群計算補單芯片 , 用數學補物理、非摩爾補摩爾、群計算補單芯片 , 這樣的話在結果上就能夠補上來了 。
這個意思 , 大家都懂的 , 那就是AI芯片上 , 其實并不是拼單顆芯片的算力的 , 可以多顆芯片一起上 , 一顆不行上2顆 , 上200顆 , 上2000顆 , 一樣能夠解決問題 。
話里話外 , 任正非的意思就是 , 我們根本就不需要美國的AI芯片 , 華為一樣可以滿足大家的需求 。

而近日 , 為了驗證任正非的說法 , 華為在上海的世界人工智能大會上 , 真正拿出了昇騰384超節點 , 其實之前就有了 , 只是華為一直沒有亮相出來 。
而這次正式亮相 , 而這明顯也就是之前任正非說的 , 用群計算補單芯片 。
這個昇騰384超節點 , 由384顆昇騰910C芯片 , 以及192顆鯤鵬CPU用一種叫總線的技術緊密地連在了一起形成一個整體 , 這么多芯片集群后 , 算力能達到300 PFLOPs 。
這個算力是什么概念 , 他已經達到了英偉達旗艦產品GB200 NVL72系統的兩倍!

而英偉達這個系統 , 也是集群的 , 由72個Blackwell GPU與36個Grace CPU通過NVLink-C2C技術集成 。
所以這就非常明顯了 , 對于華為而言 , 也許單顆昇騰芯片 , 是比不過英特爾的GB200 , 并這無所謂啊 , 我可以通過多顆來集群 , 這樣就不用擔心了 。
并且 , 華為的384節點的總內存容量 , 是英偉達方案的3.6倍 , 內存帶寬也達到了2.1倍 。

這樣在進行AI計算時 , 有更快的速度 , 更強的算力 , 更大的容量 , 能處理更大的AI模型 。
所以說 , 華為的AI芯片 , 其實不僅可以搞定中國市場需求 , 還能夠搞定全球的需求 , 這也是為何美國要對華為AI芯片打壓 , 最近又放開H20的原因 。
而從這個方案來看 , 目前華為的AI芯片實力 , 真不比英偉達差 , 也許在單顆高端芯片上遜色一點點 , 但這并不重要 , 因為AI芯片幾乎都不是靠單芯片比拼的 , 拼的都是集群 。
【任正非沒有吹牛:華為用384顆AI芯片集群,性能超過英偉達】所以說 , 任正非一向就是實事求是 , 不藏著掩著 , 也不吹牛 , 他承認單AI芯片性能不足 , 但也講出了華為彌補的技術 , 并且這個技術是華為已經實現的 , 不是PPT , 不是畫餅 。

    推薦閱讀