黃仁勛回顧關鍵轉折:沒有GTX 580就沒有如今的NVIDIA!

黃仁勛回顧關鍵轉折:沒有GTX 580就沒有如今的NVIDIA!

快科技12月9日消息 , 在最近一期的Joe Rogan播客中 , NVIDIA CEO黃仁勛回憶了關于深度學習起源和公司命運的關鍵轉折點:深度學習的突破 , 始于2012年 , 依賴于兩張并非為AI設計的GTX 580顯卡SLI雙卡互聯配置 。
黃仁勛透露 , 當今AI的核心深度學習 , 其基礎網絡的首次運行使用的硬件 , 正是基于Fermi架構、擁有512個CUDA核心的高端游戲顯卡GTX 580 。
【黃仁勛回顧關鍵轉折:沒有GTX 580就沒有如今的NVIDIA!】雖然該顯卡最初是為頂級游戲而生 , 但其強大的并行計算能力 , 卻無意中成為了深度學習快速訓練的基石 。
2012年 , 來自多倫多大學的研究人員Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton , 利用一對3GB的GTX 580顯卡 , 訓練出了著名的AlexNet模型 。
這個擁有約6000萬參數的深度學習網絡 , 在當年的ImageNet圖像識別競賽中 , 以超越當時手動設計算法70%的驚人優勢脫穎而出 。
黃仁勛指出 , AlexNet的開發者通過優化算法 , 使其能夠在兩張GTX 580上并行運行 , 僅在必要時才交換數據 , 極大地縮短了訓練時間 , 這也使得GTX 580成為世界上第一款運行深度學習/機器學習AI網絡的顯卡 。
有意思的是 , 這一里程碑達成時 , NVIDIA在AI領域的投資微乎其微 , 大部分研發仍集中在3D圖形和游戲上 。
正是AlexNet在GTX 580上的成功應用 , 讓NVIDIA意識到深度學習的巨大潛力 , 黃仁勛表示 , 公司隨即在2012年將資金、開發和研究工作轉向深度學習技術 。
這一轉型最終催生了2016年的初代NVIDIA DGX超級計算機、具有首代Tensor核心的Volta架構 , 以及后續的DLSS技術 。

    推薦閱讀