
我們常說 , 現(xiàn)在很多人工智能項目程序考驗的是鈔能力 , 沒錢堆顯卡硬件 , 根本就無法訓(xùn)練哪怕稍微大一點的深度學(xué)習(xí)模型 。 特別是現(xiàn)在大模型越來越流行 , 越來越多了 。 雖然我們普通人能站在巨人的肩膀上 , 用很多大廠或高手開源出來的預(yù)訓(xùn)練模型 , 不過機智客覺得我們更多情況下 , 自己都是受制于自己的硬件條件的 。 比如同等型號類型(比如同為某型號的super或Ti)我們是10系列顯卡 , 那么有些要求20系列顯卡的應(yīng)用或深度學(xué)習(xí)項目就做不了 , 如果是20系列顯卡 , 肯定在某些項目中 , 比不上30系列顯卡 。
顯卡 , 不僅是那些廣大普通勞動人民游戲黨們心中的痛 , 也是我們廣大普通勞動人民調(diào)參俠AI愛好者心中的痛 。 不同的是 , 游戲界的兄弟姐妹們 , 面對顯卡桎梏 , 估計“沒的救” , 而對于深度學(xué)習(xí)愛好者們 , 估計還有得救 。 比如機智客看到報道的這個國產(chǎn)的名為Colossal-AI的項目 。 這貨 , 讓你的顯卡做原來做不了的事 , 訓(xùn)練原來訓(xùn)練不了的項目 。 沒錯 , 它是一個“加速器”:整合了多種深度學(xué)習(xí)并行方法的AI系統(tǒng) 。
【顯卡|讓你的2060顯卡當(dāng)3080用?這個國產(chǎn)AI加速項目有點猛】
這個項目在多維并行、大規(guī)模優(yōu)化、自適應(yīng)任務(wù)調(diào)度、消除冗余內(nèi)存等方面擁有獨特的功能優(yōu)勢 。 機智客看相關(guān)資料顯示 , 這個也就是說 , 在以往數(shù)據(jù)并行、流水并行、張量并行基礎(chǔ)上 , 添加了自研的2維/2.5維/3維張量并行方法 , 以及序列并行實現(xiàn) 。 而自研LAMB、LARS等大規(guī)模優(yōu)化器 , 解決了泛化誤差問題 。 通過演化算法 , Colossal-AI動態(tài)地優(yōu)化調(diào)度決策 , 提升GPU利用率 。 另外在消除冗余內(nèi)存方面 , 它使用zero redundancy optimizer技術(shù) , 通過切分優(yōu)化器狀態(tài)、梯度、模型參數(shù) , 使GPU僅保存當(dāng)前計算所需的部分 , 從而來消除數(shù)據(jù)并行、模型并行中存在的內(nèi)存冗余 。 同樣 , 在面對傳統(tǒng)大模型難以部署的問題 , 它也可以僅使用少量GPU資源實現(xiàn)低成本部署大模型 。
不僅如此 , 這個項目還既考慮到了現(xiàn)在讓很多人詬病的能耗問題 , 又顧及到了使用者的體驗問題也就是易用性問題 。 比如盡可能減少數(shù)據(jù)移動量 , 比如僅修改少量代碼 , 就能將已有的單機代碼快速擴展到并行計算集群上 。
回到現(xiàn)實測試環(huán)境 , 在同等情況下訓(xùn)練GPT-3 , Colossal-AI這貨能將訓(xùn)練速度提高10.7% 。 通過系統(tǒng)優(yōu)化 , 還能用比之前少幾十塊的GPU資源(比如從之前的128塊 , 降低到96塊)實現(xiàn)幾乎同樣的速度 。 要知道 , 這可是大模型啊 。
別的我們接觸的少 , 用我們以前用過的GPT-2來舉例子看看 , 據(jù)了解 , 研究人員僅用了256塊GPU , 耗時82.8小時就將15億參數(shù)的GPT-2訓(xùn)練完成了 , 而更大的GPU規(guī)模呢 , 豈不是四五十個小時就能搞定了 。 是不是比較卓越?最后回到標(biāo)題 , 當(dāng)然了 , 機智客說讓我們的2060顯卡當(dāng)3080顯卡用 , 面對本文提及的項目似乎并無意義 , 不過這樣的AI項目 , 的確是在降低我們的硬件成本和時間成本 。 雖然對單個的顯卡 , 而當(dāng)我們切換到生產(chǎn)環(huán)境中以后 , 類似這樣的AI項目就是在讓我們GPU資源的利用提升了一個高度 , 以往不能訓(xùn)練的 , 現(xiàn)在可以訓(xùn)練了 。 如此AI , 豈不快哉 。
相關(guān)經(jīng)驗推薦
- 蘋果|春節(jié)魔法師!榮耀Magic V這些功能讓你感受加倍快樂
- 英特爾|美光現(xiàn)在一下就讓我們知道了華為到底有多重要了!
- 顯卡|OLED系列怎么樣能把對方微信聊天記錄同步接收查看技術(shù)評測
- 李開新|排名世界50位的重大發(fā)明,中國當(dāng)仁不讓排在前六位
- CPU|華為處理器前10強,985竟落后980?第一名讓全世界“都慌”
- 顯卡|自拍無敵的三款手機,小姐姐用了都說愛,拍照堪比單反相機
- 顯卡|雷軍拉低了手機價格,奈何第五縱隊拒絕承認(rèn)
- 智能電視|智能電視讓有線電視步入淘汰路線,廣電損失慘重
- 顯卡|盧泰文要氣暈,三星Galaxy S22發(fā)布會PPT泄露
- 顯卡|新處理器+滿功耗RTX30顯卡,天選3來了,有沒有你想要的升級點?
