AI數據中心上天,與其說黑科技不如說是作秀

AI數據中心上天,與其說黑科技不如說是作秀

文章圖片

AI數據中心上天,與其說黑科技不如說是作秀

文章圖片

AI數據中心上天,與其說黑科技不如說是作秀

文章圖片


要說講故事的能力 , 還得看硅谷的創投圈 。 最近 , 英偉達支持的太空計算初創公司Starcloud就創造了歷史 , 首次在太空軌道上成功訓練并運行了人工智能模型 。



根據CNBC的相關報道顯示 , 基于H100加持的Starcloud-1衛星 , Starcloud方面成功在太空運行了谷歌的開源模型Gemma , 并用莎士比亞全集訓練的NanoGPT , 向地球發送了一段莎士比亞風格的消息 , “地球人 , 你們好!或者用我更喜歡的方式來說——你們是一組由藍色和綠色構成的迷人集合體 。 讓我們看看 , 從這個角度觀察你們的世界 , 會發現哪些奇妙之處 。 ”
Starcloud CEO Philip Johnston表示 , “太空AI”并非噱頭 , 該公司的目標是實現軌道數據中心能源成本比地面數據中心低10倍 。 據稱 , Starcloud-1在軌運行旨在驗證構建太空數據中心的可行性 , 特別是那些需要大型計算集群的模型 。


【AI數據中心上天,與其說黑科技不如說是作秀】
其實在太空部署AI這件事 , Starcloud只是率先行動的那一個 。 谷歌CEO桑達爾·皮查伊此前在接受福克斯新聞的采訪時就曾表示 , 谷歌即將開始建設太空人工智能數據中心 , 計劃于2027年初邁出建設的第一步 , 并且他表示 , “我們的遠大目標之一是有朝一日在太空建立數據中心 , 以便更好地利用太陽能 。 太陽的能量是當今地球全部產能的100萬億倍 。 ”
擁有SpaceX的馬斯克同樣也對太空AI數據中心情有獨鐘 , 他曾明確表示 , 將擴大了高速激光鏈路的星鏈V3衛星規模 , 并在4到5年內通過星艦完成每年100吉瓦(GW)的數據中心部署 。
那么問題就來了 , 為什么這些硅谷的公司會將視線投向太空呢?



事實上 , 這些硅谷初創企業、科技巨頭仰望星空的原因很簡單 , 那就是為了解決能源問題 。 在這一輪的AI競賽中 , 太平洋兩岸所面臨的挑戰截然不同 。 國內的情況想必大家都知道 , 半導體產業、特別是先進制程和GPU設計的落后 , 使得國內AI廠商被算力卡了脖子 , 而在大洋彼岸則是由于基礎設施投入不足 , 因為美國缺電 。
“如果你無法提供足夠的電力 , 那么即使擁有大量芯片 , 也只能讓它們閑置在倉庫里” , 桑達爾·皮查伊此前在播客節目中 , 是這樣解釋建設太空數據中心的必要性 。 如果以為AI只是代碼、算法、模型那就大錯特錯 , 因為它其實還是一個名副其實的“電老虎” 。
ChatGPT每天響應2億次的請求 , 就需要消耗50萬千瓦時電力 , 相當于一座美國小城一天的用電量 。 根據美國能源信息署(EIA)的測算 , 2030年全球AIDC(AI數據中心)的電力需求將達347GW 。 一旦沒電 , 這些科技巨頭花費萬億美元訓練的AI模型、建設的AI數據中心 , 就只能成為一堆廢鐵 。



關注科技行業動向的朋友想必對今年春季一眾美國科技巨頭投資建設核電站有印象 , 此事的根源就是美國的電網還是上個世紀的“老古董” , 所以他們不得不盯上核電 。 可無論是建設新的核電站 , 還是重啟已經關閉的舊核電站 , 都需要面臨環保這個難題 。
因此這些科技巨頭就將目光投向了太空 。 由于沒有云層的遮擋 , 部署在太陽同步軌道上的太陽能電池板單位面積發電量是地面的5倍 , 比如一平方米的砷化鎵太陽能電池在太空中可輸出300W電力 , 可在地面最多就只有60W 。
看到這里 , 可能有的朋友就會產生一個疑問 , 那就是太空AI數據中心如此之好 , 為何國內廠商沒有跟進呢?其實這不是因為國內的航天實力不足 , 而是太空AI數據中心存在散熱和抗輻射這兩大幾乎無解的難題 。
其中 , 地球軌道附近的太空平均溫度是零下120℃ , 可太空接近完美真空 , 但熱量主要通過輻射傳遞 , 而不是空氣對流或介質傳導 。



因為傳熱效率低下 , 就使得太空中的衛星不僅有太陽能電池板 , 還有用于散熱的專用輻冷板 。 1GW水平的太空數據中心 , 輻冷板面積就將達20萬平方米 , 重量超過1000噸 , 即便按照SpaceX星艦單次發射載重150噸計算 , 就意味著需要10次發射才能湊齊這一套散熱系統 。
而太空AI數據中心最致命的挑戰 , 則是高能粒子帶來的單粒子翻轉 , 也就是受到宇宙射線照射所引起電子元器件的電位狀態跳變 , 將“0”變成“1”或是“1”變成“0” 。 雖然單粒子翻轉不會讓芯片在物理層面造成損害 , 卻會引發以二進制存儲的數據變化 , 進而導致計算錯誤 。
盡管在個人電腦和手機上單粒子翻轉無傷大雅 , 可對于進行矩陣乘法的GPU而言 , 微小的錯誤就足以讓計算結果謬以千里 , 這也是為什么宇航級芯片使用的是并非2nm這種先進制程 , 而往往是90nm、130nm這樣的“落后制程” 。



總而言之 , 在散熱與電磁防護這兩大難關被攻克前 , 類似Starcloud這樣的太空AI數據中心更多還只是作秀 , 并沒有太多實際意義 。

    推薦閱讀