AWS雷尼爾人工智能超級集群正式上線運行

AWS雷尼爾人工智能超級集群正式上線運行

AWS雷尼爾項目正式投入運行 , 與Stargate展開競爭
就在山姆·阿爾特曼的Stargate項目剛剛開始向遙遠的AI驅動世界開啟門戶之際 , 亞馬遜的競爭性AI計算力山峰已經投入運營 。
【AWS雷尼爾人工智能超級集群正式上線運行】亞馬遜云服務今天宣布 , 其與Stargate競爭的AI\"超級集群\"雷尼爾項目現已正式運行 , 在多個數據中心部署了\"近50萬塊\"Trainium2芯片來為這個龐大的機器提供服務 。 AWS并未透露雷尼爾項目究竟涵蓋多少個數據中心以及實際提供多少計算能力 , 但AWS在新聞稿中向公眾保證 , 這臺機器是\"世界上最大的AI計算集群之一\" , 并且在創紀錄的時間內上線 。
\"雷尼爾項目現已全面投入運營 , 距離首次宣布不到一年時間 , \"AWS表示——而且它并不止步于這50萬塊Trainium2芯片 。 該集群已經被亞馬遜的AI合作伙伴Anthropic使用 , 該公司表示將擴展\"到超過100萬塊Trainium2芯片——用于包括訓練和推理在內的工作負載——到年底\" 。
根據我們夏季從AWS員工那里了解到的雷尼爾項目預覽信息 , 承載該項目的每個數據中心都將非常龐大 。 AWS發言人在7月告訴我們 , 印第安納州的一個站點現在作為雷尼爾集群的一部分已部分上線 , 最終將跨越30棟數據中心建筑 , 每棟占地20萬平方英尺 。
我們聯系了AWS以獲取更多關于雷尼爾集群的信息 , 包括目前涵蓋多少個數據中心 , 以及到年底將有多大規模 , 但沒有收到回復 。
AWS正與OpenAI及其合作伙伴Oracle和軟銀之間的Stargate合資項目展開AI容量競爭 。 截至本月早些時候 , OpenAI支持的德克薩斯州阿比林數據中心的Stargate計算力約為200兆瓦 , OpenAI合作伙伴的承諾計劃到2026年中期將德克薩斯州Stargate數據中心擴展到1.2吉瓦容量 。 Oracle預計在未來四年內幫助增加5.7吉瓦容量 。
亞馬遜的物流專長確實幫助它快速建設 , 但它也擁有硬件優勢 。
\"與大多數其他云提供商不同 , AWS構建自己的硬件 , 因此能夠控制技術棧的每個方面 , 從芯片的最小組件 , 到運行其上的軟件 , 再到數據中心本身的完整設計 , \"AWS在新聞稿中表示 。
現在 , 如果這家云計算巨頭能夠解決最近出現的那些可靠性問題 , 一切就會很完美了 。
Q&A
Q1:AWS雷尼爾項目是什么?有多大規模?
A:雷尼爾項目是AWS的AI\"超級集群\" , 目前已部署近50萬塊Trainium2芯片 , 跨越多個數據中心 。 AWS稱其為\"世界上最大的AI計算集群之一\" , 計劃到年底擴展到超過100萬塊芯片 。
Q2:雷尼爾項目與OpenAI的Stargate有什么競爭關系?
A:兩者都在爭奪AI計算能力的領先地位 。 Stargate目前在德克薩斯州有200兆瓦計算力 , 計劃到2026年中期擴展到1.2吉瓦 。 而雷尼爾項目已經投入運營 , 在建設速度上領先 。
Q3:AWS在AI硬件方面有什么優勢?
A:AWS構建自己的硬件 , 能夠控制從芯片組件到軟件再到數據中心設計的整個技術棧 。 這種垂直整合讓AWS在建設速度和技術控制方面具有優勢 , 不依賴外部硬件供應商 。


    推薦閱讀