Pure Storage CEO詳解數據集管理策略與軟件棧發展

Pure Storage CEO詳解數據集管理策略與軟件棧發展

Pure Storage自2011年推出FlashArray以來已經走過了漫長的發展道路 。 公司擴展了全閃存存儲產品組合 , 推出了FlashBlade、用于無干擾升級的Evergreen Storage , 開發了Portworx和Pure Fusion等云原生解決方案用于混合云和多云環境 , 并引入了Pure1進行AI驅動的管理 。 公司于2015年成功上市 。
Charles Giancarlo于2017年擔任CEO , 我們在采訪的第一部分討論了AIOPS、AI數據 , 并探討了數據集管理概念 。 在第二部分中 , 我們將進一步探討這個話題 , 并討論現成SSD、軟件棧和copilot等內容 。
數據集管理的核心理念
當談到數據集管理理念時 , Giancarlo解釋了數據管理與數據集管理之間的區別 。 他表示 , 目前討論的數據管理通常指的是針對特定AI或分析引擎的特定數據存儲進行管理 。 但他們沒有管理的是數據集本身的生命周期 。
\"如果你試圖管理其中的每個數據位 , 我認為現在會失敗 。 但與此同時 , 如果你管理數據集 , 我們不一定知道每個數據集中的每一位數據 , 但如果我們能跟蹤數據集本身 , 包括它們在哪里、數據集生命周期管理如何進行、它們應該保持多長時間活躍、何時應該被刪除等問題 。 \"
這種通用化的數據管理方法意味著數據可能駐留在其他人的設備上 。 雖然目前還沒有達到這個程度 , 但隨著時間推移可能會實現 。
數據集生命周期管理的重要性
Giancarlo強調了數據集生命周期管理的重要性 , 不僅是為了避免在不需要的冗余副本上浪費存儲空間 , 還涉及合規性問題 。 那些由已離職員工創建但無人記得的副本會成為\"幽靈副本\" , 這是一個合規問題 。
\"很多這些副本最終會成為勒索軟件的一部分 , 因為它們被遺忘了 , 可能完全不為人知 。 所以它們不受持續安全措施的保護 , 比如密鑰輪換 。 這就像一個等待開放的后門 。 \"
因此需要生命周期管理:如果數據三個月沒有被觸及且無人擁有 , 就應該刪除它 。
FlashArray技術策略
在技術層面 , FlashArray//ST(FAST)使用現成的SSD 。 當被問及是否可以重新組織Pure DFM并使其成為SLC時 , Giancarlo確認這是可能的 , 速度會非???。
使用現成SSD的原因是客戶真正要求的是非常高的吞吐量 。 公司還構建了一些獨特的電子設備來卸載許多在常規產品中由Intel處理器處理的服務 , 這也降低了延遲 , 提高了整體性能 。 這對公司來說是一種更簡單的戰術性方法 。
軟件棧發展方向
Pure和Vast都在其存儲之上構建了非常全面和強大的軟件棧 。 Giancarlo認為 , Dell和HPE仍在做他所謂的\"全棧\"方案 , 這是一種垂直架構 。
\"虛擬化已經扁平化并使計算水平化 , 也使網絡水平化 。 存儲是唯一仍然服務于應用環境的東西 , 所以它是垂直的 。 我們說這也應該是水平的 。 現在 , 全棧是一個沒有意義的硬件概念 。 你想要的是可以用軟件創建的虛擬全棧 , 而不是任何物理全棧 。 \"
Copilot的應用
關于Copilot術語的使用 , Giancarlo澄清這不僅僅是微軟的術語 , 現在每個人都在將copilot用作其管理或運營平臺之上的AI層 。 之所以稱為copilot , 是因為大多數公司表示 , 他們還不想讓AI完全自主運行 , 必須有人工干預 。
公司保留使用不同大語言模型的權利 , 實際上在某些情況下會使用多個模型 , 因為它們各有其特色以及優點或缺點 。
【Pure Storage CEO詳解數據集管理策略與軟件棧發展】Q&A
Q1:Pure Storage的數據集管理與傳統數據管理有什么區別?
A:傳統數據管理通常指針對特定AI或分析引擎的特定數據存儲進行管理 , 而數據集管理是跟蹤數據集本身的生命周期 , 包括它們的位置、應該保持多長時間活躍、何時刪除等 。 這種方法不需要了解每個數據集中的每一位數據 , 但能有效管理整個數據集的生命周期 。
Q2:為什么FlashArray//ST要使用現成的SSD而不是自研芯片?
A:這是一個戰術性決策 。 客戶真正需要的是非常高的吞吐量 , 使用現成SSD能更快進入市場 。 同時公司構建了獨特的電子設備來卸載服務處理 , 降低延遲提高性能 。 對于相對小眾的專業化市場 , 使用現成技術比投入更多工程資源獲得輕微優勢更合理 。
Q3:Pure Storage的Copilot是基于微軟的技術嗎?
A:不是的 。 雖然使用了Copilot這個術語 , 但Pure Storage保留使用不同大語言模型的權利 , 實際上會使用多個模型 , 因為它們各有特色和優缺點 。 Copilot代表管理或運營平臺之上的AI層 , 強調需要人工干預 , 不讓AI完全自主運行 。


    推薦閱讀