2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

文章圖片

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

文章圖片

2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中

文章圖片


智東西
作者 | 程茜
編輯 | 心緣
智東西8月26日報道 , 近日 , 谷歌母公司Alphabet風投部門CapitalG、英偉達正在洽談投資以色列AI基礎設施提供商VAST Data , 融資金額或達到數十億美元 , 或將成為以色列科技公司史上最大規模融資 。 這家創企的估值將躍升至300億美元(折合人民幣約2148億元) 。
這家被谷歌、英偉達爭著送錢的創企 , 到底什么來頭?
2016年成立的VAST Data已成為眾多大模型企業青睞的香餑餑 , 核心原因是傳統數據存儲架構無法滿足大模型訓練、推理的新需求 , VAST Data面向AI時代推出了統一數據平臺 , 將結構化和非結構化數據集成在一起 , 讓AI處理數據能更高效、更便宜 。
馬斯克旗下大模型創企xAI、獲英偉達39.6億美元投資的CoreWeave、全球頭部動畫公司迪士尼及其子公司皮克斯、美國電信巨頭威瑞森通信公司、視頻通話平臺Zoom等諸多全球知名企業都被這家創企列入客戶名單 。
值得一提的是 , 其與諸多客戶簽訂的都是5~7年的長期合同 ,隨之而來的就是年收入的爆炸式上漲 。 根據VAST Data官網的公開數據 , 截至2025年1月31日年度 , VAST Data營收同比增長3.6倍 。 這一營收增速甚至超過了英偉達和OpenAI 。 2025財年英偉達營收同比增長114% , 此前據彭博社報道 , OpenAI預計2025年收入將同比增長三倍至127億美元(折合人民幣約909億元) 。
據路透社援引熟悉財務狀況的匿名消息人士報道 , VAST Data聯合創始人、CEO雷寧·哈拉克(Renen Hallak)曾提到 , 該公司已經實現連續五年自由現金流為正 。 截至2025年1月 , 該公司ARR(年度經常性收入)達到2億美元(折合人民幣約14.3億元) , 預計明年ARR將增長至6億美元(折合人民幣約43億元) 。
與此同時 , 這家創企還與被曝新融資的兩家“金主”關系匪淺 , VAST Data將自家軟件平臺集成到了谷歌云上 , 英偉達創始人、CEO黃仁勛曾在GTC大會、臺北國際電腦展COMPUTEX等國際大會上多次為VAST Data送好評 , 稱其是大規模AI模型部署的關鍵推動者 。
在創投圈 , 這家創企也早已站到投資人的聚光燈下 , 此前共拿下5輪融資 , 融資總額達到3.81億美元(折合人民幣約27.3億元) , 彼時估值達到91億美元(折合人民幣約652億元) , 其中戴爾和英偉達連續多輪注資 。
VAST Data融資情況
AI驅動數據以前所未有的規模增長 , 這對數據處理的基礎設施提出了更高要求 , 使得構建數據處理AI基礎設施的VAST Data迎來發展機遇 。

一、手握10億美金訂單 , xAI、CoreWeave、迪士尼都是客戶VAST Data的四位創始人都在存儲領域積累深厚 。
CEO雷寧·哈拉克(Renen Hallak)、CTO沙查爾·芬布利特(Shachar Finblit)、營銷副總裁杰夫·登沃思(Jeff Denworth)和CTO阿隆·霍列夫(Alon Horev)共同于2016年創立了這家公司 。
VAST Data聯合創始人杰夫·登沃思(Jeff Denworth)(左一)、沙查爾·芬布利特(Shachar Finblit)(中)、CEO雷寧·哈拉克(Renen Hallak)(右二)
哈拉克曾在戴爾EMC推出的全閃存企業級存儲陣列XtremIO部門擔任研發副總裁 , 從項目啟動到實現超過10億美元的營收;芬布利特和霍列夫均曾在IBM等公司任職 , 登沃思在先進計算和大規??蓴U展的大數據和云存儲方面擁有超20年的技術經驗 。
彼時 , 哈拉克在XtremIO感受到了AI用于大規模分析的數據存儲挑戰 , 但在戴爾的部門沒有施展拳腳的空間 , 因此他決定離開從0開始打造一種新架構 。 后續 , 他與另外三位聯合創始人一拍即合 。
用一句話概括VAST Data的業務體系 , 就是將存儲、數據庫和容器化計算引擎服務統一為一個單一的、可擴展的VAST Data軟件平臺 , 并且該平臺從底層架構設計之初就專為現代數據中心和云中的AI、GPU加速工具而構建 。
具體來看 , 其能實現對電子郵件、日志、PDF文件和多媒體內容等非結構化數據的實時訪問 , 通過將非關鍵數據轉移到成本更低的閃存中存儲 , 然后使用速度更快、價格更高的閃存 , 讓GPU在模型訓練過程中能夠快速訪問大量數據 。
得益于AI相關需求的日益增長 , 眾多大模型相關企業、其他賽道頭部企業等紛紛向VAST Data拋來橄欖枝 , 除了開篇提到的大模型領域炙手可熱的xAI、CoreWeave等 , 還有英偉達投資的云計算基礎設施公司Lambda和阿聯酋AI公司G42子公司Core42 , 以及NASA、美國能源部、波士頓兒童醫院、旅游公司Booking Holdings等其他賽道企業 , 均是VAST Data的客戶 。
VAST Data部分客戶名單
且與許多依賴短期合同的軟件公司不同 , VAST Data會與客戶簽訂5至7年的長期合同 , 這使得公司的客戶流失率極低 , 累計軟件預訂量已超過10億美元(折合人民幣約716億元) 。
從融資層面看 , VAST Data此前累計融資金額已經超過3.81億美元 , 估值為90億美元 , 老虎環球、高盛等頂級投資機構 , 英偉達、戴爾等頭部公司均在其投資人之列 。 值得一提的是 , 此次曝出參與此輪融資的是Alphabet的獨立增長基金CapitalG , 該基金的投資目的是盈利 , 而不是戰略投資 , 這也在一定程度上說明投資者對VAST Data盈利能力的認可 。
那么 , VAST Data的產品到底有什么過人之處?

二、專為AI需求構建 , 自研分布式系統架構能夠低成本高效處理數據 , 一直是AI發展的命門之一 。
傳統的數據存儲依賴于分層 , 用低成本存儲方案處理長期存儲的數據 , 用高端方案存儲更常使用的數據 。
但數據管理的難點在于 , 傳統架構下 , 跨全球數據中心傳輸PB乃至EB規模的數據已變得愈發難以處理;傳統數據架構并非為滿足當今AI對海量、多樣化數據集和高性能隨機I/O的需求而設計;當下的解決方案成本過高 , 在管理和激活數據時 , 迫使企業需要在性能、規模、彈性和成本之間做取舍 。
因此需要構建為AI專門設計的數據處理架構 。
VAST Data的做法是消除傳統存儲的分層模式 , 將結構化、半結構化和非結構化數據存儲在一個地方加速數據檢索、降低模型訓練和推理成本 , 其最大的優勢就是能讓xAI、CoreWeave部署的數萬塊甚至數十萬塊GPU不會因等待存儲而閑置 。
他們是如何做到的?
該公司提出了首個分布式系統架構DASE(Disaggregated Shared-Everything) , 作為專為AI需求設計的專有框架 , 其將存儲、計算和數據庫層統一為一個單一的、全球一致的系統 , 且與堆疊不同工具的公有云提供商不同 , VAST的AI操作系統消除了性能折衷 , 支持實時分析、遞歸計算和無縫混合云操作 。
具體來看 , DASE的解耦(Disaggregated)支持將數據存儲和計算資源分離 , 可獨立靈活地擴展每個組件;共享一切(Shared-Everything)意味著數據可以在所有存儲節點之間訪問 , 同時為所有節點提供統一數據視圖 。
而依托這一架構構建的VAST Data Platform , 可以支持1萬個GPU集群 , 每秒處理量達TB級別 。
VAST Data Platform這一操作系統由諸多組件構成:
VAST DataSpace允許從邊緣到云、跨越數百個地點的數據訪問、交易和保護 , 類似于操作系統的全局資源管理器;VAST DataStore就是通用存儲平臺 , 堪比操作系統中的文件系統;VAST DataBase負責索引功能 , 可提供實時查詢、分析數據的多項功能 。 VAST DataEngine則扮演著動態計算和執行層的角色 , VAST InsightEngine是其內部的數據精煉工具 , 利用AI嵌入模型將原始非結構化數據轉化為具有上下文的數據 , 并將其作為RAG(檢索增強生成)工具 。
VAST Data AI操作系統架構
今年下半年 , VAST Data將補上數據處理AI操作系統核心服務的最后一塊拼圖 , AI Agent部署和編排系統VAST AgentEngine 。 這意味著VAST Data的平臺已經集成了接收數據、實時存入存儲以及向尋找信息的Agent提供數據的全流程能力 。
從具體的合作客戶來看 , 今年2月 , xAI官宣的搭載超過20萬塊英偉達GPU的超級計算集群Colossus , 其背后的數據平臺就由VAST Data打造 , 使得Colossus的AI工作負載的總擁有成本(TCO)降低了50%;2023年9月 , VAST Data與CoreWeave宣布達成戰略合作 , CoreWeave基于VAST Data的平臺構建了全球英偉達加速計算云 , 能夠管理和保護為生成式AI、高性能計算(HPC)和視覺特效(VFX)任務所需的大量數據 。
VAST Data從0開始為AI構建的系統 , 將存儲、數據庫和虛擬化計算引擎服務統一其中 。 這也說明 , 面對AI行業的新發展機遇 , VAST Data已經從最初的存儲公司定位 , 向著更廣泛的應用空間擴展 。

三、深度綁定谷歌、英偉達 , 新融資或為IPO信號此次被曝注資的兩家巨頭 , 都與VAST Data進行了深度綁定 。
首先是英偉達 , 今年3月 , VAST Data獲得英偉達認證存儲資質 。 黃仁勛曾在GTC大會、臺北國際電腦展COMPUTEX的主題演講中提到VAST Data 。 他認為 , AI時代數據是驅動行業的原材料 , 英偉達正與全球存儲頭部一起 , 構建新一代的企業基礎設施 , 企業需要其在混合數據中心中部署和擴展AI Agent 。 VAST Data就是與英偉達合作的企業之一 。
2024年底 , 黃仁勛與哈拉克一起錄制了一段關于AI未來的十分鐘播客 , 黃仁勛談到他曾在法國巴黎的VivaTech大會上提到的實現模型持續改進的數據飛輪(data flywheel) , 當下擴展企業AI、從訓練轉向實時推理的轉變 , 對VAST Data來說是一個絕佳的機會 。 他對于此前和VAST Data的合作感到非常自豪 。
黃仁勛與哈拉克錄制AI播客
去年9月 , VAST Data還與英偉達合作構建了實時RAG工具InsightEngine , 可以利用NIM微服務實現實時數據檢索 , 已經在金融交易、自動駕駛、物流等領域實現了企業級應用 。
其次是谷歌 , 今年4月 , VAST Data平臺已全面集成到谷歌云中 , 企業可以在單個高性能平臺上統一AI訓練、RAG管道、高通量數據處理和非結構化數據湖 , 這實現了跨混合環境的AI訓練、RAG和推理 , 可以繞過公有云提供商的壁壘 。
值得一提的是 , 除了與頭部客戶深度綁定外 , 這家創企與思科、超微和HPE的OEM合作使其能獲得較低的硬件成本 , 同時保持軟件溢價 , 達到高毛利和快速客戶獲取的優勢 。
在現金流充足的情況下 , 外媒也認為VAST Data獲得新融資或證明了其進行IPO前準備工作的進程加快 , 去年這家創企還聘請了全球電商平臺Shopify前CFO艾米·沙佩羅(Amy Shapero) 。

結語:乘AI東風 , VAST Data營收激增數據、算力等AI基礎設施平臺構建的重要性與日俱增 , 盡管英偉達、微軟和谷歌等科技巨頭憑借GPU、云平臺占據了這一賽道的頭部市場 , 但以VAST Data為代表的AI創企業務增長、估值飆升也證明了這不僅是一場巨頭游戲 。
而在巨頭環伺的AI競賽下 , VAST Data這類專注于某一垂直賽道的企業 , 能夠針對數據存儲需求的變化 , 在大模型發展瞬息萬變的當下 , 打造完全面向AI時代企業核心需求的數據處理平臺 , 從而收獲大批客戶以及收益 。
【2100億獨角獸即將誕生!被英偉達、谷歌、xAI同時看中】來源:路透社、VAST Data官網、CTech

    推薦閱讀