融資34億!谷歌前TPU員工創業新型芯片,卡帕西也投了

融資34億!谷歌前TPU員工創業新型芯片,卡帕西也投了

文章圖片

融資34億!谷歌前TPU員工創業新型芯片,卡帕西也投了

文章圖片

融資34億!谷歌前TPU員工創業新型芯片,卡帕西也投了

文章圖片

融資34億!谷歌前TPU員工創業新型芯片,卡帕西也投了

比英偉達芯片更好 , 谷歌前TPU員工創業公司MatX正在受到關注 。
之所以注意到這家公司 , 這還得感謝宣傳委員卡帕西(沒錯 , MatX最新B輪5億美元融資他也投了) 。
卡帕西表示 , 參考英偉達4.6萬億美元市值 , MatX正在向“當今最有趣、回報也最高的智力難題”發起挑戰 。
MatX團隊非常出色 , 我很榮幸能參與其中 , 并祝賀他們獲得融資!

當然也不光是卡帕西背書 , MatX也有自己的“殺手锏”——一條不同于當下主流AI芯片路線的技術選擇 。
過去幾年 , AI芯片陣營大致分成兩派:
一派以英偉達、谷歌為代表 , 重押高帶寬內存HBM , 優先解決大規模訓練和吞吐問題;
另一派則以Cerebras Systems(年初還獲得了AMD投資)為代表 , 強調片上SRAM(靜態隨機存儲器)和低延遲 , 主打推理場景 。
而MatX的態度是:小孩子才做選擇 , 成年人當然是都要 。
在他們看來 , 真正的勝負手不在于單點技能拉滿 , 而在于能否在同一顆芯片里 , 把“訓練級吞吐”和“推理級低延遲”同時做好——尤其是在長上下文、Agent循環這些更復雜的真實工作流中 。
而且不止說說而已 , 據MatX創始人透露 , 他們目前正在打造一款“LLM專用芯片”MatX One:
其吞吐量遠高于其他任何芯片 , 同時延遲也最低 。

所以 , MatX到底是誰?它真能對霸主英偉達構成威脅嗎?
咱這就接著瞧 , 接著看 。
誰是MatX?關于MatX的第一印象 , 谷歌二字始終是繞不開的 。
沒辦法 , 誰讓兩位創始人都來自谷歌TPU團隊 。
創始人兼CEO Reiner Pope , 身上有著很明顯的“軟件”標簽 。

2012年加入谷歌時 , 主要負責谷歌地圖的部分網頁開發 , 并逐漸成為5人團小主管 。
后來又設計并參與了谷歌大型機器學習系統Sibyl的開發 , 該系統曾為YouTube、Gmail、Android等提供重要支撐 , 直到2017年被更靈活、支持深度學習的TensorFlow Extended(TFX)平臺逐步取代 。
也是在這一年 , 他開始接觸芯片設計——加入谷歌內部項目孵化平臺“登月工廠”(Moonshot Factory) , 并專注于下一代計算的架構設計 。
自此 , 他逐漸從“做系統的人” , 變成了“理解模型與硬件如何協同的人” 。
從2019年起 , 他開始擔任谷歌機器學習芯片的技術主管兼架構師 , 連續參與了兩代ML芯片的設計 , 并成為第二代芯片的主要負責人之一 。
后來更是參與了谷歌當時規模最大的模型——PaLM的訓練 , 而且是PaLM的軟件/硬件效率負責人 。
可以說 , Reiner Pope是早期谷歌TPU軟件棧的重要成員之一 , 而且不是單純做芯片電路的人 , 他懂得如何讓芯片真正跑起大模型 。
創始人兼CTO Mike Gunter , 則剛好有著很明顯的“硬件”標簽 。
而且他屬于那種從底層邏輯電路一路打到系統架構的老派硬件工程師 。

加入谷歌前 , 他就已經是一名連續創業者——早在2000年便聯合創辦無線通信芯片公司Gossett and Gunter , 后來公司被谷歌收購 , 他也隨之加入谷歌 。
而在谷歌 , 他做過無線通信、多天線系統、ASIC設計 , 甚至是谷歌內部第一位邏輯設計師、第一位被“正式付薪寫 Haskell”的工程師 。
從2008年開始 , 他便主導了谷歌第一個硬件加速項目 , 該項目最終把谷歌計算密集型任務的性價比提高了10倍以上 。
【融資34億!谷歌前TPU員工創業新型芯片,卡帕西也投了】再到后來 , 他和Reiner Pope的交集開始變多——
Sibyl系統的設計和實現有他、和Reiner Pope幾乎同一時間加入Moonshot Factory、ML芯片項目有他(任首席工程師)等等 。
總之 , 如果說Reiner Pope是在模型規模爆炸時代 , 解決“模型如何高效跑在芯片上”的問題 , 那Mike Gunter更像是在更早階段思考“芯片應該如何為未來的計算形態而設計” 。
他倆合起來幾乎把“軟硬全?!弊吡艘槐?。 一個站在模型效率前線 , 參與過PaLM級別的訓練;另一個站在芯片最底層 , 從晶體管和微架構一路搭到系統 。
而軟硬結合這一點 , 也正是MatX身上很大的一個看點 , 體現在正在設計的MatX One芯片上即為——
MatX One芯片基于一種可拆分的脈動陣列(splittable systolic array)架構 。 該架構既繼承了大型脈動陣列在能效和面積效率方面的優勢 , 又能夠在尺寸更小、形狀更靈活的矩陣計算中保持較高的利用率 。
這款芯片將SRAM優先設計(SRAM-first designs)的低延遲特性與HBM(高帶寬內存)支持長上下文處理的能力結合在一起 。 在此基礎上 , 再配合一套全新的數值計算方案(numerics設計) , 使其在大語言模型上的吞吐量超過目前所有已公布的系統 , 同時在延遲方面達到SRAM-first設計的水平 。

為便于理解 , 我們可以結合卡帕西的觀點來解釋 。
在卡帕西看來 , 隨著token用量的激增 , 如今大家面臨的問題是——
怎么把“算力”和“內存”調配到剛剛好 , 才能讓大模型更快、更便宜地吐出更多token?
很多人沒有意識到 , 目前市面上兩種主流的芯片路線都有其局限性:
以英偉達為代表的HBM路線 , 其核心邏輯在于“大模型訓練是帶寬游戲” , 即模型越大、參數越多、上下文越長 , 就越需要把權重和激活值在芯片之間高速搬運 。
于是堆HBM、堆帶寬、堆互連 , 成為主流解法 , 它解決的是吞吐問題 。
而以Cerebras Systems為代表的片上SRAM路線 , 其核心邏輯在于“推理時代的關鍵不是帶寬 , 而是響應速度” 。
于是把盡可能多的數據放在片上SRAM中成為解法 , 如此一來便能減少外部訪存 , 降低單次查詢延遲 , 后者解決的是延遲問題 。
但問題在于 , 今天的大模型 , 其訓練和推理不再是涇渭分明的兩個世界——
如果只強調HBM帶寬 , 延遲難以下降;如果只強調片上SRAM , 規模又難以擴展 。
所以卡帕西就問了 , 是否存在一種更優的物理基板 , 使計算與內存的比例從一開始就為大模型而設計?
MatX的回答是:與其在既有架構上打補丁 , 不如從架構層面重構算力與存儲的關系 。
沒錯 , 就是從零開始 。
2022年從谷歌離職創辦MatX , 二人便下定決心要從零打造一款更優秀的芯片——
目標是設計一條全新的、具有競爭力的硬件產品線 , 融合其他芯片制造商使用的兩種截然不同的方法 。
MatX試圖證明 , 未來的AI芯片不必在“速度”和“容量”之間痛苦權衡 , 因為真正的軟硬結合 , 可以讓芯片同時擁有兩者的優勢 。 按Reiner Pope的話來說就是:
實際上可以在同一個產品中同時做到這兩點 , 而且這樣會得到一個更好的產品 。
而正在孕育的MatX One , 毫無疑問便承載著這一理念 。
一旦成功 , 同時實現更高的吞吐量+更低的延遲便意味著——
在同樣的預算下 , 你可以訓練更大的模型、跑更長的上下文、支撐更復雜的Agent循環 , 同時讓每一次用戶交互都更快地得到響應 。
這正是卡帕西所說的“設計最優物理基板 , 編排內存與計算 , 以求最快、最便宜地獲取token”的現實注腳 。
顯而易見 , 從團隊到理念到產品 , MatX已經做足了準備 。
而對這樣一支團隊 , 市場也給予了足夠的注目和支持 。
明年量產、已獲數十億融資截至目前 , 這家公司已經獲得數十億美元融資 。
MatX官網顯示 , 2025年3月這家公司獲得了1億美元A輪融資 , 領投方為Anthropic早期投資者Spark Capital 。
頂級量化Jane Street Group、知名投資人Daniel Gross(早期投資了Figma/Notion等)、Nat Friedman(GitHub前CEO)、Adam D‘Angelo(Quora聯創兼CEO)等均參與投資 。
當時Reiner Pope還對MatX做了一個階段性總結:
兩年內 , 我們在機器學習數值計算、芯片設計和實現、軟件和系統設計等方面的所有技術投入都得到了驗證 , 并建立了所有必要的合作伙伴關系 , 從而開發出了我們的芯片 。
憑借這一輪投資 , 我們現在擁有足夠的資金將我們的系統推向市場 。

而在快速發展近一年后 , 規模接近100人的MatX這次又獲得了最新5億美元(約合人民幣34億元)B輪融資 , 而且陣容還在增加 。
具體而言 , B輪領投方變成了兩家:Jane Street和Situational Awareness LP 。
原有投資方Spark Capital、Triatomic Capital、Harpoon Ventures等繼續跟投 , 而且還新增了Dwarkesh Patel、卡帕西、 Stripe聯創兼CEO Patrick Collison及其弟弟等人 。
Reiner Pope繼續總結陳詞:
創立MatX的初衷是 , 我們認為最適合LLM的芯片應該從根本上進行設計 , 并深刻理解LLM的需求及其發展趨勢 。 為了打造這樣一款芯片 , 我們甚至愿意放棄小模型性能、低容量工作負載 , 以及編程的便捷性 。
可以說 , 此舉已經將人們對MatX One的好奇心拉滿了 。
內部測試表明 , 根據每平方毫米的計算性能指標 , 其芯片性能可以超越英偉達即將推出的Rubin Ultra產品 。
據悉MatX將與臺積電展開合作 , 目標是今年完成芯片的全部設計 , 并于2027年開始出貨 , 主要銷售對象為少數幾家領先的人工智能實驗室 。
MatX表示 , 這筆融資將幫助公司預留產能和零部件 , 以確保一旦準備就緒就能迅速發貨 。
這一輪融資讓我們幾乎與那些擁有巨額資金的公司站在了同一起跑線上 。
One More Thing聯想到剛被老黃打包收購的Groq , 我們實在想看MatX的未來 。
畢竟這兩家手上拿的劇本可太一致了——
同是谷歌TPU核心成員創業、同是要挑戰英偉達芯片霸主地位 。
結果呢 , 老黃甩出200億美元就把Groq打包帶走了——包括創始人和90%團隊員工 。
更別說MatX創始人兼CTO Mike Gunter還有被谷歌打包收購的經歷……
只能說 , 如果MatX真做出了比英偉達芯片更好的東西 , 不說老黃有沒有想法 , 谷歌可能也去爭一爭也不一定 。

— 完 —
量子位 QbitAI
關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀