六年全部白干,馬斯克砍掉自研芯片到底為啥?

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?

文章圖片

六年全部白干,馬斯克砍掉自研芯片到底為啥?


俗話說得好 , 欲練神功 , 必先自宮 。
為了應付接下來的車企混戰 , 馬斯克提刀就往自己身上砍?
就在幾天前 , 彭博社報道了一則消息 , 說特斯拉突然叫停了研發六年的芯片項目 Dojo, 這是連命根子都不要了啊 。

不僅工作全部白干 , 而且整個研發團隊也直接作鳥獸散 。
項目負責人彼得·班農原地辭職 , 還有約 20 名工程師也早已提桶跑路 , 投奔一家名為 DensityAI 的初創公司去了 。
巧的是 , 這家公司的老板正是在 2021 年首次發布 Dojo 芯片的前特斯拉總監 , 加內什·文卡塔拉馬南 。

可以說 , 特斯拉裁員裁出了一家公司 。。。
而于此同時 , 留在特斯拉的 , 就只剩一地雞毛 。
甚至有消息說 , 連 Dojo 的專利都不在特斯拉自己手上 , 以后想再繼續干也沒有機會了 。

呃 , 這確實有點出人意料 。
畢竟 Dojo 這玩意兒剛出來的時候 , 大家都還寄予了厚望 。
眾所周知 , 特斯拉智駕的特點是純視覺算法 , 這個方案雖然上限很高 , 但下限也很低 , 關鍵就看算法的能力 , 而因為端到端架構 , 你要迭代算法 , 靠的就只有沒日沒夜的訓練 。

特斯拉開啟 Dojo 項目的初衷 , 就是奔著訓練來的 , 如果它做成了 , 就能讓特斯拉 FSD 直接封神 。
要知道 , 過去給智駕做訓練的 GPU, 并不是為深度學習訓練而設計的 , 而這個 Dojo 通過分布式 2D 架構 , 解決了高帶寬和低延遲的問題 , 并且通過存算一體的設計 , 讓訓練的能效也更高 。
這么一來 , 相比市場上主流的英偉達 A100,Dojo 在相同成本下的性能可以達到它的 4 倍 。 這對特斯拉來說 , 不僅能更好的訓練智駕 , 還能打破英偉達在芯片上的壟斷 , 讓特斯拉成為真正的人工智能企業 。
所以對于這個 Dojo, 老馬認為它是 “ 實現完全自動駕駛的關鍵 ”, 摩根士丹利也預測 ,Dojo 將會給特斯拉帶來 5000 億美元的市值增長 。
但結果呢?上個月還說 Dojo 2 量產倒計時 , 現在說沒就沒 , 就有點搞人心態了啊 。

很多人會覺得 , 是不是特斯拉開始走下坡路了?為了省錢 , 連自己最關鍵的芯片業務也要裁?
脖子哥認為 , 確實有一部分原因 , 如今的特斯拉 , 真不比當年 。
咱們打開財報咱們就知道 , 今年 Q1 和 Q2 季度 , 特斯拉最關鍵的營收指標開始下滑 , 同比分別減少了 9.23% 和 11.78 %。

而在這背后的銷量數據就更是雪崩 ,7 月份 , 特斯拉全球齊跌 , 在英國同比暴跌 60%, 德國則下滑 55.1%, 甚至在基本盤的中國也達不到過去的熱度 。
但是吧 , 特斯拉還遠遠沒到山窮水盡的地步 。 前幾天 , 它還花了 43 億美元買 LG 的磷酸鐵鋰電池 , 甚至還用 165 億美元定了三星的芯片單子 。
區區十幾億的 Dojo, 特斯拉完全還是投的起的 。
那要問背后原因是啥 , 老馬其實自個兒就發帖說了 , 這么做主要是因為“ 沒有必要分散資源同時開發兩種不同 AI 芯片 ” 。

沒錯 , 目前特斯拉確實是有兩條芯片研發路線 。 一條是它的 HW 系列(Hardware , 真不是華為) , 用在特斯拉的汽車上 , 另一條就是這個 Dojo, 是用在智駕訓練上 。
過去這是完全不同的兩條平行線 , 但這次的 AI6(HW 6.0)明顯有點超預期了 , 顯著提升了算力和帶寬 , 不僅能做 FSD 的終端芯片 , 也可以用于智駕訓練 , Dojo 存在的必要性就被打上了問號 。
按老馬的性格 , 肯定不會把錢和精力浪費在毫無意義的地方 。
當然 , 還有一個原因就是 , Dojo 的研發進度確實不盡如人意 。 目前 Dojo 2 還沒量產 , 而 Dojo 1 也因為性能缺陷 , 成本奇高 , 基本沒啥市場競爭力 。
所以和更成熟的 HW 芯片相比 , 老馬毫無疑問砍掉了根本看不到前景的 Dojo。

不過呢 , 你要說 Dojo 從一開始就是一個錯誤嗎?我真覺得未必 。
馬斯克其實看得很透徹 , 他曾公開表態 “ 我認為 Dojo 的前景渺茫 。 但值得一試 , 因為回報可能非常高 。 ”
說白了 , 有點賭狗的意思 。
但這場豪賭并不是沒道理的 , 咱們得結合當時情境 , 從頭開始說起 。
最早 , 特斯拉只有 HW 芯片 , 而且 1.0 版本用的還是 Mobileye 的全套產品 。

但問題是 , 當時的 Mobileye 只是一個黑盒 , 不允許特斯拉參與修改算法 , 也不能共享數據 , 甚至功能也偏向保守 , 和特斯拉的理念實在合不來 。
最終由于 2016 年發生的 Model S 智駕事故 , 讓特斯拉下定決心分手 , 結局不歡而散 。
我估計是因為這次和 Mobileye 的失敗合作 , 讓老馬就看清了一件事:和別人合作永遠做不了自己想做的事 , 自研才是唯一的出路 。
所以在此之后 , 特斯拉先是自研智駕 , 芯片用英偉達過渡了幾年以后 , 到 2019 年 , HW3.0 就開始走自研路線了 。

之后的 HW4.0、HW5.0, 也就是現在說的 AI4、AI5 , 其實也都是特斯拉做的框架設計、神經網絡優化和系統集成 , 只是利用了三星和臺積電的工藝進行生產 。
總之在智駕芯片上 , 老馬踢掉了老黃 , 很快嘗到了自研芯片的甜頭 。
隨后老馬很快又把矛頭轉向智駕訓練 。 不過 , 因為 HW 的分離式內存架構更適合推理 , 而非訓練 , 老馬必須另開爐灶 。
于是在 2019 年 , 馬斯克在特斯拉自動駕駛日上 , 提出用 Dojo 來訓練自動駕駛 。 隨后 , 在 2021 年的 AI DAY 上 , 特斯拉就實現了 Dojo 超算的核心——7nm 的 D1 芯片(還是這個老哥) 。

這里大伙兒可能比較迷糊 , 馬斯克把 Dojo 稱為超級計算機 , 那和這個 D1 芯片有啥關系呢?
咱們可以這么來理解 , 其實 Dojo 就是一個體系森嚴的算力盒子 , 從低到高分為內核、芯片、瓦片、模組、機柜和 ExaPOD 。

一塊 D1 芯片 , 其實是由 354 個核心(CPU)組成 , 而 25 個 D1 芯片 , 則組成一個瓦片 , 6 個瓦片就是一個模組 , 2 個模組是 1 個機柜 ,10 個機柜是 1 個 ExaPOD 訓練集群 , 最終算力能達到 1.1 EFLOP。
總之呢 , 從 D1 芯片到最后的訓練集群 , 其實并沒有那么簡單 。
2021 年特斯拉只是展示了 D1 芯片和瓦片 , 而后一年 , 才安裝了首個機柜 , 當時的目標 , 是在 2023 年建成七臺 ExaPOD。
然而很快 , 到 2023 年馬斯克才發現 , Dojo 并沒有那么十全十美 , 反而有可能將訓練成本提高十倍以上 , 成功的可能性并不高 。

但此時 , 老馬的賭性占據了上風 , 開始左腦互博右腦了 。。。
隨后特斯拉不僅繼續砸重金去做 Dojo, 動則好幾億美元 , 而且還接連提出了 Dojo 1.5、Dojo 2 和 Dojo 3, 要真正實現 Dojo, 幾乎是個無底洞 。
然而結果呢 , 老馬斥巨資打造的 Dojo 超算 , 性能也只和英偉達 H100 系統相當 , 于是只能把希望寄托在了 Dojo 2 上 。
相比 Dojo 1 , 第二代 Dojo 采用了臺積電最新的InFO-SoW 晶圓級封裝技術 , 尺寸更小 , 損耗更低 , 效率也更高 。

不過嘛 , 結局依然不理想 。
雖然 Dojo 2 的 D2 芯片算力 , 從之前的 362 TFLOPS 提升到了 3.62 PFLOPS , 是 D1 的 10 倍 , 但因為過于強調視覺訓練 , 實際在通用 AI 場景中 , 依然打不過英偉達的 H200 GPU 集群 。
并且 , 芯片雖然由臺積電代工 , 但良品率并不高 , 初期只有 37%, 在成本上沒有任何優勢 。
說白了 , Dojo 2 還遠不夠成熟 , 想要打敗英偉達 , 還有很多的細節需要打磨 。 但時間不等人 , 如今的 AI6 徹底擊穿了 Dojo 的未來 , 難道還要指望 Dojo 3 ?
這錢還不如留著應對一下關稅 。 老馬當機立斷放棄 Dojo, 再次想起了老黃這個備胎 。。。
而后他解釋到 , 如今的 AI5 和 AI6, 從某種意義上 , 就是 Dojo 3。

但是吧 , 這個 AI6 至少要到 2027 年量產 , 用的是三星的 2nm(SF2)制程技術 , 良品率奇低 , 只有40%-50% , 差不多做兩片 , 扔一片 。
雖然特斯拉給了三星 165 億美元的巨款 , 但三星依然是賠錢在給特斯拉供貨 , 所以這塊餅究竟能做成生么樣 , 現在咱們也只能看看罷了 。
總而言之 , Dojo 這事兒就是馬斯克的一場豪賭 , 只不過賭輸了而已 。
為了不深陷泥潭 , 馬斯克選擇投降輸一半 , 把全部精力投到更有希望的 “ 神功 ” 上去 。
但是話又說回來 , Dojo 這事對車企來說 , 真算不上什么反例 。
因為自研 , 本來就是條困難但必須走的路 。
【六年全部白干,馬斯克砍掉自研芯片到底為啥?】

    推薦閱讀