
作者 | Rebecca Bellan
譯者 | 核子可樂
策劃 | Tina
多年來,埃隆·馬斯克一直對 Dojo 項目的前景念念不忘。這臺 AI 超級計算機本該成為特斯拉 AI 雄心的基石,也無怪乎馬斯克會在 2024 年 7 月表示,在當年 10 月推出自動駕駛出租車之前,該公司 AI 團隊將啟動 Dojo 投入“倍增”行動。
但經過六年炒作,特斯拉最終于上個月決定關閉 Dojo,并于 2025 年 8 月解散了超算項目團隊。幾周前,馬斯克還曾預測 Dojo 2(特斯拉的第二個超級集群,計劃采用公司自研的 D2 芯片構建)將在 2026 年實現規模落地,但短短幾周后就改變主意,稱開發“進入了死胡同”。
本文將向大家介紹 Dojo 項目是什么,又如何幫助特斯拉一步步推動全自動駕駛、自主人形機器人、半導體自主等戰略目標。這個現已關停的項目,曾經由一眾分析師和投資者相信特斯拉不再僅僅是一家汽車制造商,更是一家 AI 公司。
Dojo 是特斯拉打造的定制化超級計算機,旨在訓練其“全自動駕駛”(FSD)神經網絡。
Dojo 的發展與特斯拉實現 FSD 并面向市場推出自動駕駛出租車的目標密切相關。作為特斯拉旗下高級駕駛輔助系統,FSD 已經搭載在數十萬特斯拉汽車之上,能夠執行部分自動駕駛任務,但仍要求駕駛員將注意力集中在路面上。今年 6 月特斯拉在奧斯汀發布的、搭載在 Model Y SUV 上的有限自動駕駛出租車服務,同樣以這項技術為基礎。
說了這么多,特斯拉卻并未將自動駕駛的成功歸結于這臺超級計算機。相反,馬斯克和特斯拉在過去一年間幾乎不再提起 Dojo。2024 年 8 月,特斯拉開始推廣 Cortex,該公司“在奧斯汀總部建設的全新巨型 AI 超級集群,旨在解決現實世界 的 AI 問題。”馬斯克曾提到,Cortex 將擁有“可容納 FSD 和 Optimus 視頻訓練的海量存儲空間”。
在特斯拉 2024 年第四季度的股東大會上,該公司分享了 Cortex 的最新動態,但同樣未提及 Dojo。目前尚不清楚 Dojo 的關停是否會對 Cortex 造成影響。
人們對 Dojo 項目解散的反應則褒貶不一。有人認為這是特斯拉電動汽車銷量下滑、自動駕駛出租車推廣乏力下的必然結果,也有人認為 Dojo 的解散并不代表項目失敗,而是特斯拉正從高風險、自給自足的硬件研發策略轉向由合作伙伴提供芯片開發服務的新路徑。
Dojo 項目關停回顧
特斯拉于 2025 年 8 月中旬解散了 Dojo 團隊,并宣告項目正式終止。此前,已經有約 20 名員工離開公司,并創辦了 AI 芯片與基礎設施廠商 DensityAI。Dojo 項目負責人 Peter Bannon 也一并離職。
分析人士指出,失去關鍵人才會導致項目迅速崩盤,特別是這種專業化程度極高的內部技術項目。
就在幾周前,特斯拉與三星簽署了一項價值 165 億美元的協議,將下一代 AI6 芯片的研發任務交給三星。AI6 芯片是特斯拉高度關注的一款產品,其應用范圍涵蓋驅動 FSD 及 Optimus 人形機器人、乃至數據中心高性能 AI 訓練等諸多領域。
馬斯克在他掌控的社交平臺 X 上發帖稱,“考慮到所有路徑都明確指向 AI6,我只能選擇關閉 Dojo 并做出一系列艱難的人事決策。現在 Dojo 2 的開發已經走進了死胡同。Dojo 3 則仍在以另一種形式延續,即以單片板上集成大量 AI6 芯片(片上系統)。”
特斯拉 Dojo 項目的來歷
馬斯克堅稱,特斯拉不僅僅是一家汽車制造商或者太陽能電池板 / 儲能系統供應商,更是一家 AI 公司——一家通過模仿人類感知攻克自動駕駛汽車難題的企業。
多數其他自動駕駛汽車技術廠商會依靠大量傳感器(例如激光雷達、傳統雷達和攝像頭)來感知世界,并利用高清地圖實現車輛定位。但特斯拉認為只靠攝像頭捕捉視覺數據,再使用先進的神經網絡處理這些數據就足以快速完成車輛行駛決策,最終實現完全自動駕駛。
特斯拉曾經揚言,經過 Dojo 訓練的 AI 軟件最終將通過無線更新方式交付給產品客戶。FSD 的龐大普及規模,也意味著特斯拉能夠收集數百萬英里的視頻片段以用于訓練 FSD。收集到的數據越多,公司距離真正實現全自動駕駛也就越近。
然而,部分行業專家表示,將更多數據輸入模型并期望其越來越智能的粗暴方式,可能很快遭遇瓶頸。
普渡大學硅谷電氣與計算機工程教授 Anand Raghunathan 在采訪中表示,“首先是經濟條件的限制,畢竟投入的預算不可能無限增長。還有人認為,用于訓練模型的有價值數據終會被耗盡。屆時更多數據將無法提供更多信息,那么數據能否進一步改善模型、訓練過程能否優化性能將畫上一個大大的問號。”
Raghunathan 還提到,盡管存在諸多疑慮,但至少在短期內,數據增長的趨勢將會持續下去。更多數據將對應更強大的算力和數據存儲 / 處理容量,以確保特斯拉能夠持續訓練自己的 AI 模型。這就是超級計算機 Dojo 的意義所在。
超級計算機是什么?
作為特斯拉的超級計算機系統,Dojo 相當于 AI(特別是 FSD)的訓練場。Dojo 這個單詞本身,就是在致敬“武道場”的概念。
超級計算機由數千個小型計算機節點組成。每個節點都有自己的 CPU 和 GPU,前者負責節點的全面管理,后者則負責執行復雜任務——例如將事務拆分成多個部分并同時處理。
GPU 對于機器學習操作至關重要,例如支持 FSD 模擬訓練。GPU 還支撐起大語言模型,這就是生成式 AI 熱潮能夠將英偉達送上全球最有價值公司寶座的原因所在。
就連特斯拉也會采購英偉達 GPU 來訓練自家 AI。
特斯拉為什么
需要自己的超級計算機?
特斯拉選擇的純視覺技術路線,決定其必須擁有超級計算機。FSD 背后的神經網絡經過大量駕駛數據訓練,能夠識別并分類車輛周遭的物體,而后據此做出駕駛決策。就是說當 FSD 啟動時,神經網絡必須以等同于人類駕駛員速度及識別能力的水平持續收集并處理視覺數據。
換句話說,特斯拉就是想為人類視覺皮層和大腦功能打造一套數字副本。
為了實現這個目標,特斯拉需要存儲并處理從全球車輛上收集到的全部視頻數據,并運行數百萬次模擬來完成模型訓練。
![]()
特斯拉的 Dojo 訓練計算機主要采用英偉達 GPU,并公司并不想把雞蛋都放進同一個籃子——特別是考慮到英偉達家的 GPU 價格不菲。特斯拉希望開發出更好的產品,在增加帶寬的同時降低延遲。因此,該公司 AI 部門決定發布自己的定制硬件項目,希望以更高效的方式訓練 AI 模型。
該項目的核心就是 D1 芯片,特斯拉表示這些芯片專門針對 AI 工作負載進行了優化。
關于芯片的更多細節
![]()
前 AUTOPILOT 硬件高級總監 GANESH VENKATARAMANAN 在 2021 年特斯拉 AI 日活動上展示 D1 訓練模塊。
跟蘋果一樣,特斯拉也認為硬件和軟件設計應當協同并進。為此,特斯拉才決定擺脫標準 GPU 硬件,通過自研芯片來驅動 Dojo 超算集群。
特斯拉在 2021 年的 AI 日活動上公布了 D1 芯片,其尺寸與手掌相當,并表示該芯片將于 2023 年 7 月左右投入生產。
這款 7 納米芯片由臺積電負責代工。據特斯拉介紹,D1 擁有 500 億個晶體管,芯片尺寸高達 645 平方毫米。由此看來,D1 芯片將擁有極其強大的性能表現,能夠快速處理復雜任務。
然而,D1 芯片的性能卻仍不及英偉達 A100。
為了彌合差距,特斯拉一直在研發下一代 D2 芯片以解決信息流瓶頸問題。D2 芯片不是簡單將各芯片連接起來,而是把整塊 Dojo 芯片集成到單一晶片之上。
特斯拉從未公布其訂購或接收了多少塊 D1 芯片,也沒有公布 Dojo 超級計算機全面轉向 D1 的具體時間表。
Dojo 對特斯拉有何意義?
![]()
2024 年 7 月 7 日,參觀者在上海世界人工智能大會(WAIC)上見證了特斯拉人形機器人 OPTIMUS II。
特斯拉希望自主掌控芯片生產,有朝一日以低成本快速為 AI 訓練項目提供大量算力。
如此一來,特斯拉就能擺脫價格日益昂貴、且供應安全缺乏保障的英偉達芯片。如今,特斯拉正努力與英偉達、AMD 和三星同時維持合作伙伴關系,其中三星將負責其下一代 AI6 芯片的制造。
在 2024 年第二季度財報電話會議上,馬斯克表示市場對英偉達硬件的需求“如此之高,導致 GPU 獲取難度同步提升。”他強調稱“我們非常擔心能否在必要時獲得穩定的 GPU 供應,因此必須在 Dojo 上投入更多精力,確保我們掌握所需的訓練能力。”
但 Dojo 本身是個風險巨大的賭注,馬斯克也多次承認特斯拉未必能在項目上取得成功。
從長遠來看,特斯拉也考慮過為 AI 部門建立新的商業模式,甚至在 2024 年第二季度財報電話會議上,馬斯克提到“也許可以通過 Dojo 跟英偉達直接競爭”。雖然 D1 芯片更適合特斯拉提出的計算機視覺標記與訓練用途(主要面向 FSD 和 Optimus 訓練),但在其他方面則效果一般。馬斯克稱,未來的版本必須擁有更好的 AI 訓練通用能力。
特斯拉還面臨另外一個問題,就是幾乎所有 AI 軟件均針對 GPU 編寫。使用 Dojo 芯片訓練通用 AI 模型,則意味著軟件需要經歷重寫。
就是說,特斯拉有可能出租其算力(類似于 AWS 和 Azure 出租云算力)。摩根士丹利在 2023 年 9 月發布的一份報告中預測,Dojo 可以通過自動駕駛出租車和軟件服務的形式創造新的收入來源,將特斯拉的市值額外拉升 5000 億美元。
簡而言之,Dojo 芯片將成為這家汽車制造巨頭的保險單,甚至可能已經帶來了回報。
特斯拉 Dojo 還能走多遠?
馬斯克雖然經常公布進度報告,但他為 Dojo 設定的不少目標始終未能實現。
例如,馬斯克曾在 2023 年 6 月表示,Dojo 已經上線幾個月并開始運行實用任務。大約在同一時間,特斯拉提到,預計 Dojo 將在 2024 年 2 月成為全球五大超級計算機之一,并計劃在 2024 年 10 月將算力提升至百億億級別。這對應的是約 27.6 萬臺 D1 計算機,或者約 32.05 萬塊英偉達 A100 GPU。
但特斯拉此后再未透露過任何更新消息,也未公布這些目標是否達成。
特斯拉和馬斯克也曾為 Dojo 項目做出過諸多承諾,包括提供資金支持。例如,特斯拉曾在 2024 年 1 月承諾斥資 5 億美元在紐約州布法羅超級工廠制造一臺 Dojo 超級計算機。據 2024 年的報告,截至當時的投入已經達到 3.14 億美元。
就在特斯拉 2024 年第二季度財報電話會議結束后,馬斯克在 X 上發布了 Dojo 1 的照片,強調到年底其將擁有“相當于約 8000 張 H100 的在線訓練容量。不算特別厲害,但也不差。”
盡管馬斯克在 X 和財報電話會議上極盡努力,但關于 Dojo 的所有消息都在 2024 年 8 月徹底消失,話題開始轉向 Cortex。
在該公司 2024 年第四季度的財報電話會議上,特斯拉稱已經完成了 Cortex 的部署,即“在得克薩斯州超級工廠部署了約 5 萬張 H100 的訓練集群”,且 Cortex 將協助支持監督式 FSD 的 V13 版本。
到 2025 年第二季度,特斯拉表示“在得克薩斯州超級工廠額外部署了 1.6 萬張 H200 GPU,旨在擴展 AI 訓練算力,Cortex 的總算力此時已等效于 6.7 萬張 H100。”在此次財報電話會議上,馬斯克提到預計第二套 Dojo 集群將在 2026 年“大規模”運行,同時暗示公司可能對項目進行裁撤。
“考慮到 Dojo 3 和 AI6 推理芯片有著高度重合的定位,在直覺上二者應該可以合并起來。”
短短幾周后,他宣布解散 Dojo 團隊。
另據證實,2025 年 8 月底特斯拉仍在繼續布法羅耗資 5 億美元的超級計算機建造計劃,只是名頭肯定不叫“Dojo”了。
https://techcrunch.com/2025/09/02/tesla-dojo-the-rise-and-fall-of-elon-musks-ai-supercomputer/
聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.