![]()
在短暫叫停之后,特斯拉Dojo項(xiàng)目又“殺”回來了。這次,它換上了全新的思路。
1月19日,特斯拉創(chuàng)始人馬斯克在X平臺(tái)發(fā)文宣布,隨著AI5芯片設(shè)計(jì)完成,公司將重啟超級(jí)計(jì)算機(jī)項(xiàng)目Dojo 3的開發(fā)工作。同時(shí),他發(fā)出“英雄帖”,招聘人才參與研發(fā)“世界上產(chǎn)量最高的芯片”,并要求用三個(gè)要點(diǎn)介紹自己解決過的最棘手技術(shù)難題。
![]()
五個(gè)月前,特斯拉曾全面叫停Dojo項(xiàng)目。彼時(shí),馬斯克回復(fù)網(wǎng)友稱,特斯拉分散資源并同時(shí)開發(fā)兩種截然不同的AI芯片設(shè)計(jì)是沒有意義的。特斯拉的AI5、AI6及后續(xù)芯片在推理方面將表現(xiàn)出色,至少在訓(xùn)練方面相當(dāng)不錯(cuò),所有努力都將集中在這些芯片上面。
如此,伴隨著Dojo 3超級(jí)計(jì)算機(jī)項(xiàng)目的重啟,特斯拉自研AI算力戰(zhàn)略再次回歸,并進(jìn)行了一次策略修正。
01
一場(chǎng)激進(jìn)的技術(shù)豪賭
Dojo是特斯拉自主研發(fā)、專為AI訓(xùn)練設(shè)計(jì)的超級(jí)計(jì)算集群。其核心目標(biāo)是處理特斯拉全球車隊(duì)收集的海量視頻數(shù)據(jù),以極快速度訓(xùn)練和迭代其全自動(dòng)駕駛(FSD)系統(tǒng)。
2021年特斯拉AI Day上,首款用于打造Dojo的芯片D1亮相,采用分布式結(jié)構(gòu)和7納米工藝,搭載500億個(gè)晶體管、354個(gè)訓(xùn)練節(jié)點(diǎn),僅內(nèi)部的電路就長(zhǎng)達(dá)17.7公里,實(shí)現(xiàn)了超強(qiáng)算力和超高帶寬。
![]()
從馬斯克透露的消息來看,D1的設(shè)計(jì)哲學(xué)是極致優(yōu)化,即通過剝離一代通用計(jì)算功能,打造出一個(gè)精簡(jiǎn)的、大規(guī)模并行的訓(xùn)練“猛獸”,其激進(jìn)架構(gòu)主要體現(xiàn)在兩方面。
一是無緩存的雙層存儲(chǔ)系統(tǒng)。Dojo的D1計(jì)算芯片完全摒棄了傳統(tǒng)的緩存層次結(jié)構(gòu)和虛擬內(nèi)存,354個(gè)內(nèi)核都能直接訪問1.25MB的本地SRAM。這通過去除復(fù)雜的內(nèi)存管理硬件,最大化了計(jì)算密度和功耗效率。
二是“無膠化(Glueless)”的晶圓級(jí)互連。Dojo的真正核心是其互連設(shè)計(jì),由于其“邊緣”都是一個(gè)速度高達(dá)40TB/s的互聯(lián)連接器。這意味著D1芯片可以直接以“邊對(duì)邊”的形式連接,并由此組成了一個(gè)Dojo超級(jí)計(jì)算機(jī)的單個(gè)訓(xùn)練模塊。
后者由25個(gè)D1芯片組成,因每個(gè)D1芯片之間都是無縫連接在一起,相鄰芯片之間的延遲極低,訓(xùn)練模塊最大程度上實(shí)現(xiàn)了帶寬的保留,配合特斯拉自創(chuàng)的高帶寬、低延遲的連接器;在不到1立方英尺的體積下,算力高達(dá)9PFLOPs(9千萬億次),I/O帶寬高達(dá)36TB/s。
基于此,馬斯克提出:將使用D1芯片打造的超級(jí)計(jì)算機(jī)集群Dojo ExaPOD。其由120個(gè)節(jié)點(diǎn)、總共3000塊D1芯片組成,計(jì)算單元數(shù)超過100萬(3000*354),在BF16/CFP8精度下的算力達(dá)到1.1ExaLOPS,遠(yuǎn)超目前全球最快的超級(jí)計(jì)算機(jī)富岳,后者算力為44.201 TFlops。
![]()
彼時(shí),馬斯克還在推特上回復(fù)網(wǎng)友時(shí)表示,ExaPOD的運(yùn)算能力足以模擬人腦。而這僅僅是一個(gè)開始,他稱下一代Dojo還將得到10倍的性能提升。
02
三重困境導(dǎo)致項(xiàng)目擱淺
然而,這一超前設(shè)計(jì)在2025年遭遇重挫。
2025年8月8日,有外媒報(bào)道稱,特斯拉正在解散其Dojo團(tuán)隊(duì),其負(fù)責(zé)人Peter Bannon也將離開公司,該團(tuán)隊(duì)剩余的員工將被重新分配到特斯拉內(nèi)部的其他數(shù)據(jù)中心和計(jì)算項(xiàng)目,公司計(jì)劃增加對(duì)外部技術(shù)合作伙伴的依賴。
對(duì)此,馬斯克本人給出的解釋是,分散資源設(shè)計(jì)兩款不同的芯片沒有意義。
![]()
但這顯然并不是全部,其背后是技術(shù)、人才、成本三重困境的疊加。
技術(shù)上,架構(gòu)復(fù)雜難以駕馭,產(chǎn)業(yè)鏈存在制造瓶頸。
Dojo項(xiàng)目的核心矛盾源于其顛覆性的設(shè)計(jì)理念。該架構(gòu)摒棄了傳統(tǒng)CPU/GPU的通用性設(shè)計(jì)思路,專注于將AI訓(xùn)練負(fù)載的計(jì)算密度與能效推向極致。然而,這種對(duì)特定目標(biāo)的極致追求,導(dǎo)致其在內(nèi)存和互連系統(tǒng)上引入了極高的技術(shù)復(fù)雜度。
架構(gòu)復(fù)雜性的直接后果是極低的制造良率。在晶圓尺寸的模組上,任何微小的布線缺陷或25顆D1芯片中任一的貼裝瑕疵,都可能導(dǎo)致高價(jià)值的Training Tile整體報(bào)廢。低良率使得規(guī)模化部署的成本高昂,較難具備商業(yè)上的經(jīng)濟(jì)可行性。
這種設(shè)計(jì)在理論上性能卓越,但在工程實(shí)踐和量產(chǎn)中面臨的挑戰(zhàn)巨大,成為項(xiàng)目失敗的根本原因。
人才上,則是核心團(tuán)隊(duì)集體流失。
![]()
DensityAI 創(chuàng)始團(tuán)隊(duì)。資料來源:華泰證券
據(jù)彭博社報(bào)道,2023年Dojo負(fù)責(zé)人Ganesh Venkataramanan離開后,成立了競(jìng)對(duì)初創(chuàng)公司DensityAI,隨后陸陸續(xù)續(xù)約20名核心工程師離開特斯拉并加入DensityAI。
成本上,充分考慮效益平衡,并開始依靠外部合作伙伴。
馬斯克長(zhǎng)期將Dojo定位為高風(fēng)險(xiǎn)、高回報(bào)的“前瞻性項(xiàng)目”,其可行性核心在于:定制化架構(gòu)在性能上的優(yōu)勢(shì)能否足以抵消所需的巨額投入與研發(fā)難度。然而,隨著英偉達(dá)Blackwell、Rubin系列及AMD MI350、MI400系列等高性能芯片相繼推出,Dojo的潛在性能領(lǐng)先空間明顯收窄。
在內(nèi)部成本持續(xù)攀升、項(xiàng)目進(jìn)度多次延期且需從其他戰(zhàn)略重點(diǎn)轉(zhuǎn)移資源的背景下,特斯拉在充分考慮成本效益平衡下,轉(zhuǎn)而傾向于外部成熟方案。
![]()
Dojo分布式架構(gòu)示意圖
因此,特斯拉在2025年7月轉(zhuǎn)向務(wù)實(shí)路線:與三星簽訂165億美元的AI6芯片代工合同,并在訓(xùn)練算力上加強(qiáng)依賴英偉達(dá)與AMD等。
03
Dojo 3.0“務(wù)實(shí)”回歸
作為“第一性原理”的堅(jiān)定信徒,馬斯克并未放棄自研算力的夢(mèng)想。此次回歸,他帶來的是一個(gè)截然不同、更為務(wù)實(shí)的Dojo 3.0方案。
重啟的關(guān)鍵前提,是特斯拉新一代車端AI芯片(AI5/AI6) 取得進(jìn)展。
根據(jù)馬斯克透露,特斯拉AI5芯片已接近設(shè)計(jì)完成,而AI6芯片目前處于早期階段,后續(xù)還將推出AI7、AI8、AI9,目標(biāo)是在9個(gè)月內(nèi)完成設(shè)計(jì)周期。
其中,AI5用于智能汽車和機(jī)器人。AI6則是機(jī)器人和數(shù)據(jù)中心都能用。AI7將瞄向太空算力。
![]()
這一速度明顯快于行業(yè)平均水平。目前,主流芯片廠商通常采用一年左右的更新周期。
不過,外界對(duì)馬斯克這一言論存有質(zhì)疑。據(jù)此前公開表態(tài),馬斯克曾在2023年7月稱AI5芯片已經(jīng)“設(shè)計(jì)完成”。若此說法屬實(shí),則當(dāng)前再度提及“接近完成設(shè)計(jì)”便顯得前后不一。
但無論如何,AI5對(duì)特斯拉確實(shí)非常重要。
AI5是特斯拉用于車端的下一代輔助駕駛芯片,即HW(Hardware)系列的延續(xù)。
馬斯克透露,AI5芯片將主要用于自動(dòng)駕駛系統(tǒng)的訓(xùn)練與推理計(jì)算,并為特斯拉人形機(jī)器人Optimus提供算力基礎(chǔ)。目前,特斯拉在售車型主要依賴AI4(HW4)芯片來運(yùn)行FSD系統(tǒng)。
根據(jù)馬斯克描述,AI5芯片單顆SoC性能大致相當(dāng)于英偉達(dá)Hopper級(jí)別,雙芯配置則接近Blackwell級(jí)別,但其成本極低,功耗也更低。
![]()
特斯拉劇透AI5芯片性能
“解決AI5芯片問題對(duì)特斯拉來說至關(guān)重要。”馬斯克解釋道:“如今AI5進(jìn)展順利,我們終于有了一些余力,可以重新啟動(dòng)Dojo3的研發(fā)工作了。”
盡管Dojo重啟,但與此前相比,還是進(jìn)行了一定的調(diào)整。
與此前不同,Dojo 3項(xiàng)目的核心在于架構(gòu)重構(gòu)與成本優(yōu)化,徹底摒棄了前兩代Dojo依賴自研D1芯片及晶圓級(jí)封裝的復(fù)雜路徑。
根據(jù)特斯拉戰(zhàn)略規(guī)劃,Dojo 3本質(zhì)上是將512顆AI5或AI6芯片密集集成于單塊主板,形成超級(jí)計(jì)算機(jī)集群,這種設(shè)計(jì)能將網(wǎng)絡(luò)布線復(fù)雜性與硬件成本降低數(shù)個(gè)數(shù)量級(jí),同時(shí)保留大規(guī)模并行計(jì)算能力。其中AI6芯片將采用2納米制程工藝,計(jì)劃整合原Dojo架構(gòu)優(yōu)勢(shì),實(shí)現(xiàn)車輛、Optimus機(jī)器人與數(shù)據(jù)中心的AI生態(tài)適配。
這一轉(zhuǎn)變的好處是顛覆性的。
成本與復(fù)雜度驟降:直接采用成熟、可大規(guī)模生產(chǎn)的芯片,繞過了D1恐怖的制造良率陷阱。馬斯克稱,這能將網(wǎng)絡(luò)布線復(fù)雜性和成本“降低幾個(gè)數(shù)量級(jí)”。
生態(tài)協(xié)同:實(shí)現(xiàn)了車端、機(jī)器人、云端數(shù)據(jù)中心的算力底層統(tǒng)一。芯片研發(fā)成果可多處復(fù)用,極大提升了研發(fā)效率和生態(tài)凝聚力。
風(fēng)險(xiǎn)可控:芯片制造依賴三星等成熟代工廠,特斯拉專注于自己更擅長(zhǎng)的系統(tǒng)架構(gòu)與集成創(chuàng)新。
特斯拉Dojo項(xiàng)目的重啟,不是一次簡(jiǎn)單的“復(fù)活”,而是一場(chǎng)戰(zhàn)略進(jìn)化。它標(biāo)志著特斯拉的AI算力戰(zhàn)略從追求極致的單一架構(gòu)探索,演進(jìn)為更務(wù)實(shí)、更系統(tǒng)化的生態(tài)構(gòu)建:即以車端AI芯片為核心基點(diǎn),通過架構(gòu)創(chuàng)新將其擴(kuò)展為高效的云端訓(xùn)練集群,從而實(shí)現(xiàn)車輛、機(jī)器人、數(shù)據(jù)中心三位一體的算力協(xié)同。
如果成功,Dojo 3或?qū)⒉粌H為特斯拉的自動(dòng)駕駛與機(jī)器人夢(mèng)想提供澎湃動(dòng)力,更可能重塑AI時(shí)代算力基礎(chǔ)設(shè)施的構(gòu)建范式。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.