特斯拉的自動駕駛技術一直是行業(yè)熱議的話題。今天,我們將采用AI技術來分析一下特斯拉的自動駕駛專利。
如何從特斯拉的專利中找出所有的自動駕駛相關的專利?
特斯拉與汽車相關的專利族超過了1000族,首先需要從中篩選出與“自動駕駛”有關的專利。如果采用傳統(tǒng)方法進行篩選,過程會非常費時費力,例如需要撰寫一條全面的自動駕駛檢索式,這其實并不容易。具體來說,既要盡可能地涵蓋自動駕駛的各種表達方式,如“autonomous driving”、“self driving”、“driverless”等關鍵詞,又要考慮各種相關的分類號。
更麻煩的是,很多與自動駕駛相關的專利,并未在文本中明確提到“自動駕駛”,比如涉及模型訓練和圖像處理的專利。特斯拉的不少專利雖然涉及模型訓練和圖像處理,專利文本中卻未明確出現(xiàn)“自動駕駛”這一關鍵詞,但實際上它們正是為解決自動駕駛問題而提出的技術方案。若要將這些專利識別出來,只能逐篇閱讀。因此,用傳統(tǒng)的方法,僅僅找出特斯拉所有自動駕駛相關的專利,就已非常困難。
現(xiàn)在,我們可以使用一種新方法:直接將特斯拉的全部專利交給AI,讓AI智能體逐篇進行閱讀分析。這里可以使用Maxipat的“AI注釋功能”:用戶首先選中特斯拉的全部專利,然后用自然語言向Maxipat的“AI注釋”模塊發(fā)出指令,比如:“幫我逐篇閱讀特斯拉的所有專利,篩選出與自動駕駛相關的專利,尤其需要找出專利文本中雖未提到‘自動駕駛’關鍵詞,但實質上是解決自動駕駛問題的專利,例如涉及模型訓練和圖像處理的專利。”
將上述這樣一段話告訴Maxipat的“AI注釋”模塊后,系統(tǒng)經過一段時間的運行,即可準確地將特斯拉所有與自動駕駛相關的專利挑選出來。
![]()
系統(tǒng)在運行一段時間之后,就會自動把特斯拉自動駕駛的專利挑出來。
![]()
在AI挑選出這些自動駕駛專利之后,會自動給挑選出的專利打上標簽,相當于AI一篇篇去閱讀特斯拉的專利,把想要的專利選出來。用戶接下來就可以在系統(tǒng)上選中這部分數(shù)據(jù)進行分析。
如何用AI批量分析挑選出的自動駕駛相關的專利?
分析完全可以通過自然語言的指令通過不同的角度進行分析。例如輸入“請梳理出特斯拉的自動駕駛專利與FSD密切相關的專利,并從這些專利出發(fā)分析特斯拉專利中的端到端技術。”
![]()
接下來用戶只需要不停地調整自己的指令進行操作,從系統(tǒng)中摘取的分析內容如下:
感知端到端
占用網絡與三維環(huán)境建模:上述WO2024073088A1專利詳細描述了特斯拉FSD中Occupancy Network的實現(xiàn)方式。車輛通過攝像頭獲取實時圖像,利用深度學習模型將車輛周圍環(huán)境劃分為體素網格并預測每個體素是否被障礙物占據(jù)。這一占用網絡輸出一個三維占用圖,相當于用純視覺手段生成了類似激光雷達點云的環(huán)境模型。專利指出,該模型還能結合表面屬性檢測來識別地面道路等表面特征,以豐富環(huán)境理解。基于占用網絡提供的三維環(huán)境感知,特斯拉FSD能夠在無GPS定位或預先繪制高清地圖的條件下,識別自身所處環(huán)境并進行定位。
增強目標檢測與距離預測:為了配合占用網絡的三維感知,特斯拉還改進了視覺目標檢測和距離估計的方法。例如,特斯拉的專利“預測自動駕駛的三維特征”提出利用單目攝像頭圖像經由訓練的機器學習模型來預測物體的三維軌跡/位置,并將其用于自動控制車輛。簡單來說,就是用神經網絡從攝像頭畫面中直接推斷出前方物體在三維空間中的位置和運動趨勢,再交由車輛控制系統(tǒng)決策。這一技術彌補了沒有激光雷達時距離感知的不足,該專利利用其他傳感器輸出作為訓練監(jiān)督信號,讓神經網絡學會從視覺推斷距離。此外,特斯拉的增強型目標檢測相關專利亦通過多攝像頭視場融合等手段,提高對障礙物的識別準確率和視野覆蓋。這些視覺感知改進專利共同確保了在FSD系統(tǒng)中,相機+神經網絡能夠勝任原本需要激光雷達和傳統(tǒng)算法才能完成的環(huán)境感知任務。
規(guī)劃決策端到端
聯(lián)合行為預測與規(guī)劃:CN120166977A號專利及其同族文件提出了一種聯(lián)合多代理行為預測和車輛規(guī)劃的AI建模技術。其核心是在攝像頭感知到周圍車輛、行人等動態(tài)代理后,引入分層節(jié)點圖結構來表示多主體可能的軌跡與互動。分層節(jié)點圖包含“目的層”和多個“交互層”,能夠將各個代理的意圖和相互影響關系建模。算法對節(jié)點進行打分,綜合考慮代理行為預測和自車目標,選出最優(yōu)的自車行駛軌跡。也就是說,這個專利將他車行為預測和本車路徑規(guī)劃放在同一框架下求解,用人工智能方法處理復雜交通中的博弈關系。其結果是增強FSD系統(tǒng)在城市街道、高密度交通等場景下的決策反應能力。相比傳統(tǒng)系統(tǒng)先預測他車再規(guī)劃自己的分段式流程,此專利體現(xiàn)出端到端聯(lián)合推理的優(yōu)勢,將環(huán)境中多元素的動態(tài)交互納入同一個模型中考慮。
基于視覺的端到端路徑規(guī)劃:特斯拉的另一組專利則專注于從視覺直接生成行車路徑。WO2024073088A1專利除了占用網絡感知外,還描述了車輛如何在得到占用網格后自動規(guī)劃路徑:處理器在生成三維環(huán)境模型并獲得目標點后,可直接利用圖像特征進行定位,不依賴GPS,再生成車輛行進路徑。其中提到,路徑可以表示為一系列控制指令,例如軌跡曲線、偏航角速度、前進速度、橫向速度等,這些都是車輛控制層面的量。特斯拉FSD的規(guī)劃決策以視覺神經網絡為基礎,再輔以少量規(guī)則約束,從而實現(xiàn)了從攝像頭畫面到駕駛動作的高度集成。
整體端到端架構
深度學習數(shù)據(jù)管線與實時控制:US11215999B2 “數(shù)據(jù)管線和深度學習系統(tǒng)”專利詳述了特斯拉FSD的大規(guī)模神經網絡架構如何直接輸出車輛控制指令。在該系統(tǒng)中,攝像頭等多源傳感器數(shù)據(jù)經過預處理被拆分為不同頻段/尺度的圖像分量,分別送入神經網絡的不同層,以提高特征提取效率。這種創(chuàng)新的數(shù)據(jù)管線使網絡既捕獲局部細節(jié)又利用全局視野。經過多層深度卷積處理后,網絡的推理結果直接對應車輛的控制動作,例如轉向角度調整、車速控制等。專利明確指出,這些由深度學習分析得到的結果被發(fā)送到車輛控制模塊用于輔助操作車輛。因此,該系統(tǒng)實現(xiàn)了從傳感器原始數(shù)據(jù)到駕駛控制決策的端到端自動化。值得一提的是,為保障如此大規(guī)模神經網絡在車載平臺上的實時運行,專利還介紹了通過分解圖像、并行處理以及逐層降分辨率等方法來提升計算效率,顯著減少深度學習推理的計算量和延遲。
多傳感器融合模擬與專用硬件支持:上述US20220043449A1多通道傳感器模擬專利是特斯拉純視覺/低成本傳感方案的關鍵補充。傳統(tǒng)自動駕駛往往倚賴昂貴的激光雷達等傳感器提供精準的3D環(huán)境數(shù)據(jù),而特斯拉選擇用算法彌補硬件:通過神經網絡融合多攝像頭+雷達等信息,生成與激光雷達類似的環(huán)境點云或高分辨率感知結果。專利說明這種模擬的高容量傳感數(shù)據(jù)可無縫用于現(xiàn)有的目標檢測和控制算法。換言之,特斯拉用端到端學習模型把便宜傳感器的輸出提升為昂貴傳感器的效果,降低了對特定硬件的依賴。
特斯拉FSD采用“純視覺”方案為主,僅輔以少量常規(guī)傳感器(如攝像頭+毫米波雷達/超聲波),不使用激光雷達。特斯拉多項專利表明其有意規(guī)避高成本的高性能傳感器:例如US20220043449A1專利指出,高容量傳感器(如360°LiDAR)雖然信息豐富但非常昂貴復雜,而特斯拉的系統(tǒng)通過組合多個低容量傳感器的數(shù)據(jù)來模擬高容量傳感器數(shù)據(jù),讓沒有昂貴傳感器的車輛也能獲得類似環(huán)境感知能力。這意味著在特斯拉FSD中,攝像頭+神經網絡=激光雷達替代品。從成本和部署角度,攝像頭體積小且廉價,可多方位安裝;激光雷達則價格高昂且結構笨重。特斯拉通過視覺融合技術實現(xiàn)激光雷達功能,大幅降低傳感器依賴和硬件成本,同時減少了對高精度地圖和定位傳感器的需求。
特斯拉FSD的架構高度依賴深度學習,將感知、語義理解、行為預測、路徑規(guī)劃等功能盡可能交由神經網絡端到端完成。一系列專利(如Occupancy Network、聯(lián)合規(guī)劃與預測、深度學習管線等)顯示:攝像頭圖像經過神經網絡直接輸出豐富的環(huán)境模型和決策建議。例如,占用網絡模型使車輛對周圍占用狀況和可行駛空間有了端到端的理解,并與規(guī)劃模塊聯(lián)動;聯(lián)合規(guī)劃專利則把多車博弈決策融入單一AI框架。特斯拉的HydraNet+Occupancy網絡多任務模型以及深度學習控制器,使整個系統(tǒng)更像一個整體智能體,能夠通過端到端訓練不斷優(yōu)化全局表現(xiàn)。這種高集成度優(yōu)勢在復雜場景下尤為明顯:當?shù)缆翻h(huán)境瞬息萬變時,端到端網絡能同時考慮感知不確定性和行為優(yōu)化,做出更協(xié)調的響應。簡單說,特斯拉將人類駕駛經驗盡可能用神經網絡吸收,從而在FSD中實現(xiàn)類似人類視覺-大腦-操作的一體化架構。
成本與計算資源需求: 不采用激光雷達讓特斯拉在硬件物料上有巨大優(yōu)勢。然而,這一路線將挑戰(zhàn)轉嫁到計算和算法上:需要強大的計算硬件和高效算法來處理海量視覺數(shù)據(jù)。特斯拉通過專利展示了兩方面的應對:一是優(yōu)化算法,如數(shù)據(jù)管線專利采用多分辨率分層處理,大幅降低神經網絡運算量;二是自研芯片,如FSD計算平臺使用專用加速器和并行處理器,實現(xiàn)每秒數(shù)十TOPS的算力支持實時深度學習推理。相較傳統(tǒng)方案依賴激光雷達直觀數(shù)據(jù)、所需計算相對可控,特斯拉FSD需要在車載實時計算上投入更多。但特斯拉的設計在規(guī)模化后成本更具優(yōu)勢:攝像頭+自研芯片隨著產量提升可以攤薄成本,而激光雷達等昂貴器件難以大幅降價。并且,特斯拉網絡優(yōu)化使其即便處理8路攝像頭數(shù)據(jù),所需算力仍在可實現(xiàn)范圍。另外,去除了激光雷達后,傳感/計算系統(tǒng)功耗和維護也有所降低。總體而言,特斯拉以更高的初始研發(fā)投入(AI算法和芯片)換取了單車更低的硬件成本和可量產性。這一點在專利US20220043449A1中得到體現(xiàn):廉價傳感器陣列+智能模擬即可替代昂貴傳感器達到類似效果。
特斯拉FSD的專利布局顯示出一條清晰的“純視覺+AI”技術路線:用神經網絡算法最大化地替代昂貴傳感器和復雜規(guī)則,實現(xiàn)感知、預測、規(guī)劃到控制的端到端閉環(huán)。
Maxipat致力于作為成為科技創(chuàng)新和知識產權工作的AI加速器,主要包括輔助創(chuàng)新:提高研發(fā)的科技創(chuàng)新效率;智能搜索與分析:將專利搜索和報告制作借助AI實現(xiàn)智能化,包括智能查新、無效、FTO、Landscaping報告;投資助手:快速生成投資賽道報告、專利購買篩選、專利轉化評估。目前開放注冊中。輔助科技創(chuàng)新和知識產權工作的AI智能體
感興趣的朋友可以通過以下三種方式填寫申請信息:
1. 請發(fā)郵件到郵箱:info@maxipat.com
2. 點擊文末閱讀全文;
3. 掃描以下二維碼
感興趣的朋友可以加筆者微信patentlight
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.