![]()
![]()
作者:張葉子
編輯:Mark
出品:紅色星際(ID:redplanx)
頭圖:自動駕駛數據智能體系 “MANA(雪湖)”
12月24日,毫末發布Q4最新進展,其中的亮點是:
——A輪融資近10億,晉升獨角獸俱樂部;
——在乘用車方向,這個季度增加了三款車型,瑪奇朵、拿鐵、哈弗神獸,至此,毫末成立2年的時間里,搭載毫末產品的乘用車車型達到5款;
——小魔盒輔助駕駛里程已經突破400萬公里,再次刷新前一季度的百萬里程成績單;
——發布數據智能系統MANA,真正意義上完成智能數據的閉環,城市NOH 34分鐘無接管“一鏡到底”曝光。
毫末常規的技術日也和特斯拉一樣,改名為AI DAY,顯示了自己在人工智能和自動駕駛方面的雄心,實力能否撐得起雄心,我們以Q4最新發布為線頭來具體扒一扒。
![]()
1. 數據智能系統“MANA(雪湖)”
冬天是適合思考的季節。
在三體中,羅輯被選為面壁人之后,遁世到一片只有森林、雪山、湖泊、木屋、壁爐、紅酒的世外桃源,在那里,它和莊嚴度過了夢幻的五年。
五年之后,當所有面壁者都被破壁之后,莊嚴和孩子被“人質”,羅輯不得不直面人類危機,寒冬深夜,羅輯一人在結冰的湖面上散步,掉入冰窟,窒息中,他看到旋轉的黑暗星空,頓悟宇宙社會學真相,總結出黑暗森林法則,發出恒星咒語,為地球人扳回一局。
這個湖是天才思想、戰略轉機橫空出世的地方,然而在三體中,這是一個沒有名字的地方,因為女神莊嚴的一句話,不需要知道它在世界上的具體地點,知道了,感覺離世俗的距離就近了。
在中國西藏,有這樣一個地方,叫Mana(雪湖)。毫末用這個名字命名數據智能系統,用意十分明顯,希望在這里,數據能真正變成知識和智慧,長成“破壁”自動駕駛的戰略武器。
智能系統是一家人工智能公司的核心競爭力,恰如一個學霸天才的大腦,拿到信息數據的原材料,學得又快又深,還可以舉一反三,不斷進步。
而且這種數據對毫末來講,早已不是實驗室級別的訓練集、也不是你知道它去哪也知道做了什么事情的采集車數據,而是真正量產后來自真實世界千奇百怪的數據。
毫末的MANA系統在這個時間節點推出,完全基于企業面對的現實需求,而非口號。這個現實是什么?
四百萬公里的現實里程帶來令工程師興奮的數據洋流,讓算法和架構迅速迭代,豐富餌料投喂之下,自動駕駛快魚迅速調整底層架構。
與此同時,未來可預期的海量數據(長城爸爸的掌上明珠,沒有猜忌鏈,沒有懸念,穩穩地上車)帶來的挑戰也要求底層構架能Hold住這種變化,存儲、傳輸、計算訓練、驗證、仿真、標注等等,各個方面都對系統提出更高要求(就在發布日前一天官宣融資10億,錢也有了,PK特斯拉超算中心也安排上了)。
MANA架構
下面我們來了解一下MANA的具體構架。
![]()
(毫末智行數據智能體系 “MANA(雪湖)”)
MANA是毫末體系完善的研發體系,由四個大部分組成,分別是:數據看板系統(VENUS)、車端系統(TARS)、大規模不間斷學習系統 LUCAS(Large Scale Autonomous Continuous Learning System)、底層系統(BASE)。
VENUS是數據看板,我們去展示、審查、洞悉數據可視化的能力。
TARS是車端能力,包括TrasView(感知),TrasGo(認知),規劃決策控制、Map(地圖定位),Meta(仿真引擎),它們更多為車端算法服務。
LUCAS是基于數據學習研發的一套系統,主要有診斷、分析、檢索三個模塊。核心是數據驅動,通過迭代數據來自動化地迭代模型。目前業內普遍迭代模型的思路是利用工程師來人工分析錯誤,將錯誤進行提煉總結,然后設計出合適的方案。這種方法在錯誤數據頻次高、共性多的時候能夠較好地解決問題,但面對海量數據和長尾,就會無能為力,LUCAS解決了這個問題。
BASE是中間件、數據存儲、數據計算相關的服務。
四部分的功能分別是:
TARS解決的是從0到1的問題。
LUCAS里主要解決大規模泛化問題,從0到1之后如何從1到N,包括感知泛化、認知泛化、車型泛化、芯片間泛化,標注、訓練,云端自動問題的分揀、診斷,以及一些云端和離線在線的評測。
BASE表達一種通用性,不管是車端做從0到1的原型研發,還是做大規模量產之后從1到N的泛化,都依賴于BASE。
MANA意義
表面上看,似乎每個自動駕駛公司的智能系統構架都大同小異,在之前也有一套數據系統運作,那Q4大力推出全新系統,與之前一直存在的有何不同呢?
據技術Leader介紹,不同主要在兩個方面:首先,之前的各個子單元雖然存在并運作著,但存在很多配合不好的環節,新系統對這些地方做了重新的整理和規劃。
![]()
(毫末智行MANA(雪湖)系統與特斯拉對比圖)
比如說LUCAS和TARS之間的配合。核心在于LUCAS和TARS之間的交互和配合,感知和認知是完全兩套不同的LUCAS和TARS的配合方法,感知比較常見的是TARS提供模型,LUCAS提供數據,1+1最后達到N的效果。在認知上不一樣,相當于LUCAS提供數據里學到的毫末想要達到的目標,TARS通過強化學習、模仿學習把它再學習過來,最后部署到車端。
第二,梳理出了清晰完善的理論框架,相當于公司技術研發的一套頂層設計。在任何一個組織里,頂層設計的重要性不言而喻,沒有頂層設計,公司的長短期目標、部門任務、業務權責無法有序展開,大家都不知道怎么思考。有了MANA,數據智能處理能有序循環起來,組織也能更好分工協作,培育出自我生長的力量。
![]()
2. 技術亮點
感知:從后融合到前融合
感知方面,業界和毫末的通用做法是:拿到一張圖片,通過一個骨干學到不同的特征層,再基于不同的Head區隔不同任務,比如說一些分割,比如說一些道路元素,比如說一些障礙位等等。包括點云也一樣,像小鵬和毫末的下一代車,搭載有激光雷達,多個激光雷達之間拼到一起,完成分割和障礙物檢測功能。
一張圖片描繪相關的東西,但是前視相機不會和側前相機、激光雷達有什么互動,更多是在后融合的階段把目標結果進行融合。這樣的做法存在很多問題,最大的問題是——它沒有很好地利用好多個傳感器之間的配合和交互。
既然后融合弊端這么大,為何還能成為業內主流呢?
原因是之前大家都跑高速,前面有一個攝像頭,一個Mobileye,很多主機廠做PNC相關的事情就夠了。
這些量產產品大多就前面有一個攝像頭,它所謂的融合是這個相機和毫米波雷達的融合,這種融合相對比較簡單的。
但到了復雜的城市,光看前面一個攝像機肯定不夠,360度都要視覺和點云。以毫末的車為例,硬件里有12個攝像頭,還有激光雷達和毫米波雷達,那就是12個攝像頭之間的融合,難點會變很多。
那么,如何把這些傳感器的信息有效融合到一起?
毫末采用的方法是前融合的Tensor map思路。先是不同的相機、點云提取特征,提取到張量的層次,在這個環節下再進行拼接,拼到俯視圖的視角,3D的維度,在3D維度上再去檢測相關的障礙物、車道線等等,形成一個Tensor map新的模式。
通過這種方式就可以有效解決后融合所引發的跨相機的追蹤,跨相機障礙物的分裂等等這種問題,可以提高復雜場景下對于障礙物和車道線感知能力。
此外,還有一個和其他的一些國內公司稍微不太一樣的點是——毫末會直接預測深度信息(和特斯拉一樣)。很多公司采用的技術方案是——模型只預測2D的信息(比如說圖像上像素點上的信息),再通過后處理的方法(比如說IPM),通過一些幾何關系去倒推計算深度信息。
這個方法毫末之前嘗試過,在高速上面沒有什么問題,在城市場景里面效果不太好,因為高速上車少,也比較簡單,車也沒有什么特別詭異的、逆行的,而在城市里面這種效果就會很差,它的測距精度不太高,深度信息回歸的不好。
和特斯拉不一樣的是,毫末在預測之前先把特征維度就做了一次融合,基于這個融合之后的特征,再去預測這個東西是障礙物還是車道線,相當于是一個后融合。
那么,兩者的效果如何呢?
公司每隔一段時間都會做競品測試,目前來看,兩者都很不錯,但也都是剛剛開始(特斯拉最近才將前視和前玻璃融合),可以相互借鑒,取長補短。
![]()
(毫末智行Transformer與CNN深度融合理念)
正如公司CEO顧維灝所說,Transformer技術可以幫助自動駕駛感知系統更深刻地理解環境語義,與CNN技術的深度融合將會解決AI大模型量產部署的難題,Transformer與CNN深度融合將會成為自動駕駛行業下半場競爭的關鍵技術。
而這個融合也是MANA(雪湖)系統的精華之處。
認知智能:讓人工智能更像人
認知智能,這又是今年的一個熱門提法,但究竟是什么,大部分人還是一頭霧水,為什么呢?和感知一比較就知道了。
感知要解決的是從傳感器信號中重建客觀世界的問題,感知當前相對成熟,雖然大家感知做的程度不太一樣,有些人做得好,有些人做得一般。但是感知它有最重要的特點,它有清晰標準。客觀世界什么樣的,你看到的感知出來的結果就是什么樣的,完全白盒的,沒有歧義,剩下的就是用巨量的數據去保證覆蓋掉所有的Corner Case。
而認知要解決的是從客觀世界到駕駛動作的映射問題,它本身就沒有這種共識性的衡量標準。比如說一個人現在要左轉,對向正好來車,老司機一腳油就過去了,而對于剛拿本的司機可能就選擇讓行。那在安全的前提下,究竟哪種是更好的駕駛策略呢?
![]()
(MANA認知智能數據圖片)
認知智能的核心是通過大量數據在復雜場景里學習人開車的規律和人開車的方法,用這個數據來指導算法和迭代。
他要解決的問題是讓機器達到像人一樣開車的體驗,而非充滿機械化痕跡。
雖然目前不少公司也都在朝這個方向做,但發展階段存在差異,大部分公司還停留在從傳統機器人理論衍生出來偏幾何學、偏機器人運動學的階段,通過規則式的、求解的方式來進行軌跡規劃。比如精確測量出來這個車距離我20.5米,那個車距離我16.8米,所以我就要這么走。
而顯然人在開車時并非如此,而是在一些基本的社會常識和駕駛規范的基礎上,按照自己的目的更智能地去選擇自己的駕駛行為,而不是通過純粹的數學計算來駕駛車輛。
通過復雜的認知算法體系,毫末想要實現的第一步是,讓自動駕駛符合大眾的口味,第二步則是通過用戶畫像,實現自動駕駛司機的千人千面。這點很容易理解,先要達到平均分,讓大部分人感覺OK,然后讓各種人都滿意。因為高級白領林妹妹、肌肉達人李逵、霸道總裁周瑜開車、小鮮肉唐僧的駕駛風格和對駕駛體驗的要求肯定是非常不同的。
所以毫末專門建立了一套體系。這套系統包括三個向量,安全、舒適、高效。
以安全為基礎,通過將場景和動作被數字化后,從大量的數據中提煉出舒適和高效的量化標準,這樣就可以避免純機械的操作,讓用戶感覺是老司機在開。
![]()
3.進階之路
從原始社會進入封建社會,看天吃飯的原始人不懂,面對同一片土地,為什么有的部落冬天也能吃到糧食了。
從封建社會進入資本社會,地主們不明白,為什么土地、勞動力、生產工具都在我手里,還是被資本家干翻了。
一如以后新一茬的Old Money不懂,資源都在我手里,怎么就被革命了呢?
原因高中課本說得很清楚,新的生產要素出現,帶來生產力和文明形態的大變革。
而數據就是讓人類文明產生第四次大變革的那個新生產要素。
為了表達對數據信仰的重視程度,毫末用“思想鋼印”來表達它,每個三體讀者都知道思想鋼印的威力,它代表深入骨髓的堅信,不需要再去接受任何理性判斷的審視。
但在通往L5的路上,信仰需要正確的戰略思想,風車戰略和漸進路線是毫末的選擇。
風車戰略
什么樣的公司能成功?一定是掌握規律并最領先于對手的,Why?
在這里,黑暗森林兩條基本公理同樣適用:
第一,生存是文明的第一需要。
第二,文明不斷增長和擴張,但宇宙中的物質總量保持不變。
毫末對自動駕駛實現的判斷是自動駕駛商業化三定律:
第一,從低速到高速;
第二,從載物到載人;
第三,從商用到民用。
從目前來看,封閉場景的餐廳酒店服務機器人、倉庫倉儲機器人、家庭的掃地機器人都已經被商業化。開放場景的無人物流也在今年快速走向商業化。
先從最快商業化的無人物流小車、乘用車輔助駕駛、智能硬件三個戰略主戰場入手,取得造血能力和數據能力。但核心是打造自己的核心——數據智能,在總量有限的市場上,爭取領先優勢,形成對資金、人才、數據迭代的馬太效應。
董事長張凱對自動駕駛的另一個判斷是:對于賽道參與者而言,在2022年沒有形成自己相對穩定的商業模式是致命的。
從外部環境來看:
第一,與前幾年智能手機市場比較類似,行業將會從最初的倒三角型形態向呈現T字形態轉變,頭部效應越發明顯。2022年,有高效、低成本的數據智能體系,實現規模量產的企業與其他企業的差距將有顯著拉開。
第二,數據安全與數據合規將進一步增加自動駕駛數據智能體系的閉環難度和成本,對于沒有在此之前打好基礎的企業,隨著2022年國家層面將會出臺細則強制執行數據安全上位法,完成同樣的體系建設,難度和成本驟增。對于新進入者,更是相當與加高了行業進入壁壘,機會窗口幾乎已經關閉。
![]()
(毫末智行董事長張凱)
從各個方面看,2022年將是毫末拉開與友商差距的一年。張凱提到的要打贏“無人物流車”、“城市場景輔助駕駛”和“數據智能”三場戰役,都有比較堅實的基礎。且公司目前已經準備好了充足的技術彈藥和資金,營業額已達數億元,加上剛融資的近10億人民幣。
整個毫末團隊都在摩拳擦掌準備2022年的三大戰役。
“無人物流車”方面,實際上智能硬件核心就是智能底盤,而毫末只是把這個智能底盤用在無人物流車上,其實最早公司有一個產品做Mini bus,但當時的判斷,Mini bus的商業機會來的更晚一些,因此暫時封存了Mini bus的很多技術,直接把底盤拿出來更多的去拓展無人物流。
市場上現在很多初創項目做自動駕駛底盤,而究竟做得好不好,取決于團隊基礎能力:第一,是不是真的能設計出來,第二,取決于它的供應鏈能力,是不是真的能夠做低成本。本質上,汽車硬件拼的就是規模效應。而長城的背景讓毫末能迅速推出十多款相關硬件產品。
正如美團的李達總所說,市場上找了一圈,最后發現毫末的底盤最好。
12月份,毫末智行迎來第1000輛末端無人物流車的量產下線,2022年,毫末智行團隊打算將無人物流車項目擴大3倍,達到3000輛(這些計劃都是根據合作伙伴的2022年規劃)。
這些并不是拍腦袋拍出來的數據,而是通過團隊沙盤推演推出來的。
![]()
(毫末智行智能駕駛產品路線圖)
其次是城市輔助駕駛場景之戰。2022年,乘用車輔助駕駛的競爭將會進入下半場,下半場的競爭主要集中在城市開放場景的領航自動駕駛。毫末智行為此儲備了小魔盒3.0計算平臺、新一代AI自動駕駛技術、MANA數據智能體系,以及其最強的技術工程化經驗。
最后是數據智能MANA(雪湖)系統,MANA的推出將幫助毫末在數據處理和智能分析上建立更大的優勢。
打破自動駕駛分級思維
長期以來,自動駕駛分級是各種迷思和爭論的重災區。
比如宣傳中的PK,你說L2、L2+、L3、L3+,和孔乙己寫茴香豆似的。再比如行業中L2搜集的數據L4到底能不能用的問題。
那L2到L4,對毫末來說,數據到底能否通用呢?
公司技術Leader告訴筆者,一方面,從硬件和軟件開發上來看,并沒有看到L4和所謂的L2之間有什么區別,唯一的區別可能在于用戶接管策略的不同。比如說用戶不扶方向盤,所謂的L4不扶就不扶,無所謂,可能所謂的L2來說,你不扶我就提醒提醒你等等。這些簡單來說是一些軟件的開關,區別不在硬件和算法上。
另外,不管L幾都有自己的數據價值,問題的本質不在于數據本身的質量和結構,而在于怎么能夠更好地應用。
所以毫末選擇先要盯著更多功能、更好的用戶體驗去做。在之前的技術日上,CEO 顧維灝也曾經說過,做L2的,包括特斯拉在內,無論是硬件設計、軟件開發、還是產品策略,都是瞄著更高級別的,對用戶帶來更好體驗的,往更好的目標去做的。
在目前來看,用戶并不關心L幾,而是更關心安不安全、體驗好不好、接管率高不高這些指標,所以,這個分級的概念也正在淡化。
![]()
(毫末數據智能思想鋼印)
得益于毫末開放透明的文化,無論是行業小白還是小紅,都能從每季度的AI DAY上了解到公司技術、組織、戰略、思想、合作伙伴方面的變化。
自動駕駛是一場全社會的馬拉松,需要更高效的協作,開放有益進步,希望,在這場比拼中,毫末能用自己的聲音喊出一聲:
自動駕駛,我是你的破壁人!
另外,整個公司從辦公室到系統,每個毛孔都充斥著濃濃的三體味,發布會都要發書,下次AI Day,咱們能不能憑這份狂熱,感動劉慈欣,把他拽到車上,和這次融資十億一樣,再上個國際頭條。
-END-
![]()
紅色星際
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.