![]()
作者|Hayward
原創(chuàng)首發(fā)|藍(lán)字計(jì)劃
馬斯克最引以為豪的特斯拉智能座艙,在中國市場(chǎng)卻如路邊一條、無人問津,想必他心里一定不太好受。
就像《英雄本色》里小馬哥發(fā)狠地說出“我失去的一定要親手拿回來”一般,大洋彼岸的另一位“小馬哥”,似乎也在憋了半年之后,要讓自己的特斯拉重新拿回汽車智能化的王者地位。
上周四,在 Grok 大模型正式發(fā)布的隔天,馬斯克興奮地在 X 上宣布,Grok AI“最遲”將于下周(也就是這周)在特斯拉汽車上推出。
一旦實(shí)現(xiàn),意味著特斯拉在智能化上邁出極其重要的一步。因?yàn)檫@不僅是馬斯克首次為“Grok 上車”這個(gè)餅給出了準(zhǔn)確的時(shí)間表,而且要上車的 Grok,還是馬斯克口中的“地表最強(qiáng) AI”:
比如,馬斯克早就聲稱 Grok 4 要 “重寫人類知識(shí)庫”;在發(fā)布會(huì)上,馬斯克再次強(qiáng)調(diào) Grok 4 是目前世界上最聰明的 AI。
這么厲害的 AI 要上車,國內(nèi)智能座艙的領(lǐng)頭羊——華為理想們,能招架嗎?
吹牛還是真實(shí)力?
一提到 Grok,更多人最先想起的可能是它的“口無遮攔”,無論是說“日本歷史上最大的煙花是原子彈爆炸”,還是支持希特勒的“反猶言論”都令人印象深刻。
而在 Grok 4 發(fā)布之后,大家的關(guān)注點(diǎn)又放到了它最高可達(dá)每年 3000 美元的“天價(jià)”訂閱費(fèi)用上。所以當(dāng)馬斯克說 Grok 4 是「世界最聰明 AI」 的時(shí)候,更多人持有的是懷疑態(tài)度。
果然,在 Grok 4 在實(shí)際測(cè)試中馬就“翻車”了。
博主@ karminski-牙醫(yī) 發(fā)微博稱,經(jīng)過他的測(cè)試,在「20小球在七邊形里面彈跳」的經(jīng)典試題中,Grok 4 不僅在 3 次代碼生成中就有 2 次有語法錯(cuò)誤,唯一一成功的,表現(xiàn)也和初版的 DeepSeek R1 有明顯差距。

在另一個(gè)難度更高的「煙囪爆破模擬」中,Grok 4 的表現(xiàn)也比較一般,不僅散落的粒子粗糙模糊,最離譜的是模擬出來的煙囪底部甚至不是圓柱體的…和旁邊的 DeepSeek R1 一比,簡(jiǎn)直高下立判。

反正, Grok 4寫代碼根本沒有第一梯隊(duì)水平,更別說牛吹上天的「世界上最聰明 AI」 了。
不過,盡管馬斯克沒有確認(rèn)即將上車的 Grok會(huì)在特斯拉的智能座艙中扮演什么角色,但國外媒體分析大概率會(huì)先在車機(jī)中擔(dān)任「語音助手」。
如果只是要做「語音助手」,那這項(xiàng)功能對(duì) Grok 來說就是牛刀小試了。
特別是作為語音助手最需要的大模型能力:多學(xué)科推理、語義理解、上下文理解和 Agent 能力方面,Grok 4 在目前的大模型里的確算是數(shù)一數(shù)二的。
多學(xué)科推理這塊,在 HLE(Humanity’s Last Exam),一般中文翻譯為“人類終極考試”或“人類最后考試”的測(cè)試中,無工具輔助的情況下,Grok 4 的得分為 25.4%,大幅超越Gemini 2.5 Pro 的 21.6% 和 OpenAI o3的 21%;如果有工具輔助,則 Grok 4 的得分可以進(jìn)一步上升到 38.6%,Grok 4 Heavy 的得分更是達(dá)到了 44%。
![]()
另外在ARC-AGI 測(cè)試中,Grok 4 甚至“創(chuàng)下新紀(jì)錄”。這項(xiàng)測(cè)試旨在評(píng)估 AI 模型的通用智能水平,題目主要是視覺推理類測(cè)試,Grok 4 的得分為 16.2%,在得分坐標(biāo)系中可以說是“遙遙領(lǐng)先”。
![]()
另外在上下文理解方面,Grok 4 支持256k token的上下文窗口,雖然比不上Gemini 2.5 Pro 變態(tài)級(jí)別的100萬個(gè)token,但也超越了Claude 4 Sonnet、Claude 4 Opus 、ChatGPT o3的200k token和 DeepSeek R1 0528 的 128k token,用來做語音助手是綽綽有余了。
而且馬斯克還說Grok 4 基礎(chǔ)模型的第七版將在本月完成,會(huì)擁有更出色的視頻理解能力和工具調(diào)用能力;接下來幾個(gè)月 xAI 還會(huì)推出代碼模型、多模型智能體以及視頻生成模型。
![]()
總而言之,哪怕是單智能體版本的 Grok 4,在車上調(diào)節(jié)個(gè)空調(diào)、雨刮、后視鏡什么的肯定夠用了。
有 Grok 加持,特斯拉的智能座艙堪稱是小米加步槍換巴特雷,試想在特斯拉原先就非常炸裂的銷量之上,還有了能用自然語言流暢對(duì)話、操控大面積的車用功能的語音助手,直接解決了一個(gè)消費(fèi)者詬病許久的槽點(diǎn)。
只要特斯拉上的 Grok能達(dá)到國內(nèi)新能源車語音助手的平均水準(zhǔn),小米、理想、華為、小鵬等在發(fā)布會(huì)上“嘲笑”特斯拉的點(diǎn)又少了一個(gè),宣發(fā)部門壓力又大了一點(diǎn)。
但「語音助手」就是 Grok 上車的全部意義嗎?顯然不是。
為 FSD 賦予靈魂
除了能補(bǔ)齊人機(jī)交互的短板之外,我們不妨腦洞更大些:如此強(qiáng)大的 Grok 4,有沒有可能甚至可以影響、控制 FSD?
這個(gè)腦洞并非毫無根據(jù)。在咱們國內(nèi),新能源車企們的智能輔助駕駛功能規(guī)劃里,早就把「自然語言指揮輔助駕駛」作為下一代輔助駕駛系統(tǒng)的必備功能了。
在 NVIDIA GTC2025 上,理想高管提到了在自家下一代自動(dòng)駕駛技術(shù) MindVLA 中,要讓汽車的智駕系統(tǒng)變成聽得懂、看得見、找得到的專職司機(jī)。
![]()
在理想的描述中,用戶可以和汽車系統(tǒng)深度互動(dòng),比如在智駕的過程中一旦車子開快了,就可以用“開得太快了”的模糊語音指令來限制車速;車子已經(jīng)規(guī)劃好智駕路線后,車主也可以臨時(shí)改變主意,對(duì)著車機(jī)說“在下一個(gè)路口右轉(zhuǎn)”,智駕就會(huì)根據(jù)指令修改路線。
這個(gè)像“科幻片”一樣功能,目前還有華為、小鵬、極氪和小米等車企在規(guī)劃。
耐人尋味的是,Grok 4 所展現(xiàn)出來的能力,就像為「自然語言指揮輔助駕駛」量身定制一般。
「自然語言指揮輔助駕駛」里,AI 對(duì)自然語言的理解和對(duì)駕駛意圖的精準(zhǔn)映射是核心。這時(shí)Grok 4 支持256K 上下文窗口與多代理協(xié)作架構(gòu)(Grok 4 Heavy 專屬),有同時(shí)處理用戶語音指令、車輛狀態(tài)與環(huán)境數(shù)據(jù)的復(fù)雜關(guān)聯(lián)的潛力
當(dāng)用戶說“前面要堵車了,換條車少的路”時(shí),Grok 就能解析出三重語義:環(huán)境感知(識(shí)別地圖上的擁堵狀態(tài))、用戶偏好(“車少”= 低流量路徑)和動(dòng)作生成(觸發(fā)路徑重規(guī)劃),進(jìn)而快速選擇一條新的行車路線。
另外,Grok 4 Heavy 的4-Agent 并行架構(gòu)從技術(shù)上為 FSD 提供“類人決策腦區(qū)”,這就和國內(nèi)車企在智駕系統(tǒng)中強(qiáng)調(diào)的“大小腦”架構(gòu)有點(diǎn)相似。
![]()
例如,Grok 4 Heavy 的4 個(gè) Agent 可以分別是感知代理(融合數(shù)據(jù)構(gòu)建占據(jù)網(wǎng)絡(luò))、規(guī)劃代理(基于空間模擬能力的路線規(guī)劃)、交互代理(主要處理車內(nèi)語音交互和指令)和安全代理(實(shí)時(shí)監(jiān)控 Action Token 與交通規(guī)則的沖突)。
在打開 FSD 功能時(shí),四個(gè)代理之間就能互相協(xié)作,在一個(gè)簡(jiǎn)單的“向左超車”語音命令場(chǎng)景,交互代理感知用戶命令、感知代理識(shí)別左側(cè)的車道情況、安全代理判斷是否存在安全超車的窗口,最后規(guī)劃代理規(guī)劃具體的超車路線,由 FSD 實(shí)現(xiàn)超車。
如果功能可以上車,這種語音指令還能拓展到非常多的用車場(chǎng)景中,包括理想提出的“找車位”、“靈活的路線規(guī)劃”等等。
此外,結(jié)合馬斯克在自動(dòng)駕駛無人車上的動(dòng)作,Grok 的上車還可能是特斯拉打造全新的車載 AI 生態(tài)閉環(huán)、部署自動(dòng)駕駛的關(guān)鍵一環(huán)。

說到底,智能駕駛的競(jìng)爭(zhēng),最終都是自動(dòng)駕駛的競(jìng)爭(zhēng)。6 月 22 日起,特斯拉在德州奧斯丁啟動(dòng)首批 Robotaxi 服務(wù);相比 FSD,Robotaxi 或許更加需要聰明的“大腦”,或者說“靈魂”。
有了「語義層級(jí)指揮 FSD」,乘客可以在合規(guī)、安全的情況下控制Robotaxi 的駕駛節(jié)奏、風(fēng)格、路線,同時(shí)還能像正常詢問出租車司機(jī)一樣問車子“你剛剛為什么急剎?”
這時(shí), Grok 就可以查詢車子的決策日志,把急剎的原因轉(zhuǎn)述為人能聽懂的語言,比如“剛才前面的車急減速”等。
不過相比理想預(yù)告 MindVLA 將在 2025 年下半年上車、華為類似效果的盤古大模型5.0 賦能ADS 將于2025 年 8 月開始陸續(xù)鋪開,特斯拉能不能真正實(shí)現(xiàn)「語義層級(jí)指揮 FSD」還是未知數(shù)。
同時(shí),「自然語言指揮輔助駕駛」還面臨著監(jiān)管、權(quán)責(zé)、倫理道德和算力部署等一系列難題,對(duì)中國消費(fèi)者來說最靈魂的問題是,Grok 能否進(jìn)入國內(nèi)?
這一點(diǎn)影響的不止遙遠(yuǎn)的「自然語言指揮輔助駕駛」,還有“這周上車”的「Grok 語音助手」,大概率又是北美用戶先嘗鮮,中國用戶望眼欲穿。
盡管“世界最強(qiáng) AI 上車”充滿了未知,但不代表國產(chǎn)新能源廠商們能松一口氣。只要這事存在可能,國產(chǎn)汽車廠商們就得面臨巨大壓力。
國產(chǎn)車,壓力山大
只看當(dāng)前的技術(shù)和銷量,特斯拉都有從容的資本,更別說未來Grok 的加入,還有可能讓特斯拉的智能化程度進(jìn)入一個(gè)新的臺(tái)階。
在剛過去的這個(gè)六月,雖然有號(hào)稱“終極 Model Y 殺手”的小米 YU7 發(fā)布,它也的確拿下了 1 小時(shí)近 30 萬訂單的空前戰(zhàn)績(jī),但特斯拉 Model Y 依然賣出了恐怖的44848 輛(懂車帝數(shù)據(jù)),在一些機(jī)構(gòu)的統(tǒng)計(jì)中甚至達(dá)到了51253 輛(蓋世汽車),可謂他強(qiáng)任他強(qiáng),清風(fēng)拂山崗。
![]()
甚至 Model 3 長(zhǎng)續(xù)航版還敢漲價(jià) 1 萬元。
同樣堅(jiān)挺的,還有特斯拉的技術(shù)。自 3 月在中國區(qū)上線的 FSD 一直被群嘲訂閱價(jià)格過高、不能識(shí)別中國的紅綠燈和公交車道,自然成了各家智駕的吊打?qū)ο蟆?/p>
但當(dāng)國內(nèi)車企才將「識(shí)別交警手勢(shì)」作為一個(gè)主要賣點(diǎn)時(shí),就有不少網(wǎng)友早在幾個(gè)月前發(fā)現(xiàn) FSD 已經(jīng)悄悄“學(xué)會(huì)”了看交警的手勢(shì),并且根據(jù)手勢(shì)開車。
網(wǎng)友@黃斯忑敢開FSD 早在 3 月 26 日就發(fā)布了一條視頻,說他的FSD 的確可以根據(jù)手勢(shì)來開車。

更別說,國外一輛特斯拉自行從工廠下線后直接開到用戶的家里。你可以說 FSD 在中國水土不服,但不能否認(rèn)在智能駕駛這塊特斯拉一直都在玩一些很新的東西,是有兩把刷子的。
到了未來,有 Grok 加持的特斯拉智能座艙,沒有比“如虎添翼”更加合適的形容詞了。就算中國市場(chǎng)沒能第一時(shí)間迎來Grok上車,特斯拉還是有可能建立起“科技先鋒”的光環(huán),再吸引一批新的消費(fèi)者。
哪怕同樣是「自然語言控制智駕」的畫餅階段,特斯拉也有大模型更強(qiáng)、訓(xùn)練量更大、自主性更強(qiáng),甚至是算力也更加充沛的優(yōu)勢(shì),沒準(zhǔn)真能“彎道超車”“力大磚飛”,先理想一步裝車。
今天你對(duì)我愛答不理,明天我讓你高攀不起——理想華為們別一不小心,被特斯拉在智駕這塊偷了家,丟了泉水了。
可能也就在智駕領(lǐng)域“遙遙落后”的蔚來、小米和合資企業(yè)們,能坐得住吧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.