繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

特斯拉已不是智駕行業「標準答案」

2025-10-31 08:24

時隔兩年多,特斯拉再次「開麥」。

與此前不同,這次特斯拉對於自家智能輔助駕駛算法進展的分享,並不是在AI Day的舞臺上,而是在近日舉辦的計算機視覺頂會ICCV(International Conference on Computer Vision)期間。

特斯拉自動駕駛副總裁阿肖克·埃魯斯瓦米(Ashok Elluswamy)作為嘉賓,在大會上發表了主題演講。

有可能爲了接上2023年6月他們提出端到端架構之后的「閉麥」,阿肖克從「特斯拉為何會選擇端到端?」開始分享,但經過多年實踐,他們也發現僅通過端到端想要做好智能輔助駕駛,存在一些挑戰。

圖源Tesla AI

首先就是端到端系統需要解決從極高維到極低維的映射問題,這種映射往往是多對一,因此要保證輸出的正確性,訓練難度可想而知。阿肖克的言外之意,或許是在強調端到端模型的「黑箱」問題。

基於特斯拉龐大的用户規模,每日可為他們產生相當於500年駕駛時長的數據,但其中多數是沒有太多價值的常規場景數據,對於算法的長遠泛化沒有太大幫助。

爲了解決這兩個問題,特斯拉在架構和算法層面做了一些優化和調整,比如在輸出決策控制指令前,還會輸出OCC佔用網絡和3D高斯特徵等視覺信息,以及思維鏈COT自然語言信息。

與此同時,基於龐大的真實數據基礎,特斯拉還建立了名為「神經世界模擬器」的閉環仿真系統。通過這套系統,不僅可以訓練算法,並且還能驗證算法的正確性,好比同時是「訓練場」和「考試場地」。

看到這里,是不是聞到有股熟悉的味道,這不就是國內車企們和自動駕駛企業佈局的VLA模型和世界模型。換句話説,特斯拉已從之前站在講臺上的「老師」,變成了與理想、小鵬、吉利、華為、地平線和Momenta一起探索智駕最終答案的「同學」。

或許正因這樣,小鵬汽車CEO何小鵬曾表示:「實際上,國內任何一家有實力AI玩家,早就不care馬斯克在做什麼了」。

不僅如此,曾負責特斯拉Autopilot和自動駕駛項目的兩位前高管,在這段時間也對特斯拉自動駕駛進程表達了擔憂。畢竟,根據特斯拉最新的財報,訂閲FSD的比例只有約12%。

已不是智駕行業「標準答案」的特斯拉,未來將會駛向何方?

01、VLA vs 世界模型,特斯拉:我全都要

提出端到端架構兩年后,特斯拉他們依然覺得該架構很重要。

首先端到端架構能減少從感知輸入端到控制輸出端的信息損失,就像面對雞、鵝等小動物過馬路這個場景,傳統模塊化模型就會在信息傳輸過程中丟失一部分信息,導致輸出端形成信息瓶頸無法做出正確行動。

但端到端架構,就可以確保決策和控制端依然能基於豐富的信息,再加上神經網絡和數據驅動從大量人類駕駛行為中學習到「經驗」,從而做出正確、安全和有效的駕駛行為。

正因這樣,整個端到端架構的信息密度是巨大的。可以簡單算一筆賬:輸入端在30秒內以36Hz頻率採集的7路500萬像素攝像頭視頻、長達數英里的導航地圖、100Hz的車速與IMU信息,甚至還有大量的音頻信息,整體信息維度相當於20億token。

對於特斯拉來説,輸出端僅是方向和加減速的控制信息,約等於2個token,這就意味着端到端需要解決的是從極高維信息到極低維信息、多對一的映射問題,就好比要從一團亂麻中找到最終指引向出口的那唯一一根正確線頭。

端到端模型,圖源SEA

翻譯一下,阿肖克所説的正是行業中老生常談的——端到端由於存在信息維度壓縮和深度神經網絡非線性等特性,導致「黑箱」和不可解釋性問題不可避免。

另外,在訓練數據上,特斯拉同樣遇到了瓶頸。按照阿肖克介紹,基於龐大的用户羣體,特斯拉每天可接收相當於500年駕駛時長的數據,這個數據量放到行業中看確實令人艷羨,但其中大多數數據卻都屬於簡單和常規場景。

換句話説,特斯拉正像中國玩家們一樣,缺少真實的高質量數據來「餵養」算法。畢竟訓練所需的高質量難例數據可遇不可求,地平線CEO余凱由此纔會說出那句「在AI時代,99%的人類數據是不值得學習的」。

特斯拉這次技術分享的重頭戲,正是他們對於以上問題提出的解法。

針對特斯拉最新的端到端架構,阿肖克表示「並不是徹頭徹尾的‘黑箱’系統」。從他的介紹看,現在的端到端架構在輸出決策規劃信號之前,還輸出了很多中間結果,包括OCC佔用網絡和3D高斯特徵為主的場景重建視覺信息,來展現對於環境的感知細節。

除此之外,特斯拉還引入了思維鏈COT(Chain-of-Thought),訓練算法用自然語言來解釋自己的行為,並給出下一步的行動軌跡。這些中間結果,不僅可用於SR界面的渲染呈現,同時也能用於研發校驗和調優,來保證模型輸出的正確性。

特斯拉具備可解釋輸出模型,圖源Tesla AI

理想車主們對於以上描述應該非常熟悉,因為是他們在前排屏幕上經常看到的路徑規劃和思維過程的畫面。這就是VLA模型中的「L」(Language)部分,再加上V(Vision)的2D、3D信息,以及MoE、Diffusion模型和A(Action)的部分,就組成了VLA模型。

目前,除了理想之外,小鵬、元戎啟行和千里科技(千里浩瀚9H方案)等品牌,也都採用了VLA架構來打造自身的智駕系統或者方案,讓自身的智駕功能不僅適於與用户交互,同時也能讓智駕行為更像人。

對於特斯拉來説,目標是一致的,但他們同時還在致力於打造一個算法評價模型。

以阿肖克的介紹來看,他們已經基於龐大的真實用戶數據,在雲端打造了一個「神經世界模擬器」(neural world simulator)。

它的用途有三個,利用閉環仿真驗證端到端指令的正確性、利用場景編輯生成能力生成對抗樣本檢驗模型能力和利用模擬器在閉環仿真系統中獲取人駕真值。

翻譯一下,就是基於真實用户駕駛視頻數據,一邊來生成在現實世界難獲取的難例(Corner cases)數據,從而在雲端訓練和迭代智駕算法模型;另一邊,把訓練好的算法模型放到生成好的世界模型中進行仿真權重評價測試,針對性通過強化學習來增強模型能力。

就像是特斯拉為FSD在雲端打造了一個閉環的「駕校」和「考場場地」。相比於現實世界中高質量數據的難獲得,在神經世界模擬器中就可以讓算法訓練和評價實現窮盡。

特斯拉閉環模擬神經網絡模型,圖源Tesla AI

實際上,像這樣的雲端世界模型,並不是特斯拉首創,而是像理想、小鵬、零跑、華為乾崑和商湯絕影等國內玩家已經早已佈局。

這其中,以華為乾崑為代表的玩家們,在打造雲端世界模型的同時,還在車端部署了世界模型,就像華為乾崑的車端世界行為模型WA,是基於視覺、聽覺和觸覺等感知數據,經過Token化后訓練出的原生基模型。

由此,在國內智駕行業中就有了端到端、VLA和世界模型的三種技術路線之爭,但從以上分析來看,特斯拉的最新智駕方案有可能把端到端、VLA模型和世界模型三者都涵蓋了。

特斯拉他們會這樣選擇,並不是只爲了「集百家之長」這樣簡單,因為在飛説智行看來,端到端、VLA和世界模型並不是簡單的非此即彼競爭關係,而是端到端為基礎、VLA和世界模型是升級的動態融合演進關係。

例如上述主流玩家們無論在車端部署端到端還是VLA模型,亦或者是世界模型,都需要在雲端建立一個參數量更大的世界模型進行仿真生成訓練和評價,並且還有一些玩家車端的模型,就是雲端世界模型通過修剪和蒸餾所得。由此,何小鵬、李想和余承東等大佬此前都對世界模型給予了肯定的評價。

除此之外,特斯拉布局VLA和世界模型的目的,還想去支持機器人業務的發展。

按照阿肖克表示,特斯拉閉環仿真引擎同樣可以遷移到機器人領域,而機器人Optimus和自動駕駛FSD技術棧的統一,也為后續Cross Embodiment(跨實體具身)帶來的更泛化的具身AI發展帶來巨大的想象空間。

圖源特斯拉官微

相比之下,理想和小鵬兩家車企佈局VLA和世界模型的時間更早,並且都已喊出了「要成為AI企業」的目標,他們應該和特斯拉有着同樣的規劃。

只不過,相比於之前舉辦AI Day的特斯拉,現在的特斯拉已經掉下神壇,與理想、小鵬、華為乾崑和地平線等國內玩家們站到了一起。

根據飛説智行觀察,這次特斯拉分享技術進展后,與之前AI Day后朋友圈刷屏的熱度相比冷清了許多,由此也能看出大家對於特斯拉在干什麼,確實沒有之前那麼關注了。

畢竟除了技術進展之外,特斯拉在其他方面的成績也不夠亮眼。

02、謊言、質疑和不愛用,特斯拉FSD未來駛向何處?

都2025年了,馬斯克依舊在為自動駕駛「畫餅」。

在最近的第三季度財報會上,馬斯克表示特斯拉有望在今年年底前在8到10個新的州展開Robotaxi運營,其中就包括內華達州、佛羅里達州和亞利桑那州等對自動駕駛技術政策寬松的大州。

而在上個季度的財報會上,馬斯克曾表示,特斯拉會在今年底前讓Robotaxi覆蓋美國50%的人口,並預計到今年底,特斯拉車主將能通過軟件更新,使自己的車輛具備無需監督的全自動駕駛能力(L5)。

對於馬斯克這樣的「畫餅」,大家早已司空見慣,畢竟從2016年開始,馬斯克就開始鼓吹自家FSD可以儘早實現全自動駕駛的目標,但每到兑現期限無一例外跳票。

正因這樣,曾負責特斯拉自動駕駛業務的前高管們看不下去了。

特斯拉前人工智能主管安德烈·卡帕西(Andrej Karpathy)最近在一檔播客中表示特斯拉自動駕駛的問題遠未得到解決,據瞭解他曾在2017-2022年領導特斯拉自動駕駛項目。

在安德烈看來,自動駕駛的迭代好比是無限接近100%的過程,在此之前就是無數個9的積累過程,按照他對Electrek回憶道,他曾領導特斯拉自動駕駛經歷了兩到三個「9」的迭代,確實顯著減少了駕駛員接管的干預,但此后這樣的進步就不明顯了。

特斯拉無接管駕駛干預百分比,圖源Electrek

安德烈之前,斯特林·安德森被行業公認為是特斯拉自動駕駛項目的首任負責人,因為他曾在2015-2016年領導特斯拉Autopilot發展,目前他已是通用汽車全球產品部門的負責人。

在近期通用汽車的活動中,斯特林對特斯拉自動駕駛的發展同樣進行了質疑,「通用Super Cruise系統已實現約11億公里的無接管行駛,且沒有發生一起由於技術導致的事故。但特斯拉的自動駕駛系統,卻無法達到這樣的安全記錄。」

在此背景下,目前特斯拉在奧斯汀和舊金山運營的Robotaxi車輛均配備安全員,以便作為系統失效或錯誤時的安全兜底。其中,奧斯汀區域的Robotaxi,安全員是坐在副駕位置;而在舊金山,安全員則是坐在主駕。

根據馬斯克的規劃,會在今年底前去掉奧斯汀大部分的安全員配置,未來幾個月內,預期至少在奧斯汀的部分區域實現完全無安全駕駛員運營。為此,馬斯克給出的解釋是「這些人類監控員的存在並非因為公司技術存在缺陷,而是出於對安全的‘高度謹慎’」。

不過,先不説與特斯拉同場競技的Waymo已經實現了無安全員的商業化運營,小馬智行、文遠知行和蘿卜快跑等中國玩家們,則是更早就實現了Robotaxi無安全員的常態化運營。

Robotaxi沒有按照馬斯克所期望的速度發展的同時,特斯拉的智能輔助駕駛業務發展同樣受阻。

特斯拉第三季度財報會上,特斯拉首席財務官瓦伊巴夫・塔內賈(Vaibhav Taneja)公開承認,上一季度FSD相關的收入較2024年同期有所下滑,具體原因是「目前付費使用FSD的客户總量仍然很小,僅佔現有車隊的約12%」。

特斯拉FSD,圖源特斯拉官微

今年特斯拉對於FSD在美國市場的售價雖然進行了調價,買斷價從之前的12000美元(約合85350元人民幣)降至8000美元(約合56900元人民幣),並推出了99美元的月度訂閲服務。

但結果是,不僅沒有促進用户們對於FSD的購買和訂閲,反而FSD成為消費者們不購買特斯拉的主要原因。

根據Slingshot Strategies在今年8月發佈的《2025年8月電動汽車情報報告》,他們對8000多名美國消費者進行調研后發現,有將近35%的受訪者認為「FSD功能讓他們更不願意購買特斯拉」,因為他們對FSD技術不成熟,責任界定模糊和純視覺方案可靠性不足等方面有所擔憂。

這些消費者的擔憂並不是沒有道理。本月9日,美國國家公路交通安全管理局(NHTSA)宣佈對約288萬輛配備FSD的特斯拉汽車展開調查,起因是收到58起交通安全違規及事故報告,涉及闖紅燈、逆行、車道識別錯誤等問題。

其中就包括當特斯拉車輛開啟FSD之后,在路口與其他車輛相撞以及誤駛向對向車道與別車相撞,導致多名人員受傷等多起事故。

03、后記

特斯拉對於全球自動駕駛行業來説,有着重要的價值。

基於特斯拉前些年相繼提出BEV+Transformer、OCC佔用網絡以及端到端模型,不可否認在一定程度上給於中國玩家們很多啓發,由此推動了整個行業向前快速發展。

兩年前,或許因為「擔心中國車企玩家們的模仿」傳言,馬斯克和特斯拉選擇了「閉麥」,AI Day就此停辦不再對外分享自動駕駛相關技術進展。

再到兩年后的今天,理想、小鵬、吉利、華為乾崑、地平線和Momenta等玩家雖然在技術路線上已有「三足鼎立」之勢,但馬斯克應該也看到了一個事實:特斯拉已不是行業的「標準答案」,大家都在按照自己認定的方向向自動駕駛終局進行探索。

畢竟,自動駕駛行業從不缺少「神話」,而馬斯克和特斯拉現在則需要更腳踏實地。

本文來自微信公眾號「飛説智行」,作者:周雄飛,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。