熱門資訊> 正文
2025-06-20 15:36
10年10000倍!車端自動駕駛芯片的算力紀錄,正在被這樣的速度刷新。
2500TOPS,全部有效AI算力,來自始終篤信「第一性原理」的馬斯克,和他的特斯拉,最新車載芯片曝光。
與其説「下一代」,不如説「領先一代」,因為2500TOPS的芯片被曝已成功流片,最快明年上車。
車端算力水平業內主流還是254TOPS,500-700TOPS只有頭部玩家纔有實力部署,極個別玩家算力堆到了1000TOPS以上。
特斯拉硬件性能的算力增長速率,遠超當下行業共識和普遍節奏規律。
甚至10年前的馬斯克自己,也很難料到。
最新曝料,特斯拉下一代自動駕駛車端芯片,已經流片成功,進入批量生產的準備階段。
3nm工藝,主要還是臺積電代工,韓國的三星作為產能后備。
最重要的是算力——2000-2500TOPS之間。
消息是韓國每日經濟新聞最先曝出的,這是韓國影響力最大的經濟報刊,1966年軍政府時期成立(也是韓國各大財閥起家創業時期),政治立場保守偏右,而它背后的財閥支持,也有三星的影子。
所以可以認為這則曝料準確度很高,北美的媒體也廣泛引用了這一消息。
2014年特斯拉首款車Model S,搭載了HW1.0硬件,底層採用了Mobileye的EyeQ3芯片,算力0.256TOPS。
2014年5月5月,一輛開啟「Autopilot」的特斯拉與一輛大型拖車相撞,導致駕駛員死亡,這是自動駕駛歷史上首例公開的死亡事故。隨后,特斯拉迅速將核心算力從Mobileye更換為Nvidia的「Drive PX2」,算力24TOPS。
並且同步招募了硅谷半導體大師吉姆·凱勒(Jim Keller)以及曾在英特爾和蘋果工作過的皮特·班農(Pete Bannon),開始自研自動駕駛芯片。
2019年HW 3.0發佈,底層全部換裝特斯拉自研產品,14nm工藝,單片算力72TOPS,板卡算力144TOPS。搭載在特斯拉絕對銷量擔當的Model 3 和ModelY上。
2023年特斯拉發佈了HW4,5nm工藝,單片算力推測在200-300TOPS,車載平臺算力超過了500TOPS。也是從這一代硬件開始,特斯拉在北美完全拋棄了毫米波雷達及超聲波雷達,走向更純粹的視覺路線。
僅僅一年過后,新芯片算力已超2000TOPS,相比10年前的EyeQ3,已是10000倍的差距。
而馬斯克不久前在財報會議上説,AI5整個套件算力會是HW4.0的十倍,由此推斷真正上車時,AI5應該還是雙芯片冗余,單顆算力至少2000TOPS+,整車算力4000TOPS以上。
這個水平遠遠超過目前L2+的主流算力配置。
國內玩家,比如大疆、比亞迪都已經驗證,跑通一個端到端模型,其實並不需要潑天算力;甚至特斯拉自己,也在144TOPS的HW3.0方案上,OTA了最新的FSD版本。
技術客觀,塑造了當下智能化競賽各個玩家的「裝備配置」的基本思路。
只求實現高速NOA和泊車功能的,採用德州儀器數十TOPS芯片,或100TOPS左右的高通8650、8620足矣,通常見於緩慢轉型的合資車,或強調性價比的國產A級小車。
這種算力條件下,其實也能強上「車位到車位」功能,只不過體驗要做好難度極大。
用户心理層面可用敢用的城市NOA能力,通常至少需要一塊英偉達Orin,256TOPS算力。這也是目前絕大多數「智能普及」車型採用的方案,可以説是當下成本性能最平衡的。
再進一步要把「車位到車位」體驗做的足夠好,接管率足夠低,就需要兩塊Orin的算力支持。
但多塊芯片之間的通信、任務分配,並行計算等等難度很大,要想把VLA這樣的數十億、百億及參數模型跑在車端,就必須要更大算力芯片——700TOPS+的英偉達Thor在中國市場率先落地量產,正是自動駕駛技術體系的體現。
但這也就是現在量產輔助智駕的最高「裝備等級」了。
小千TOPS算力下,VLA到底該怎麼部署、算力到底是不夠還是有余、是不是能完全利用……各家都在探索,還沒有人能給出準確答案。
特斯拉把算力軍備競賽一下拔高到數千TOPS,真的有必要嗎?
英偉達Thor 2022年首次亮相時,老黃給的算力數據就是2000TOPS,震撼了整個車圈。
2025年量產上車的版本,包括理想、極氪,實際卻是750TOPS算力的版本。
有傳言説是吳新宙從小鵬到了英偉達后,勸老黃其實車端沒必要這麼大算力,成本也受不了。
所以海外媒體、用户對標特斯拉AI5的英偉達產品,不是Thor,反而是最新的5080、5090。
比如5080大約等效1800TOPS,5090則是 3,400 TOPS。
但這樣的類比其實並不合理,因為特斯拉自從HW3.0開始,算力描述指的就是完完全全服務AI模型的有效算力。
也就是支持大規模乘加運算,並針對Transformer架構、算子做了特殊優化的NPU算力。
這也是通用GPU源流的英偉達芯片和車企自研自動駕駛芯片的根本不同。
資深從業者曾向智能車參考透露,包括Orin和Thor,整個芯片設計思路還是從傳統顯卡出發,尤其是Thor又要兼顧一部分座艙功能,包括了很多不同用途的模塊,自動駕駛模型真正調用的有效算力,是達不到宣傳數字的。
這也是為何特斯拉、小鵬、蔚來,以及Momenta等等自動駕駛玩家都要自研芯片的原因。
AI5的2000TOPS+算力,代表着超大參數模型可以上車。
特斯拉目前雲端超算建成約30EFLOPS算力,在訓練的雲端基座模型據說參數已經超過500B,也就是5000億參數,和領先的大模型玩家已經沒有任何區別。
而從目前大模型技術出發推斷,能用在駕駛任務的多模態大模型,也只有VLA。
流行的端到端實際參數量大約都是幾十億,同時還是「黑盒」,難以證明模型是真的理解路況,還是條件反射式的模仿。所以理論上限高,但很實際效果難控制,只能通過調整訓練數據的分佈來「間接」影響模型能力,下限依然需要規則兜底。
馬斯克賭的,其實就是超大模型的「智能涌現」,讓AI司機真正產生對環境場景的的認知理解能力,由此解決corner case。
雲端多模態大模型具備基礎能力后,在通過強化學習手段規範安全可靠性,然后通過知識蒸餾方法得到可在車端部署的較小模型。
當然車端的「小」模型是相對而言,整體規模仍然高出傳統端到端,所以需要超大算力芯片。
另外從安全出發,依賴雲端能力和即時通信的系統,安全隱患很大,車端部署完整模型也是必須。
同樣的路線,特斯拉再走,國內的小鵬蔚來理想華為等等都在走,它們在一同推動自動駕駛領域的一場新革命:「算力即能力」。
對傳統量產輔助駕駛,從今年開始會迅速分化成入門性價比的陣營,和超大算力高階陣營。前者可能更多見於合資車或自主性價比入門車型,主打「有就可以,基本能用」,OTA潛力有限。
后者則有希望突破L2限制,在安全性、易用性、接管率上實現質變,即各家都在説的「L3」。
而對L4陣營,自動駕駛新的技術思路和話語體系出現,並且上路近在眼前,如果AI司機智能涌現真的被驗證,沉寂多年的「升維降維」之爭,又要被熱烈討論了。
甚至特斯拉的AI5、小鵬的圖靈、蔚來的神璣等等僅僅是個開始:10年前沒人能想到車端算力有萬倍提升,未來數年,誰又能斷言數萬TOPS的「超級AI汽車」不會成為現實呢?
畢竟,大模型的上限還遠未達到。
本文來自微信公眾號 「智能車參考」(ID:AI4Auto),作者:賈浩楠,36氪經授權發佈。