熱門資訊> 正文
2024-11-28 14:25
2024年年初,隨着特斯拉曝出自己的FSD V12版本採用了端到端技術,自動駕駛能力出現了質的提升之后,智能駕駛的賽道就此進入了新階段。特斯拉在北美打響的發令槍,而衝在最前方的都是中國公司。以理想、華為鴻蒙智行、蔚來、小鵬為代表的頭部新勢力紛紛發力;以百度、商湯絕影、毫末智行等人工智能玩家也緊跟其后,提出自己的端到端方案。最近的廣州車展上,極氪等車企也宣佈進入端到端領域。
端到端的底層邏輯
眼下,新、老勢力都在主打端到端,那何為「端到端」?
端到端,可以從一本書聊起。諾貝爾獎獲得者丹尼爾·卡尼曼在《思考,快與慢》中用兩個系統——快系統和慢系統來解釋人類的思考和決策過程。
快系統是直覺和本能,它通常處理那些僅需通過經驗和記憶、無需耗費腦力的任務。比如回答1+1等於幾,或判斷一個乒乓球和籃球哪個更大。這種無需經過深度思考,瞬間可以做出反應的場景,約佔據了人類行為的95%。
而慢系統則負責需要通過專注力、邏輯性、深度分析才能完成的任務,來解決剩余5%場景下的複雜任務。比如計算243*876等於幾或進行一場如《星際爭霸》這樣的決策戰略遊戲對戰等。
當然,這兩個系統並非各自為戰,而是互相輔助,是人類認知和理解世界並做出決策的基礎。
我們再將這套邏輯平移到汽車駕駛中。開車時遇到紅燈停,遇到綠燈可以通行,這已經成爲了「駕駛本能」。而當遇到陌生路段,尤其是匝道、環島、十字甚至海星狀路口時,就需要時間觀察、思考再決策。
自動駕駛的原理也是一樣,需要用快系統讓自動駕駛系統更高效;也需要慢系統去處理更復雜的信息。
理想智駕的三次進化
隨着技術的精進,當前用户對於智能駕駛技術的接受度和認可度正在顯著提升,智駕功能開始在新能源汽車銷售當中佔據越來越大的影響權重。在新能源市場競爭的下半場,理想汽車率先進行前瞻佈局,持續加大研發投入,獲得顯著成果,在智駕賽道上脫穎而出。
理想汽車10月全量推送的端到端+VLM雙系統智駕技術架構,就是採用了快系統+慢系統的思路構建。「端到端模型」就是「快系統」,用來對日常駕駛進行快速處理,傳感器輸入的信息,直接輸出行駛軌跡。而在應對複雜路況時,理想汽車通過視覺語言模型(VLM),也就是「慢系統」,給「端到端模型」輸出建議。
通過端到端模型和VLM模型,理想汽車的最終目標是能夠覆蓋全部的駕駛場景,對任何情形都能夠像人類司機那樣老練。而要實現這一目標,光靠兩個系統還不夠,理想引入了「重建+生成式世界模型」,它就像一個「考官」,幫助這兩個系統在一次次「真題試煉」中持續迭代升級。
世界模型的「考題」來自於兩個部分:一個是測試人員和內測用户幫忙收集的「錯題集」,這些在實車測試中出現過問題的場景都會被重建成考題;同時,理想還會用生成模型將考題進行泛化形成模擬題,比如改變了天氣、光照、背景環境、障礙物的行為等等,使得模型能夠舉一反三。
最后通過「錯題」+「模擬題」的考試方式,經過自動化的模型評分體系,給出最后模型的得分,用來篩選合格的端到端模型,並且指導下一次的迭代方向。
事實上,理想汽車的智能駕駛系統在實現One Model一體化端到端之前,經歷了三個進化階段。
第一階段時,其採用了NPN架構,從傳感器輸入到行駛軌跡輸出,需要經歷感知、定位、規劃等過程。這一階段支撐了理想百城NOA的佈局。
第二階段,理想採用了分段式端到端架構,模塊更少,過程更短,從傳感器輸入到路徑輸出,只剩下感知和規劃,有導航就能開,效率更高,該架構能夠實現理想「無圖NOA全國都能開」的目標。
而第三階段,就是一體化端到端。相比無圖NOA有感知和規劃兩個模型,中間還有大量的規劃,而一體化模型信息傳遞不再需要人來設定規則,信息損失能夠最小,具有更高上限。在用户角度看來,駕駛會更聰明和擬人。一體化模型中間無需規劃、驗證,直接傳感器輸入,通過端到端模塊輸出行駛軌跡。
由此,智能駕駛技術不再侷限於傳統的模塊化架構,而是向着一體化大模型的方向大步邁進。端到端大模型通過大規模數據訓練與深度學習算法,實現了從原始傳感器數據直接輸出駕駛指令的跨越,極大地提升了智能駕駛的響應速度與決策精度。
而隨着功能和智能化的進一步提升,理想智能駕駛系統的算力也「水漲船高」,從2023年的2.82EFLOPS增長到2024年的10EFLOPS;智駕訓練里程從去年的12億公里增長到接近30億公里。在智駕的技術水平和可靠性上,實現了遷躍。
真正實現「車位到車位」
得益於理想汽車持續的研發投入,其智駕功能正在加速迭代和落地。
今年7月,「全國都能開」的無圖NOA全量推送給AD Max用户。基於端到端+VLM的全新智能駕駛技術架構在7月開啟千人內測,成都車展期間進行萬人團招募,在10月23日的OTA6.4版本中正式推送給全量用户,其成長速度可以説創造了行業奇蹟。
而這次OTA6.5版本,可以實現車位到車位全場景覆蓋能力。從上車就能開一鍵智駕,自主進出園區和識別閘機抬杆,城市環島、掉頭等複雜場景通行,首創的全國範圍收費站ETC自主通行,自主泊入露天、地庫多種停車位。總之,主打一個從起步泊出到行程結束泊入全場景覆蓋,從車位到車位,中間0斷點。
從上車選定導航路線之后開始,點擊「一鍵智駕」或者跟理想同學説一句「我們出發吧」,從車位到車位的過程就能直接啟動。車輛自動駛出車位、地庫、狹窄的小區道路,遇到閘機車輛也會自動停下,等繳費抬杆之后繼續自主行駛。
如果路途中有高速,這套系統可以通過視覺語言模型識別收費站ETC,選擇好通行車道,降速緩行通過ETC,同樣無需接管。這一功能目前在其它品牌的智駕系統中還沒有實現全量落地。
除了上述智駕功能升級,在主動安全方面,理想汽車同樣不設上限的保障用户安全。在這次OTA 6.5版本中,理想還將加入后向主動緊急制動 R-AEB 和后向誤加速抑制 R-MAI,進一步提升了駕駛安全性,構建起更加完整的智駕防護罩。
根據規劃,11月底「車位到車位」能力將隨這次OTA6.5版本車機系統推送給全量AD Max用户。
事實上,在10月底推送的OTA6.4版本中,理想基於端到端+VLM的全新智能駕駛技術架構就已經相當成熟,能夠絲滑解決用車難點場景。
比如難倒幾乎所有智駕系統的U型掉頭場景中,理想這套一體化端到端系統具備更強的側向感知能力,掉頭過程中可以更準確識別和預測對向直行車輛的行駛軌跡並做出避讓。
另一項亮點功能是路邊P擋直接起步。得益於端到端系統更強的freespace規劃,該系統不再依賴車道關係,當車輛不在車道中時也可以啓發式搜索出一條從路邊駛入主路的路線。只需要雙擊撥杆,理想可以直接從路邊起步,自主併入車道。
此外,在千鈞一發的時刻,這套系統的安全能力上限更高。
比如,AES緊急避險功能方案,行業大部分的AES都依賴駕駛員手動掰一下方向盤才能觸發AES,算上人的反應和執行時間很可能已經來不及避讓。而理想的 AES不需要掰方向盤,是真正意義上的全自動緊急避讓。AES支持最高激活上限 135km/h,適用於高危的高速駕駛場景。
系統本身智能意外,爲了讓用户放心,交互也很重要。理想的這套系統還能在智駕狀態下基於VLM播報。這套系統同樣會基於快系統和慢系統的思維進行兩個種類的播報。比如,「正在向右轉彎」「當前公交車道處於限行時間,正在駛離公交車道」等等。
可以説,OTA6.5版本是對6.4版本的進一步突破和打磨,對用車場景的全周期進行細節挖掘,真正做到讓用户敢用、好用、愛用。
最后
在智能駕駛的數十年發展中,私人乘用車領域從未達到過「車位到車位」的水平,要不就是起步出庫、出停車場閘機需要人工接管;要不就是在城市複雜路況中Hold不住,開着開着從「城市領航」降級到「自適應巡航」;在遇到U型掉頭、高速收費站等特殊場景時,同樣需要人工接管。
理想的這套端到端+VLM的方案,真正將整個智能駕駛過程打通,實現了閉環。從技術角度來説,用户從A點到B點,要做的就是上車、設置導航、激活智駕系統、開門下車,中間的全過程都不再需要接管。
相比當前市面上要時刻擔心智駕系統是否讓人類接管的焦慮,理想可以説將智能駕系統的體驗拉昇到了新高度。經過了三次技術躍遷和產品升級的理想智能駕駛,也將從此前的「主流水平」,成為「第一梯隊」。