繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

理想汽車的VLA「長征」

2025-08-12 17:53

在理想i8發佈會舉行之前,理想汽車董事長兼CEO李想與前同事、維他動力聯合創始人趙哲倫分享了自己關於「選擇」的長期主義哲學。

「要選‘長’的,這件事情最好要很長時間才能成功,如果是個很短時間就能成功的,就意味着所有人都能成功,反而沒什麼壁壘。選‘長’的,跟時間做朋友,就有耐心了。」李想説。

當晚,外界都以為理想i8是唯一主角。但這是一場有雙主角的發佈會,李想在現場宣佈,理想VLA司機大模型將隨理想i8一同交付。

作為發佈會上的另一個主角——VLA其實更能反映李想的長期主義哲學。

2025年的智能駕駛戰場,瀰漫着「短平快」的焦慮。數據上,部分車企依賴人工採集「老司機數據」,甚至僱傭數百人實車路測,成本高昂卻效率低下。算法上,端到端+VLM架構遭遇瓶頸——訓練數據突破1000萬Clips后,性能增長緩慢。評測上,實車測試無法復現極端場景,接管里程的數字繁榮背后隱藏着極端場景的未解難題。

面對這些現象,李想曾用這樣一句話提醒公司乃至整個行業——端到端模型像猴子開車,它能夠學習人類行為,但並不理解物理世界。

李想的犀利比喻,直指行業痛點——短期可落地的技術≠真正智能。基於這樣的信念,理想沒有簡單粗暴地用規則算法「修補」端到端缺陷,而是選擇了一條更艱難的長期主義道路:推翻現有架構,自研VLA司機大模型。

為何VLA是「正確的事」

區別於端到端架構的模仿學習,VLA司機大模型的優勢是通過強化學習不斷進化,讓機器理解「為什麼這樣做」。這不僅關乎技術路線,更是一場關於用户體驗、商業效率與技術野心的深刻重構。

首先,VLA能像經驗豐富的司機一樣預判風險(如盲區車輛切入)。理想汽車自動駕駛研發高級副總裁郎咸朋希望,未來VLA能將事故里程(MPA)提升至人類駕駛的10倍,做到600萬公里纔出一次事故(當前理想輔助駕駛為350-400萬公里/次事故,人類駕駛約60萬公里/次事故)。

其次,VLA 還能「越開越像你」。激進派車主獲得高效變道,穩健派車主享受平順巡航——VLA通過持續學習用户習慣,讓車輛「越開越像主人」。郎咸朋描繪未來:「強化學習是有這個能力來支撐它這個車越開越像你的風格或體驗,之前端到端可能還不具備這樣的能力。」

郎咸朋透露,未來不同家庭成員上車,系統將通過Face ID自動切換至其偏好的駕駛風格,車輛真正成為懂你的「個性化司機」。

理想沒有讓自己陷入「百萬公里實車測試」的重資產泥潭,而是選擇用VLA撕開了行業的成本偽裝。當然,仿真不是爲了省錢所做出的選擇,它是能跑贏技術迭代的選擇——實車測試永遠追不上Corner Case的產生速度。

郎咸朋揭示了效率本質:「任何技術的提升一定伴隨着研發流程的變革,工業時代來臨后,刀耕火種的流程被機械化替代……而進入了VLA大模型時代,測試效率是提升能力的核心因素。」

2025年上半年,理想依託世界模型的仿真測試累計里程已突破4000萬公里,每天的測試里程最大的峰值可達到30萬公里,這是實車測試無法企及的速度與規模。

郎咸朋點明VLA快速迭代的祕訣:「VLA評測就像之前的實車評測一樣……我們的VLA仿真評測已經在超級對齊里做好了基礎,現在已經有超過40多萬個場景評測了。」 這構成了對手難以短時間複製的核心壁壘。

在VLA的長跑中,理想展現出驚人的戰略定力——精準平衡短期妥協與長期收益。

在用户端,理想接受初期功能保守,例如地庫限速最初為10 km/h ,現在逐漸提升到15km/h,換取絕對安全冗余。但郎咸朋承諾「進一步提升能力並且做好測試之后,我們會逐步打開這個能力的車速上限」。

在技術端,理想犧牲端到端短期數據優勢(堆Clip數),換取VLA的「思維涌現」能力。郎咸朋對比鮮明:「如果還是沿着端到端思路去做所謂VLA,你的速度一定會變慢……首先你要訓1億個Clips需要多大的訓練算力?」

同時,理想專注構建仿真評測壁壘。郎咸朋清醒判斷:VLA仍處技術周期早期,首要任務是「很好地驗證這套系統」。

市場反應印證了VLA的長線價值。今年1月發佈的《理想智能駕駛2024年出行報告》顯示,理想汽車智能駕駛試駕率達到72.4%,試駕滿意度為92%,30萬以及40萬以上車型AD Max交付量佔比分別為75.4%、84.6%。

可以看出,理想輔助駕駛不再是用户購車決策中的弱勢項,而是驅動品牌銷量增長的重要因素,這也是VLA司機大模型與理想i8一同發佈、一同交付的原因。

郎咸朋希望,2025年底將MPI接管里程提升至400-500km,到明年能夠達到1000km。「明年我們如果到了1000km的MPI水平,可能會給用户這種感覺真的到了一個VLA的ChatGPT的時刻。」理想汽車自動駕駛高級算法專家詹錕説。

對VLA的堅定選擇,背后是理想的技術信仰。VLA是理想對行業本質問題的回答:真正的智能不是「能做什麼」,而是「為何這樣做」。

數據、算法、算力、工程四重難題

自研VLA,這是人跡罕至的路,郎咸朋的團隊知道,啃下這塊「硬骨頭」,需要一場從數據、算法、算力到工程能力的全方位「長征」。

在數據問題上,截至2025年7月,理想積攢了累計43億公里輔助駕駛里程、12億公里有效回傳數據——這是理想從2020年理想ONE時代就開始佈局的「數據金礦」。

接下來是數據清洗的「鍊金術」。理想剔除了近1/4「不合規駕駛行為」,僅保留「老司機數據」。理想汽車自動駕駛高級算法專家湛逸飛解釋:「我們需要的數據用一個詞總結叫‘老司機數據’。」他們在雲端部署模型,甚至利用大模型對數據進行「老司機」標準的嚴苛篩選。

爲了實現世界模型的顛覆性革命,理想做出了一個大膽決策:用仿真測試替代90%實車路測。通過三維重建與場景泛化技術,1:1還原極端場景。這源於一個嚴峻的事實,即實車測試永遠無法100%還原事故現場。

湛逸飛透露,依託強大的世界模型,單日峰值測試里程達到30萬公里,2025年上半年累計超4000萬公里。

這並非一蹴而就。2024年,理想進行了150多萬公里實車測試,並非爲了數據本身,而是爲了驗證和校準仿真環境的可靠性。湛逸飛坦言,最初世界模型仿真復現率是存在問題的,團隊通過一年時間,針對漏洞進行大量工程和算法優化,將仿真一致性提升至99.9%以上。

在算法問題上,李想曾尖鋭評價端到端模型「像猴子開車」——能模仿動作,卻無邏輯思維。VLA的突破,核心在於賦予機器「思考的能力」。

CoT思維鏈(Chain-of-Thought)是VLA的核心突破。它能實時呈現決策邏輯(如屏幕顯示「拒絕逆行因安全合規」),徹底解決端到端「無腦執行」的痛點。換句話説,理想不是在教AI開車,而是在教它理解人類世界的規則。

面對大模型部署車端的世紀難題,理想選擇了最硬核的自研之路。

推理速度慢?今年,理想汽車將成為首個在Thor-U部署VLA模型(4B的MoE混合專家模型)的車企。理想汽車自動駕駛高級算法專家詹錕自豪地説:「目前沒有任何一個架構是這樣的,這是我們與基座團隊共同研發,專門對嵌入式芯片做了定製的MoE混合專家架構,在這個架構上我們才能達到這樣的效果。」 

軌跡生成時延高?理想不是直接使用標準Diffusion,而是進行了推理的壓縮。詹錕揭祕:「以前Diffusion可能要推理10步驟,我們使用了flow matching流匹配只需要推理2步就可以了,這方面的壓縮也是導致我們真正能夠部署VLA的本質原因。」效果就是,軌跡生成時延僅15毫秒。

模型部署難?理想將32B雲端大模型蒸餾至3.2B車端MoE模型。詹錕團隊完成了看似不可能的任務:「我們最早訓練了一個32B的雲端大模型……把它做出的思考和推理流程蒸餾到3.2B的MoE模型上。」 

在算力問題上, 理想關心「有效算力」。最終,理想在Thor芯片上實現700TOPS有效算力。詹錕解釋祕訣:「傳統的訓練一般都會拿FP32去做訓練...我們有一個訓練過程叫QAT(量化感知訓練)……在訓練過程中,我把參數就把它變成INT8或FP8。」 

詹錕回顧攻堅過程:「我們的工程團隊、部署團隊做了非常多的工作,包括我們魔改CUDA的底層,重寫PTX底層指令,才能實現現在的效果。」 

爲了打破「芯片歧視鏈」,理想讓Orin X芯片和Thor芯片車型都能獲得VLA,這源於理想工程部署能力的一貫積累。「從早期在地平線J3部署高速NOA,到在Orin芯片上部署大模型,再到現在在Thor芯片上部署VLA高頻快速的大模型……很多技巧和分析方法,以及基礎設施的工具鏈都繼承下來了。」詹錕説。

數據、算法、算力和工程能力的四位一體,構築了理想VLA的護城河。而這場啃硬骨頭的長跑,旨在回答一個問題:真正的智能,是理解「為何這樣做」。

技術背后的價值觀

當VLA司機在雙向單車道上拒絕執行「左轉避開三輪車」的指令時,一場關於機器價值觀的公開拷問被引爆。這不是技術故障,而是理想團隊主動選擇的安全底線。郎咸朋深知,VLA的每一步突破,都伴隨着尖鋭的質疑與艱難的權衡——這是啃硬骨頭必然付出的代價。

如何應對用户信任帶來的風險,是理想正在面對的第一個問題。

「請左轉避開三輪車。」——面對這樣的指令,VLA在雙向單車道上陷入沉默。詹錕表示,這不是技術故障,是價值觀的主動選擇。

一方面,複雜指令存在「通識門檻」,例如「前進10米」依賴物理常識涌現。詹錕解釋核心原理:「當量級達到一定規模時,會涌現出組合泛化的能力……它懂了數字,懂了米數,就能組合應用。」 但這需要海量數據與迭代時間。

另一方面,交互權責存在模糊地帶。用户閒聊提及「左轉」可能誤觸發指令,理想i8發佈會上播放的岳雲鵬駕駛VLA車輛的視頻,就以一種輕松的表達方式展現了這個問題。

「我們現在肯定是爲了保持準確,防止出現一些誤判,比如你本來不想操控車的行為,突然去操控了,這肯定是存在一些還需要迭代和優化的地方。」詹錕坦言挑戰。而理想的解決方案指向「統一大腦」,讓車輛對用户的想法有更精準的理解。

如何應對效率、安全、舒適的「不可能三角」,是理想正在面對的第二個問題。

郎咸朋強調,理想的選擇,是安全大於舒適和效率。按照這一原則,現階段車輛即便走錯路,VLA也不會通過一些危險的駕駛動作進行糾正。只有在保證安全的前提下,VLA纔會去努力讓行程更舒適和更高效。

當然,任何選擇都會付出代價。「代價就是初期體驗保守。」郎咸朋坦言,他同時承諾,我們會逐步打開能力上限。 

如何應對行業內卷背景下的對手圍剿和外界質疑,是理想正在面對的第三個問題。

對於理想而言,那些採取「短平快」打法的對手,它們炫耀參數的行為並不值得自己焦慮,因為單純的參數優勢,就像廚師誇耀灶台火力旺一樣,其實,食客只在乎菜是否燒糊了。

從落地節奏看,質疑聲認為「端到端生命周期僅1年,VLA是否曇花一現」,郎咸朋表示:「VLA架構會延續到機器人繁榮之后,纔可能被其它技術替代,它是一個相對長期的架構,技術潛力非常大,也更像人類的智能發展規律。」

面對各種質疑,理想應對之道的根基是三大原則:一是安全絕對優先,MPA事故里程目標 600萬公里(優於人類駕駛員10倍),用數據兑現承諾;二是有效算力至上,以 FP8/INT4量化革命讓每顆芯片「鞠躬盡瘁」;三是用户共建迭代,134萬車主接管數據驅動強化學習。

寫在最后

理想汽車的VLA「長征」,遠非一場單純的技術突圍。它是在智能駕駛喧囂的競技場上,對行業浮躁與捷徑誘惑的一次「撥亂反正」。當整個行業被「短平快」的焦慮裹挾,沉溺於算力參數的軍備競賽時,理想選擇了一條佈滿荊棘的自研之路。

這條路的艱難顯而易見,但理想的創新內核,恰恰體現在這份對困難的坦然擁抱與主動選擇上。李想所言的「選擇‘長’的」,其深意不僅在於時間的長度,更在於路徑的深度——深入本質,重構規則。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。