繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

Momenta曹旭東:智能駕駛競爭,兩年內定格局|36氪專訪

2025-01-23 09:00

文丨李安琪

編輯丨李勤

過去兩年,AGI(通用人工智能)極速經歷了一輪資本轟炸與選手離場,但其「致命引力」仍在持續虜獲信徒。2025開年,理想汽車CEO李想就喊出了「未來汽車將是硅基家人」的設想。汽車與機器人行業的高牆邊界,正在逐漸瓦解。

智能駕駛公司Momenta創始人曹旭東也認為,AGI是每個做AI的人的終極夢想。如果説智能手機iPhone的出現是一道千米高巨浪,那他認為,比iPhone更具顛覆性的機會是通用機器人。

但曹旭東的入場時間不是當下,「我們做(機器人)的話可能會是2027、2028年的事情。」眼下更焦灼的戰場,還是智能駕駛的市場份額角力。

曹旭東判斷,今年高階智駕會規模起勢,2026年智駕行業就會勝負分曉。

「今年城市NOA(即城市領航輔助駕駛)功能會下探到15萬元車型,今年底、2026年初10萬級車型也會搭載城市NOA。」

這是已經躋身頭部梯隊的Momenta,不能松懈的時刻。電動化狂飆后,當下中國車市的競爭重心已經向智能化傾斜。去年開始,華為、小鵬、理想等公司輪番出擊,從大戰「智駕全國能開」到攻頂「端到端」。

Momenta是為數不多、擁有「端到端」量產能力的智駕技術公司。

從2022-2024年,三年間Momenta量產的高階智駕搭載車型數量分別是1款、8款、超20款。「今年量產規模可能有數倍增長。」曹旭東説。

近期,我們在Momenta總部蘇州見到了創始人曹旭東。對於Momenta在端到端智駕競爭中快速出圈,他接連表示,「我們只是做的足夠早。」

Momenta創始人曹旭東  圖源官方

「端到端」主張用一個大模型來貫通智駕的感知、預測決策、控制環節,從過往工程師手寫規則告訴車輛如何行駛,到使用AI大模型、海量數據、雲端大算力,讓智駕具備自我進化能力。

曹旭東告訴36氪汽車,內部很早嘗試將AI模型融入智駕,比如2019年開始用Transformer來做預測、路徑規劃等,2023年初量產兩段式端到端,2024年進化到一段式端到端方案。

在工程能力方面,Momenta也早早瞄準了量產智駕的機會。2021年以來陸續與智己汽車、比亞迪等車企深度合作。

曹旭東坦言量產過程的不易,「跟中國車企合作起碼‘敲門’要敲3年,國際車企‘敲門’要敲5年以上,真正量產時間可能需要10年。」比如Momenta跟某跨國車企從2017年開始接洽,到通過供應鏈准入、真正量產落地,中間花了8年時間。

他認為,先進入車企量產節奏的公司一定能更早獲得量產經驗,拿到更多數據,然后快速迭代。比如在量產過程中,Momenta探索出數據驅動模式,滿足端到端的進化需要;設計了一套自動化工具鏈來適配不同車企的不同硬件需求。

而在配套車企的量產速度上,Momenta可以做到:從開始合作到上車交付,硬件部署加上算法調試只需三個月。

這些都成為Momenta立足頭部智駕公司的「原始積累」,但行業競爭和挑戰也日趨激烈。

曹旭東對此表示,智駕越往后越難,當下一年投入小几十個億,就能做到第二梯隊或準第一梯隊水平,但再往后,要幾百億才能做到同樣水平。「差距可能在拉大,而不是在縮小。」

考慮到「端到端」是一場長期競賽,Momenta做好了投入巨量資源的準備。曹旭東是,因為中國的道路數據豐富度、複雜度遠比歐洲、日本道路高。「有時候我們開玩笑説,我們golden data(黃金數據)可能比特斯拉多。」

曹旭東認為,如果要做到量產L4自動駕駛,每年的研發投入至少是百億甚至幾百億,其中費用大頭將是雲端算力。

「現在瓶頸不在於原始數據入口,而在於雲端算力太貴,有沒有那麼多錢去燒。」

「端到端」技術之下,Momenta正把量產智駕中形成的「時間壁壘」,轉換成「資源壁壘」,這是留在終局牌桌上不可或缺的籌碼。同時,Momenta也還在衝刺Robotaxi業務。

Momenta計劃在2025年實現完全無人駕駛——Robotaxi(無人駕駛出租車)。「我們跟行業不一樣,會複用量產車傳感器和域控去做Robotaxi,毛利是正的。我們不會燒錢擴規模。」曹旭東説。

以下是36氪汽車與Momenta創始人曹旭東的對談,內容略經編輯:

「談投入:高階智駕已經引爆,后續研發投入要百億」

36氪汽車:2024年新能源車滲透率過半,您覺得2025年智能駕駛滲透率會有多高?

曹旭東:中高階智駕滲透率應該有10%-20%。

36氪汽車:頭部車企要標配智駕,作為上游供應商,你們的業務會有怎樣量級的增長?

曹旭東:量產規模可能有數倍增長。

36氪汽車:高階智駕車型會下探到什麼價格區間?

曹旭東:2025年我覺得能探到15萬元左右,2025年底、2026年初可能10萬級也會有城市NOA。另外,高階智駕BOM成本在快速往下走,智駕體驗和安全會有10倍、百倍甚至千倍提升。高階智駕會逐漸變成車企的標配。

36氪汽車:你們內部看到的智駕實用性數據是怎樣的?

曹旭東:OEM(主機廠)不停把高階智駕從30萬的車下放到20萬、15萬逐漸到10萬的車,説明消費者願意買單,車企才願意買單。從我們后臺數據來看,用户基本50%里程都在使用智駕。

36氪汽車:智駕很火但很多智駕公司還沒賺到錢,這種局面什麼時候會改變?

曹旭東:自動駕駛研發投入很大,未來會更大。如果要做到量產L4,每年的研發投入至少是百億甚至幾百億。算一下,如果100萬臺車攤下來,單車智駕成本是1萬人民幣;如果1000萬臺車,單車大概1000塊。如果要打平研發投入,規模得在幾百萬臺車。

2024年是高階智駕的引爆點,規模還沒真正起來。最終要盈利的話,一定要做到規模效應,玩家變少后,營收規模覆蓋研發成本才能盈利。

36氪汽車:智駕行業什麼時候洗牌結束?留在牌桌上需要哪些技能?

曹旭東:差不多2026年底會結束,勝負會有分曉。留下來的話,可能有幾方面。第一,好的技術和產品,這背后是強大的組織能力和研發體系,這是最重要的必要條件。

第二,還是要有先發優勢,尤其是量產自動駕駛,跟車企合作是要敲門敲三年的。如果這家車企,現在還沒有機會進去,后面再進非常難。先進的人一定能更早獲得量產經驗,拿到更多數據,然后快速迭代。

36氪汽車:每年百億級投入其實不小,這筆錢從哪里來?主要花在哪里?

曹旭東:大部分肯定是收入。我們的研發佔比會非常高,我們不是硬件公司,所以毛利潤也會很高。一輛車賣出去,就是完整的軟件license(軟件授權費用),毛利潤跟微軟賣Office是一樣的。研發投入巨大,但一旦研發出來,margin cost(邊際成本)幾乎就是0。

主要花在人員和雲端算力,越往后算力越佔大頭,2027、2028年比人員投入會顯著很多。

36氪汽車:你們今年算力砸了多少錢?

曹旭東:2024年智駕纔剛剛爆發,2025年規模會起來。我們到2027年差不多會有數十億元算力投入。

「談端到端:瓶頸不在於數據量,而在於黃金數據與算力」

36氪汽車:Momenta在端到端量產上做得很快,你們總結過大概做對了哪些方面嗎?

曹旭東:根本原因還是做的早。Transformer是2018年出來的,我們2019年就用來做deep learning prediction(深度學習預測),2020年做deep learning planning(深度學習規劃),2023年初量產了兩段式端到端,只不過那時候沒有這個名詞。

2024年上半年,我們把一段式端到端做出來。這背后還是人才積累、研發體系積累。端到端其實就是用一個模型做攝像頭輸入,然后軌跡輸出。為什麼最近才火?因為方向正確但成功路徑可能萬里挑一,如果之前沒有積累,很難找到正確路徑。

36氪汽車:您認為做端到端的挑戰是什麼?用規則為模型兜底難嗎?

曹旭東:我覺得,用規則兜底對端到端來説可能是錯的。因為有各種各樣的corner case端到端模型搞不定,所以才需要兜底。但照理來説,端到端模型有能力搞定corner case,為什麼不在端到端模型里面解決問題?

我一直覺得rule base跟端到端是互為冗余關係,不能説是兜底。代碼越來越少,你不可能用越來越少的規則代碼,去給端到端大模型去兜底。

兜底意味着有數百萬個、各種各樣的corner case沒解決,用規則去為數百萬個長尾問題兜底不現實。不然的話,光靠這些兜底的代碼本身,就可以實現L4了。

36氪汽車:那端到端的技術進化已經一馬平川了嗎?

曹旭東:端到端僅僅是開始。訓練數據怎麼來?這里有大量data engineering(數據驅動)工作,好多人對數據驅動的認知是不到位的,覺得就是寫數據、做數據,髒活累活不願意干。如果這樣想,端到端根本不可能做好。

一定要把 data engineering當成是一件比software engineering(軟件工程)更重要、更需要體系化建設的事情。就像做芯片,芯片原料不就是沙子,有沙子不就可以造芯片了,這一聽就是笑話。芯片原料硅的純度要9個9~12個9,把沙子提純是一套工業體系。同樣,給端到端模型更好的數據,也需要一整套體系去支持。

36氪汽車:現在數據驅動閉環已經達到理想效果了嗎?

曹旭東:還要再提升,因為L4對數據驅動這套飛輪體系要求非常高。L4有長尾問題,可能1萬公里或者10萬公里纔會發生一次,怎麼去驗證?

如果靠自有車隊去跑路測,一周才跑幾萬公里,跑一周可能都遇不到一個case。然后發了新版本,怎麼知道corner case變好了還是變壞了。所以要通過海量量產車的影子模式,去收集數據去驗證、做閉環仿真。

36氪汽車:端到端對於數據的渴求是越來越大的。有些智駕供應商似乎拿不到合作車企的數據,你們怎麼解決?

曹旭東:説明供應商跟車企的信任關係沒有做到位。我覺得關鍵在於,智駕公司能不能給用户創造價值,能不能給客户創造價值。天下沒有白吃的午餐。

我們跟車企客户達成的共識是,車端篩選corner case(長尾場景),哪些場景做的還不夠好,我們識別、回傳,用於模型訓練和學習,有的放矢地去提升模型能力和產品體驗。

36氪汽車:這種數據共享模式是你們和每個車企都可以達成的嗎?

曹旭東:對。

36氪汽車:如果車企不願意分享數據,會成為合作門檻嗎?

曹旭東:這不是門檻,我們很佛系的。如果客户願意分享數據就一起合作,我們的數據處理都是標準化、自動化的。

如果車企覺得數據是資產,不願意共享也沒關係,我們的數據量已經很多了。現在的瓶頸不在於原始數據入口,而在於雲端算力太貴,有沒有那麼多錢去燒、去訓練數據。

36氪汽車:你們跟某個車企合作train(訓練)的模型,可以快速複製到跟其他車企的合作嗎?

曹旭東:沒問題。現在高階智駕傳感器的方案不能説完全一樣,但相對收斂。如果以視覺方案為主,傳感器通常是11個攝像頭,安裝位置雖有差異但不大。

但軟件要通用,這不是天然就有的,一定要有很好的軟件算法架構、研發體系支撐才能做到。

36氪汽車:你們現在是智駕供應商頭部玩家,接單越來越多,怎麼讓效率最大化?

曹旭東:我們的軟件算法架構已經迭代到第五代了。其實大概六七年前,我們就考慮到不同客户有不同需求,不同車型有不同硬件配置,所以要設計一套軟件架構能夠兼容不同需求,且一定要設計成可自動、標準化的流程。

36氪汽車:所以業務量增加,也不用增加太多人手?

曹旭東:對,我們2022年量產一款車,2023年大概8款車,2024年累計20多款車交付。但人數都差不多,接近1300。2027年、2028年人數會到增加到2000左右,不會大幅增加。

36氪汽車:電池行業會管控上游供應鏈來優化成本,智駕行業會有類似做法嗎?您對於供應鏈降本的思考是什麼?

曹旭東:軟件算法沒有那麼多供應商。整個自動駕駛系統就是傳感器、計算域控。傳感器相對成熟,客户來做採購,我們能做的就是提升軟件算法能力,減少對傳感器數量的依賴。

比如毫米波雷達,一開始大家用5個,我們量產車可以做3個,2025年用1個也能做得很好。技術創新就是幫客户降本。

我們判斷,能實現城市NOA的自動駕駛域控,會從當前8000塊錢,在2025年底、2026年量產車上能夠降到2000多塊錢,下降5000多。

36氪汽車:車企自研芯片還有必要嗎?

曹旭東:要看多大規模,如果一年賣幾十萬臺車的話,沒太必要。

36氪汽車:做芯片和做算法哪個更難?

曹旭東:軟件算法的門檻可能更高一些,芯片相對容易。芯片其實相對成熟,難點在於周期長。

考驗有兩點:第一,產品定位,做芯片快的話兩三年,慢的話三四年,所以要預判兩三年或三四年后的市場到底如何,如果產品定位錯了,哪怕芯片沒有一點技術問題,還是賣不出去。所以要對未來市場有精準判斷和把握。

第二是架構能力,芯片架構設定后,其實跟造車一樣,都有成熟IP、成熟開發流程和驗證、流片流程,都可以複用現有研發體系和供應鏈去做。但智駕軟件所有東西都是新的。

「談行業:跟華為「競」更多,「爭」的東西不多」

36氪汽車:華為也在不斷簽單,怎麼看與跟華為的競爭?

曹旭東:還是有差異化。我們跟華為更多是互相學習、共同提高的關係。我們很難進入華為的市場,華為也很難進入我們的市場,彼此在技術、產品上是良性競賽,「爭」的東西不多,「競」的東西更多。

36氪汽車:智駕出海是大趨勢。關於出海,你們有什麼樣的策略?

曹旭東:兩方面,一是跟着中國OEM出海,我們是唯一一家在全球做到城市NOA的自動駕駛公司。在日本、歐洲,我們的城市NOA都跑起來了,但還不是量產車。

另外,我們跟一些國際客户,把歐洲幾十個國家的自動駕駛准入標準全部都考完試了,已經拿到認證了。比如歐洲和日本客户的海外市場智駕,我們2026-2027年可以量產。

36氪汽車:海外市場對於智駕的需求大嗎?

曹旭東:坦率來説,現在需求還沒起來。我的觀察是,海外市場比中國市場晚個三年左右,稍微滯后,2024年中國高階智駕的引爆年,2027年可能是海外市場的需求高點。

36氪汽車:去海外市場的話,你們需要做哪些準備?

曹旭東:從算法架構、數據架構都要考慮這件事,主要還是模型訓練。在中國訓練出來的foundation model(基礎模型)怎麼適應歐洲或海外市場,基礎設施怎麼建設。

説個特別有意思的事情。我們發現,當中國的foundation model訓練足夠好的時候,哪怕沒有額外適配,在中國能跑100分,在歐洲去或日本大概也能跑70-80分。

我們后來分析,第一,大模型有比較強的泛化能力,第二中國的數據足夠有挑戰、足夠豐富。在海外遇到的corner case,在中國大概率也能遇到。雖然不是100%一樣,但有很高相似度。

中國數據的豐富度、複雜度比北美高很多,好多客户都説是10倍挑戰、10倍複雜度。按5倍複雜度來看,15萬臺車乘以5,有時候我們開玩笑説,我們goldern data(黃金數據)可能比特斯拉多。

FSD入華是一件好事情,會把高階智駕認知度打開。特斯拉FSD、華為和我們,會共同拉高智駕產品標準,實際上這是良幣驅逐劣幣的過程。

「談量產:車企合作敲門要敲3年,合資車企要5年」

36氪汽車:剛提到「敲車企的門要敲三年」,你們敲得比較早,能聊聊心路歷程嗎?

曹旭東:中國車企敲門要敲3年,國際車企敲門要敲5年以上。當時有個汽車行業師兄跟我説,國際車企是非常好的客户,但量產可能得10年。

2017年是互聯網創業熱潮,一個產品從有想法到上市可能就幾個月時間,汽車量產要5-10年,我們感覺非常不可思議。

36氪汽車:你們花了多長時間進入合資車企供應鏈?

曹旭東:時間很長,面向量產的開發體系建設是從2020年開始。之前是一些POC(概念驗證)項目,對供應商的研發體系考察和要求並不特別高。一旦他們把你當成量產夥伴去培養,對於整體軟件開發體系流程要求很高,會不定期考察軟件開發流程,跟傳統零部件審廠一樣。

36氪汽車:高階智駕功能需要不斷更新迭代,你們怎麼説服合資車企?

曹旭東:就是持續測試、發版。國際OEM非常嚴謹,做決策的流程很長。他們雖然有大老闆,但他們更傾向於one voice(一個聲音)決策,從上到下、從左到右,大家一致決策,而不是大老闆「啪」拍板,底下人咣咣全部跟着干。

他們的決策機制是,一個大集團里跟高階智駕相關的幾十個人,關鍵決策人可能有幾個到十幾個,要形成一致意見。這個時間周期比較長,每個人都會提出問題,有些問題需要回答,有些問題需要開發做驗證,然后才能得到結論。所以one voice的形成時間,短的話幾個月,長的話可能一兩年。

36氪汽車:你們跟一些車企合作的是純視覺智駕,未來高階智駕還需要激光雷達嗎?

曹旭東:還是有用,比如進出隧道、沒有路燈等暗光環境下,激光雷達的能力更全面。尤其是對安全要求很高的場景,按照L4標準的話,激光雷達的冗余安全作用還挺顯著。

但完全看車企需求,有沒有激光雷達對我們來説,工作量都差不多。

36氪汽車:合資車企的智能化開發節奏會很激進嗎?

曹旭東:還可以,我們的量產交付經驗非常成熟,應該是行業里真正走完0~1,又走完1~10,現在處在10~100的自動駕駛公司,是唯一一家有多車型、多個不同芯片平臺,多個不同傳感器平臺的高階智駕量產交付公司,交付速度挺快的。比如客户從工程樣車到量產要三個月,我們硬件部署加上算法調試也只要三個月。

36氪汽車:最早你是AI出身,現在要花8年時間去交付,會有落差嗎?

曹旭東:我們不把交付看成交付,而是帶着發展主線的思路去做交付的。比如交付過程中,不是靠人而是靠一套流程和體系去交付。如果有問題,我們會識別體系和流程哪里需要優化,舉一反三解決問題。

如果智駕在某些場景做的還不好,我們主線產品升級之后,可能a客户爆出來的問題,b客户也跟着受益。我們的要求是,即便是在一線,80%責任是承擔主線工作,20%是適配產品、做差異化的工作。

36氪汽車:現在AI進化特別快,你們怎麼把新技術引入進來?

曹旭東:沒有統一標準,更多是研發leader對於技術的洞察。有些是我們探索,有些是引進行業新動態,做些實驗看看效果,有就用起來,沒效果就先放一放。

這特別考驗研發一號的位洞察力。一是對問題本身的洞察力,識別問題才知道用什麼藥;第二,只有對技術本質有深刻理解,才知道技術對哪些問題起關鍵作用。技術一號位洞察力好的話,能夠極大降低公司的技術探索、試錯成本。

就像2020年我們做數據驅動,行業很多人説根本不可能。但我們認為,問題能解決但是不太容易解決,需要構建一套體系去解決。

「談AI:不會燒錢做Robotaxi,2028年L4爆發」

36氪汽車:您現在精力花在哪方面多一些,銷售端還是技術產品?

曹旭東:不同階段重心不一樣。2021-2023年我們工作服背后印的是「三大法寶」(注:Momenta的三大法寶是指智駕量產工具,包括算法框架、算法適配器、量產開發套件),更多是聚焦車型量產。

2024年我們工服口號變成了「十年挽救百萬生命」。我們產品上量速度很快,這個時候要考慮,產品給用户創造的最核心價值是什麼?智駕最核心的價值還是安全,所以我們把這作為十年願景。

2025年我們要實現完全無人駕駛——Robotaxi(無人駕駛出租車)。我們跟行業不一樣,會複用量產車傳感器和域控去做Robotaxi,毛利是正的。我們不會燒錢擴規模去做demo,講故事,我們希望在賺錢的情況下擴規模。

36氪汽車:你們要怎麼量產Robotaxi,自己買車建車隊?

曹旭東:打標杆的話是建車隊,后續推開會是加盟模式。1000臺車以內都是我們自己運營,把標杆模式打通后就搞加盟。

加盟的不一定是車企,加盟可能是各地原來的出租車公司、出行公司,可能跟滴滴這種平臺也有很好合作機會。

36氪汽車:Robotaxi等於L4或者自動駕駛嗎?會有人覺得Robotaxi難度比L4低,只要安全到達但可能超車或者選路表現不那麼好,也可以接受。

曹旭東:也不是,看谷歌Waymo,Robotaxi最近一周接近20萬單,單量增速明顯更快。原因我覺得還是Waymo體驗好,更像老司機。

36氪汽車:有人覺得Waymo的模式可能跑不通,您怎麼看?

曹旭東:Waymo有可能跑通,因為谷歌足夠有錢,一年利潤是千億美金級別,一臺車成本按百萬人民幣來算,一萬臺車才100億,就是十幾億美金。如果是10萬臺車,成本是100多億美金,只佔Waymo一年利潤的百分之十幾。

只要Waymo覺得技術成熟了,靠資金去擴規模,他們是燒得起的,但國內很多公司可能不太現實。

36氪汽車:你們一臺Robotaxi量產車的成本大概是多少?

曹旭東:一輛中級車的價格,整車包括智駕成本在內。要是能夠實現完全無人,運營毛利潤就是正的。

我們的L4不是demo性質,可能是幾十萬輛車,甚至未來幾百萬輛車,全國都能開。做幾百台Robotaxi和1萬臺車的難度完全不一樣,安全性要提升100倍。我們大方向和路徑相對清晰,當然過程中可能有很多小路要探索、試錯。

36氪汽車:您怎麼看多模態大模型跟端到端的結合?這是通向L4的路徑嗎?

曹旭東:我們也在探索。

36氪汽車:你們對於L3級智駕有哪些探索?

曹旭東:已經在做了,量產時間是2026年下半年。難點不在於車硬件本身,還是安全。L3的安全性要求跟L4是一樣的,我們對L3的要求是10萬小時才一次出現事故,人大概是不到1萬小時出現一次事故。車比人開車要安全10倍,還蠻挑戰的。現在L2人車共駕情況下,我們可以做到比人安全6-7倍。

36氪汽車:現在也有自動駕駛公司在搭建AI底座,衍生其他AI業務,Momenta會有類似想法嗎?

曹旭東:通用機器人可能是每個做AI的人的終極夢想。短期內我們不會做,我們做的話可能是2027、2028年的事情。

自動駕駛既有感知智能,又有認知智能,比人的通用認知智能要更容易實現,我們覺得自動駕駛是很好的AI切入點,去理解什麼是intelligence(智能)並把它做出來。

如果自動駕駛認知智能、感知智能更強,那就變成了通用機器人。我認為,智能手機iPhone是1000米高巨浪,智能汽車機會也很大,但只是幾百米高的巨浪,比iPhone更具顛覆性的機會是通用機器人。

36氪汽車:2027年做機器人之前,自動駕駛已經完全實現了嗎?

曹旭東:我的判斷是,自動駕駛在2027、2028年會逐漸達到像2024年L2+的爆發一樣,2028年是L4自動駕駛的拐點或者爆發點。

不過具身智能的物理硬件還處於比較早期階段,比如手、腿上關的控制很難做,通用機器人要不要長得像人,要不要手,這些還很發散,還要三四年時間,機器人物理硬件才能相對收斂。自動駕駛不一樣,車身硬件非常成熟。

自動駕駛對安全性要求很高,通用機器人的通用性要求極其高。整體來説,我覺得自動駕駛和通用機器人的能力交集大於80%。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。