繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

小鵬聯合北大提出全新視覺Token剪枝框架,何小鵬:在探索L4路上又取得新突破

2025-12-28 15:56

  新浪科技訊 12月28日下午消息,近日,人工智能領域國際會議AAAI 2026公佈了論文錄用結果,由小鵬汽車和北京大學計算機學院多媒體信息處理全國重點實驗室聯合完成的論文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》成功入選。這篇論文最大的貢獻在於,提出了一種專門為端到端自動駕駛VLA模型定製的、高效的視覺Token剪枝框架——FastDriveVLA。

  據介紹,FastDriveVLA包含一個即插即用的視覺Token剪枝器ReconPruner。在車端模型的推理階段, ReconPruner可直接嵌入自動駕駛VLA模型用於視覺Token的剪枝,即插即用,無需重新訓練整個模型。爲了輔助該剪枝器的訓練,還專門構建了包含來自6個攝像頭視角的24.1萬個圖像-掩碼對的nuScenes-FG數據集。這一大規模的自動駕駛前景分割標註數據集,可廣泛用於未來自動駕駛的研究。

  最終,nuScenes自動駕駛數據集上的測試顯示,採用這一剪枝框架,在不同剪枝率下均取得當前最優即SOTA效果:剪枝比例達25%視覺Token時,駕駛性能幾乎不下降,其L2軌跡誤差與碰撞率指標甚至超越未剪枝的基準模型;剪枝比例達50%Token時,在所有指標上表現更平衡;與此同時,VLA模型的推理效率得到了顯著提升。

  小鵬汽車聯合北大提出的FastDriveVLA,建立了自動駕駛VLA模型的高效視覺Token剪枝的新範式,同時樹立了車端大模型高效部署上車的新標杆。小鵬汽車董事長何小鵬在微博上對此表示,「很高興我們在探索L4的路上又取得新的突破。我們會在物理AI領域繼續發力,期待第二代VLA給鵬友們帶來更棒的智駕體驗。」

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。