繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

黑芝麻智能的「未雨綢繆」

2025-01-08 23:11

過去的很多年里,中國智駕芯片市場被國外巨頭如英偉達、Mobileye等所主導。這些企業憑藉強大的技術實力和完善的生態系統,佔據了市場的絕對優勢。但國內智駕芯片廠商的崛起,讓中國的智能化從依賴逐漸走向自主。

根據弗若斯特沙利文的數據統計,2023年,按出貨量計算,英偉達、地平線、黑芝麻智能已躋身全球車規級高算力SoC供應商前三甲。

以黑芝麻智能為例,核心產品主要包括兩個系列:華山和武當,前者面向智能駕駛,后者面向艙駕融合。

華山A1000是一個代表性的產品系列。在A1000所處的時代中,芯片廠商的主要智駕產品還是小算力芯片,主要應用在一體機里,還不足以實現高階智駕的功能。而黑芝麻智能A1000是市場上除英偉達外唯一的大算力芯片。這樣的市場定位,幫助黑芝麻智能迅速在智駕芯片行業站穩腳跟。

近日,黑芝麻智能宣佈推出其專為下一代AI模型設計的高算力芯片平臺——華山A2000家族,包括A2000 Lite、A2000和A2000 Pro三款產品,分別針對不同等級的自動駕駛需求。A2000 Lite專注於城市智駕,A2000支持全場景通識智駕,而A2000 Pro則是為高階全場景通識智駕設計。

黑芝麻智能能否憑藉「整體升維」的A2000系列產品,走出華山系的第二條增長曲線?

三年前的一場提前佈局

芯片行業是一個長坡厚雪的行業。通常情況下,一款智駕芯片的開發時間需要2到3年,除了高昂的研發成本外,后續還要投入鉅額的流片費用,單次流片的成本至少需要幾千萬元。芯片廠商需要思考一個問題:未來5年,智駕行業對芯片的需求會不會變?如果變,會是什麼?

據雷峰網瞭解,2022年A1000實現量產並推向市場后,黑芝麻智能就啟動了A2000系列的前期市場分析和調研。黑芝麻智能產品副總裁丁丁表示,「我們內部對A2000的定位,就是要用更高的性價比和計算效率,去面向更先進的算法和更高階的智駕功能。」

因此,A1000和A2000在設計時就有比較明顯的區隔。前者面向高速NOA和記憶行車能力,而A2000面向城市NOA及全場景通識智駕等更復雜場景,從Lite版本開始就已專注在複雜的城市場景,產品組合覆蓋了從NOA到Robotaxi的廣泛應用場景。

從性能上來看,A2000原生支持Transformer模型,這是非常重要的一個賣點。

2020年,特斯拉團隊對底層代碼進行重寫及網絡重構,引入了Transformer的架構,將2D圖像復原至3D視角,使得自動駕駛方案環境感知的能力有了質的飛躍,BEV+Transformer的架構解決了行車過程中大多數共通的場景。

2022年AI Day上,特斯拉引入了Occupancy佔據網絡,這一概念又迅速流行。

在此之后,「BEV」、「Transformer」成爲了智能駕駛圈中的熱詞,引發車企的爭相跟進,華為、小鵬、理想、蔚來等車廠均確立了大模型加持下的高階智駕方案,研發進度大大提速。

丁丁認為,在中算力平臺上,車企和智駕供應商們開發的智駕功能是以完成一個特定任務為目標。而大模型時代,智能化一定是具備了「常識性」的智能水平,與中算力平臺上的具體應用會是不一樣的存在,未來智能汽車甚至會有比司機更好的表現。

「真正意義上的智能化,一定是一個大規模的模型,同時具備了多模態的能力。」

不過,一個現實問題是,目前智駕行業內出貨量最大的Orin-X對於大模型的支持是不夠的。

理想汽車在2024智能駕駛夏季發佈會上,就曾明確指出Orin-X的問題:「Orin-X並不是為Transfomer大模型設計的,內存帶寬也有問題,把大模型部署到Orin-X上的時候面臨很多難題,推理時間長達4秒,這在自動駕駛系統上是一個不可接受的時延。」

因此,黑芝麻智能提出了「全場景通識智駕」概念,基於知識範式將駕駛場景的信息引入到知識增強的表示空間中,這些信息可以被推導為場景語義空間中的通用知識,隨后通過知識的反映來推斷場景,全面覆蓋城市道路、高速公路、晝夜變化以及各種氣候條件的不同場景。

據丁丁透露,黑芝麻智能正在進行大模型的開發和部署工作。當然,有很多自研能力突出的車企團隊,已經擁有了很成熟的模型,黑芝麻智能會提供更好的適配性。而對於缺乏模型經驗的用户,就可以直接選用黑芝麻智能的參考模型,基於參考模型去進行功能的開發和體驗的優化。

1月2日,黑芝麻智能宣佈與阿里雲達成深度合作,通義千問15億、30億參數大模型已成功在黑芝麻智能武當C1200家族芯片上完成部署。未來,通義大模型還將與黑芝麻智能華山A2000家族芯片進行適配。

對於后續A2000的潛在用户來説,黑芝麻智能和阿里的跨界結合將是一股很強的吸引力。

如何讓芯片更有生命力?

工具鏈是一顆芯片能否有生態能力和持久生命力的保證。對芯片公司來説,能夠提供適配的軟件算法以及量產落地服務,和產品本身同樣重要。

曾有投資人向雷峰網説到,「SoC太大了,公司不能把它只作為芯片來出售,SoC必須是一個解決方案,芯片帶着一套軟件還有中間件,再加上生態一起賣給客户才行。」

開發工具鏈,就成為一家芯片公司幫助客户降低應用門檻的重要保證。

黑芝麻智能創始人兼CEO單記章曾表示,「配合不同的開發工具,芯片之上每一層軟件都可以進行定製和替換,讓客户和合作夥伴能夠基於黑芝麻智能的芯片平臺面對不同場景開發不同的產品,既能給客户更多的靈活性,又能借助合作伙伴的能力拓展更多場景。」

黑芝麻智能不只是一家芯片設計公司,還提供完善的客户算法定製服務,支持第三方算法移植,多種算法交付方式等商業模式。據雷峰網瞭解,2024年有多款車型量產,採用黑芝麻智能全視感知的算法,包括前視、環視泊車、側視融合的方案都已經做到量產交付的水平。

配合華山系列自動駕駛計算芯片,黑芝麻智能先后發佈了山海人工智能開發平臺以及瀚海自動駕駛中間件平臺,成熟的工具鏈和中間件體系支撐快速量產。

截至2024年6月30日,華山A1000芯片已成功應用於領克08EM-P 、東風eπ 007等車型,累計獲得16家OEM及Tier1的23 款車型量產意向訂單。

當前,各類AI算法主要利用深度神經網絡等算法模擬人類神經元和突觸,NPU能夠實現更高效率、更低能耗處理人工神經網絡、隨機森林等機器學習算法和深度學習模型。

丁丁表示,A2000最核心的還是新一代的神經網絡加速器(NPU)。設計之初,黑芝麻智能就希望不僅僅是做一代芯片或者爲了一個階段的算法服務,而是希望它具備可以可擴展性,能夠展現對新算法的適配性。

在A2000系列上,黑芝麻智能推出了自研NPU新架構——黑芝麻智能「九韶」。新一代通用 AI工具鏈BaRT和新一代雙芯粒互聯技術BLink兩大創新,共同賦能「九韶」計算性能的充分發揮和靈活擴展。

九韶NPU採用了領先的大核架構,支持智駕大模型的實時推理,降低算法計算的延迟,基於優先級搶佔的機制為處理複雜計算任務提供了強有力的支撐。

同時,九韶NPU也是業界最高安全等級的NPU,高安全等級能夠避免模型推理過程中的隨機錯誤和失效,支持訓練與部署的一致性,確保了自動駕駛系統的高安全性和確定性。

九韶NPU的特點包括高算力、高能效和高帶寬,這是智能駕駛技術向更高階迭代的基礎。它支持包括INT8/FP8/FP16在內的混合精度,集成了針對高精度精細量化和Transformer的硬加速,能夠簡化開發者在量化和部署過程中的工作。

此外,九韶架構還具備低延時和高吞吐的三層內存架構。

上文理想的例子,説到了Orin-X的另一個問題——內存帶寬,這其實是衡量智駕性能時容易被忽略的一個細節。

神經網絡算法的本質是矩陣的乘積累加運算,這個過程中需要頻繁的讀取數據,使用的算法模型參數越多,在內存中需要保存的數據量越大。以GPT3為例,參數量為1750億,訓練數據達到了570GB,而GPT-4的參數規模則超過1.5萬億。因此,大模型時代,開發者對存儲帶寬的要求也越來越高。

黑芝麻智能的九韶架構,包括大容量高帶寬的NPU專用緩存、核心模塊片內共享緩存,以及對稱的雙數據通路和專用DMA引擎,提升了性能和有效帶寬,降低對外部存儲帶寬的依賴,在性能、帶寬和成本之間取得了極致平衡。

爲了充分發揮九韶架構的潛力,黑芝麻智能還研發了新一代通用AI工具鏈BaRT。BaRT支持多種流行框架和模型的轉換,原生兼容PyTorch的推理API,支持Python編程部署。這使得開發者能夠更加便捷地利用九韶架構進行AI模型的開發和部署。

BaRT的另一個優勢是支持業界主流的Triton自定義算子編程,允許開發者使用Python語言編寫Triton自定義算子,這些算子可以被自動化編譯成硬件加速代碼,從而進一步加速開發者AI模型的部署。

爲了滿足不同等級自動駕駛的算力需求,新一代雙芯粒互聯技術BLink技術為算力擴充提供了高效解決方案。BLink支持Cache一致性互聯的高效C2C(Chip-to-Chip)技術,能夠擴展支持更大規模模型的算力需求,為算法長期演進做好準備。

通過BLink技術,A2000家族芯片能夠實現軟件單OS跨片部署,支持高帶寬C2C一致性連接,滿足NUMA跨芯片訪存要求,簡化軟件開發和部署的難度。

丁丁坦言,工具鏈的核心是「足夠好用,足夠應用」。相比於前代,A2000的工具鏈無論是投入時間或是資源都更大。

挖掘下一個增量市場

2022年9月,英偉達正式發佈了全新一代SoC芯片——Thor,也就是被智能汽車愛好者們廣泛提及的「雷神芯片」。當時,官方宣稱其單顆算力最高可達2000 Tops。有不少主機廠陸續官宣將在下一代車型中採用Thor芯片,如小鵬、理想等等。

智能化時代的一個信條是「算力即權力」。在討論智駕芯片性能強弱的時候,行業習慣於用Tops來衡量。例如英偉達的OrinX,被認為是目前市場上性能最強的智駕芯片,單顆芯片的最大算力達到了254 Tops,而特斯拉的FSD芯片單顆算力只有72 Tops,從紙面數字上看,OrinX的算力確實很強,但Tops並不是衡量智駕芯片的唯一標準。

A2000的量產時間預計在2026年。而Thor原本計劃2024年中量產,現已大幅推迟。小鵬汽車P系列及G系列的產品負責人在11月通過社交媒體表示:「Thor到現在為止還在延期,還沒有確定的SOP(標準作業程序)時間,現在看來,2026年能見就不錯了。」

如果以這個最晚的時間來看,A2000是否會直面Thor的影響?

丁丁表示,「行業不太會用Tops來評價芯片,而是要從綜合性能來看。最好的方式就是讓同樣的模型在不同的芯片上跑,能達到什麼樣的幀率、什麼樣的精度。」

另一方面,汽車芯片的更新換代不像是手機的周期快,儘管汽車的智能化能力在提速,但是芯片廠商實際還是處於同一個階段。而且,不少國內友商更看重的是芯片的整體性價比,集成度、計算效率、系統成本等等,芯片並不是單一維度的競爭。

在與丁丁的訪談中,一個出現比較高頻的詞語是「性價比」。實際上,這也是黑芝麻智能這類芯片廠商代表,對自己的一種精準定位。2023年上半年,黑芝麻推出基於A1000芯片的城市NOA級別域控制器產品,可以做到3000元以內的成本。

值得注意的是,華山A2000家族芯片不僅在智能汽車領域展現出強大的性能,還能夠支持機器人和通用計算等多個領域。這似乎對外釋放出一種信號——黑芝麻智能正在關注具身智能。

此前,比亞迪發佈招聘具身智能研究團隊的信息,廣汽集團、小鵬汽車、奇瑞汽車也公開宣佈佈局這一領域。

李想日前也在直播間表示,理想汽車100%會做人形機器人,不過節奏不是現在。在他看來,自動駕駛汽車就是最簡單的機器人,如果這都沒法解決,更別說更復雜的人形機器人。

人形機器人主要包含環境感知、人機交互和運動控制三大系統,而自動駕駛的核心技術也涵蓋感知、決策和執行,這些都與視覺、激光雷達、芯片、算法等技術密切相關同時,在電機電控、動力電池等方面,人形機器人和自動駕駛技術也存在一定的共通性。

據雷峰網瞭解,黑芝麻智能正在籌備具身智能方向的資源。

今年8月,一位投資人向雷峰網表示,「自研芯片能成功有兩點前提,一是芯片本身做得足夠好、技術實力足夠強,二是終端銷量足夠多。只有這樣,才能覆蓋掉此前在芯片上投入的研發成本。特斯拉做車,又在做機器人的邏輯正在於此。」

從中階量產、高階研發到L3預研,明年智駕行業的綜合競逐會更加激烈。從現實角度出發,高階智駕和具身智能場景,是值得黑芝麻智能探索的兩大增量市場。

在今年的一次演講中,丁丁就説到,「我們預測NOA在未來3-5年內複合增長率在40%以上,實際落地量產的規模增長也會進一步推動高階智駕L3甚至Robotaxi上的一些技術突破。自動駕駛處在突破期到爆發期轉的轉折階段,在這個階段跟住趨勢,未來商業上一定會有很好的回報。」 雷峰網(公眾號:雷峰網)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。