中國AI芯片企業的追擊

2023-06-16 09:28

本文來自格隆匯專欄：國泰君安證券研究，作者：李沐華、齊佳宏

1、 AIGC拉動AI算力需求，AI芯片將成為未來科技石油

隨着AI 進入「大模型」時代，訓練數據不斷增長、算法複雜度不斷提高，國內人工智能廠商對算力的需求陡升。AI芯片作為大模型及AI應用落地的算力基礎，重要性日益凸顯。

廣義的AI芯片指專門用於處理人工智能應用中大量計算任務的模塊，即面向人工智能領域的芯片均被稱為AI芯片。狹義的AI芯片即針對人工智能算法做了特殊加速設計的芯片。狹義的AI芯片與傳統芯片（如CPU）相比，性能優勢主要體現在專用性的側重上。

針對不同技術路徑，國內廠商均已有所佈局。

Ø GPU：國內GPU廠商已有部分產品落地，國產GPU迎來黃金發展期。相比英偉達和AMD，國內GPsU廠商的營收規模較小。但是國產GPU正受益於信創的機遇，在數據中心、智能汽車、遊戲等應用領域的國產GPU需求量也極大提升，國產 GPU正在迎來黃金發展期。目前景嘉微已成功研發JM7200和JM9系列GPU芯片，應用於臺式機、筆記本、服務器、自助終端等設備。海光信息的DCU也屬於GPGPU的一種，其DCU協處理器全面兼容「類 CUDA」環境，主要部署在服務器集羣或數據中心。

Ø CPU+FPGA：國內巨頭紛紛佈局CPU+FPGA的混合異構加速AI計算。FPGA芯片用於加速AI計算時可以實現靈活部署，具備可編程性、高並行性、低延迟、低功耗等特點，在AI推斷領域潛力巨大。全球科技巨頭紛紛佈局雲端FPGA生態，國內包括騰訊雲、阿里雲均在2017年推出了基於FPGA的服務，百度大腦也使用了FPGA芯片。此前被全球最大FPGA廠商賽靈思收購的深鑑科技也是基於FPGA來設計深度學習的加速器架構。

Ø ASIC：國內ASIC廠商實力雄厚，積極追趕國外芯片巨頭。ASIC作為專用集成電路，廣泛應用於人工智能設備等領域，根據終端功能可細分為TPU芯片、DPU芯片和NPU芯片等。最具代表性的就是谷歌2015年推出的首款TPU，大幅提升AI推理的性能。經過近年來國內ASIC廠商的快速發展，在工藝、算力、整體性能等方面，均達到國際領先水平。海思的昇騰910在BF16浮點算力方面超越谷歌最新一代產品TPUv4，遂原科技的雲燧T20和寒武紀的NPU在整體性能上也與谷歌比肩。未來國內頭部ASIC廠商有望繼續保持技術優勢，突破國外廠商在AI芯片的壟斷格局。

實現專用算法「硬件優化」，ASIC路線在AI領域的長期成長性值得期待。ASIC雖然無法重新編程，且前期投入成本較高，但是在大規模量產的情況下，ASIC具備性能更強、體積更小、功耗更低、成本更低、可靠性更髙等優點。隨着人工智能技術發展成熟、算法逐漸收斂，ASIC將更具備一定競爭優勢。

2、國內AI芯片企業蓬勃發展

在政策和需求的雙重促進下，中國AI芯片廠商奮起直追，尤其在ASIC方向發展機遇較大。整體上看，國外芯片巨頭目前仍處於領先地位，佔據了大部分市場份額，並且在GPU和FPGA方面近乎壟斷。但國內AI芯片廠商在政策和需求的雙重拉動下奮起直追，華為海思、地平線、寒武紀、海光信息、崑崙芯等廠商在多個領域取得突破進展。尤其在ASIC 路線下，國內廠商有機會實現快速搶佔市場。

國內AI芯片企業百花齊放

寒武紀：AI芯片獨角獸，中國ASIC路線先行者。寒武紀成立於2016年，是全球AI芯片領域第一個獨角獸初創公司，研發團隊成員主要來自於中科院，董事長陳天石曾任中科院計算所研究員。

作為AI芯片領域的獨角獸，寒武紀曾與華為攜手打造全球首款手機AI芯片，近年來通過專注打造雲端產品線構建技術壁壘。

Ø 雲端：AI芯片寒武紀近年來不斷推出面向雲端的AI芯片，思元290是寒武紀首款面向雲端訓練的智能芯片，思元370面向雲端且實現訓推一體，這兩款芯片均採用7nm製程工藝。此外，思元370是寒武紀首款採用Chiplet技術的AI芯片，寒武紀第二代雲端推理產品思元270算力的2倍。

Ø 終端：2016年，寒武紀發佈了全球首款終端AI處理器、首款商用NPU「寒武紀1A」，面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類終端設備，主流智能算法能耗比全面超越傳統CPU、GPU。寒武紀1A被應用於全球首款智能手機AI芯片——麒麟970。

華為海思：昇騰代表業界最強AI算力。思半導體成立於2004年10月，是華為的全資子公司。得益於母公司的強勢全力支持和持續的高研發投入，海思已成為全球領先的Fabless半導體公司，產品覆蓋智慧視覺、AIoT、智慧媒體、智慧交通及汽車電子、顯示、手機終端、數據中心及光收發器等多個領域。

昇騰系列——面向「端、邊、雲」全棧全場景AI芯片，代表着業界最強AI算力，採用華為自研的達芬奇架構，對標國際巨頭谷歌英偉達。2018年，華為提出了全棧全場景AI解決方案併發布了兩款AI芯片，昇騰910和昇騰310，其計算核心採用華為自研的面向AI計算特徵的「達芬奇架構」。昇騰910是單芯片計算密度最大的芯片，對標英偉達V100和谷歌TPUv3，比V100的標稱算力125TOPS高出約一倍，而昇騰310芯片的最大功耗僅8W，是極致高效計算低功耗AI芯片。基於昇騰系列AI處理器，華為推出Atlas全系列、全息感知產品，覆蓋端側、邊緣側和數據中心側。

地平線：國內車載芯片領頭羊。地平線成立於2015年，是一家注重軟硬件結合的AI創業公司，致力於開發邊緣AI芯片及相關解決方案，由Intel、嘉實資本、高瓴資本領投。

提出嵌入式AI芯片架構BPU，堅持「芯片+算法+工具鏈」完整解決方案。2017年12月，地平線自主設計研發了中國首款嵌入式人工智能視覺芯片——旭日系列和征程系列，基於自研BPU架構，通過軟硬結合打造極致性能。目前，地平線是業界唯一能夠提供覆蓋從L2到L4全場景整車智能芯片方案的人工智能平臺型企業。

Ø 旭日系列是面向智能攝像頭的處理器，具備在前端實現大規模人臉檢測跟蹤、視頻結構化的處理能力，可廣泛用於智能城市、智能商業等場景。

Ø 征程系列是面向自動駕駛的處理器，可同時對行人、機動車、非機動車、車道線交通標識等多類目標進行精準的實時監測和識別，實現FCW/LDW/JACC等高級別輔助駕駛功能。

海光信息：國產CPU+DCU龍頭，性能達國際化可比水平。光信息成立於2014年，公司骨干研發人員多擁有國內外知名芯片公司的就職背景，擁有成功研發x86處理器或ARM處理器的經驗。

CPU+DCU雙輪驅動，實現領先的處理器性能。海光信息的產品包括海光通用處理器（CPU）和海光協處理器（DCU）。海光 DCU 系列產品以基於通用的GPGPU架構，採用7nm工藝，兼容「類 CUDA」環境以及國際主流商業計算軟件和人工智能軟件，軟硬件生態豐富。目前海光DCU系列產品深算一號已經實現商業化應用，於2021年實現規模化出貨，未來將廣泛應用於大數據處理、人工智能、商業計算等領域，其產品性能達到了國際上同類型主流高端處理器的水平，具有較強的並行計算能力和較高的能效比，在國內處於領先地位。

AI芯片乃兵家必爭之地，BAT均已有所佈局

對於互聯網大廠來説，騰訊、百度、阿里巴巴等均在AI芯片領域大力佈局。其中，騰訊投資燧原科技、百度投資崑崙芯、阿里巴巴則孵化了平頭哥。除此之外，原AMD全球GPGPU設計總負責人陳維良成立了沐曦集成電路，兩位CTO均為前AMD首席科學家；原AMD首席工程師鄭金山成立了天數智芯，首席技術官曾任三星全球副總裁；原商湯科技總裁張文成立了壁仞科技，CTO曾任職於海思的GPU自研團隊。

燧原科技（騰訊系）：燧原科技成立於2018年，公司創始人趙立東曾任紫光通信科技集團有限公司副總裁、AMD計算事業部高級總監；COO張亞林曾任AMD資深芯片經理、技術總監。

邃思2.0是迄今中國最大的AI計算芯片。公司成立以來，已相繼推出雲端AI訓練芯片邃思1.0/2.0、雲端AI訓練加速卡雲燧T1x/T2x和AI推理加速卡雲燧i1x/i2x，以及配套的「馭算」軟件編程平臺TopsRider和「鑑算」推理加速引擎TopsInference。公司2021年在世界人工智能大會期間發佈的邃思2.0是迄今中國最大的AI計算芯片。

自研軟硬件協同架構設計，靈活通用高效開發。燧原芯片架構採用「GCU-CARA」(通用計算單元和全域計算架構)，是分別基於硬件的通用計算單元GCU和基於軟件的馭算TopsRider兩個主要品牌，具備完全可編程、全模式計算、全精度計算、高並行度等特點。其軟件編程平臺馭算TopsRider和推理加速引擎鑑算Topsinference可支持 TensorFlow、PyTorch、ONNX 等主流模型框架。

崑崙芯（百度系）：崑崙芯成立於2011年，前身為百度智能芯片及架構部，於2021年4月完成獨立融資。公司團隊成員多數成員來自百度、高通、Marvell、Tesla等行業頭部公司，22年完成A輪融資。

百度基於自研XPU架構，致力打造通用AI芯片，賦能互聯網、工業製造、智慧金融、智慧交通等多個領域。百度從2011年開始就基於FPGA實現AI加速公司於2018年正式開始AI芯片研發並在2020年實現崑崙芯1代芯片大規模部署，2021年8月崑崙芯2代產品實現量產。崑崙芯採用自研的面向通用AI的XPU架構，其第二代崑崙芯產品採用7nm製程，相比1代產品性能提升2-3倍，FP16算力達到128TFLOPS，主要為數據中心高性能計算提供算力支持。同時，崑崙芯深度適配PaddlePaddle（飛槳），也支持 PyTorch、TensorFlow、ONNX等主流的深度學習框架。

平頭哥（阿里系）：平頭哥成立於2018年，由阿里全資收購的中天微與達摩院芯片研發團隊合併而來，公司技術團隊由原中天微、高通、AMD、華為海思等擁有豐富研發經驗的人員構成。

作為擁有國內公有云市場最大份額的企業，阿里自研AI芯片投入最多、決心極大，致力於雲端一體化芯片和AIoT芯片產品。公司有兩條研發主線，分別聚焦於雲計算和嵌入式兩類芯片：

Ø 利用ARM的IP為阿里雲數據中心研發芯片，在雲端提供普惠算力，即倚天系列和含光系列；

Ø 基於RISC-V處理器架構進行研發，如玄鐵系列，主要應用是在AIoT領域。

含光800專用於雲端視覺處理。2019年平頭哥在雲棲大會上發佈AI推理芯片含光800，為TSMC12nm工藝製程，採用平頭哥自研架構和達摩院算法，算力相當於10個GPU，性能峰值算力達820 TOPS。含光800 AI芯片專用於雲端視覺處理，可在視覺圖像識別/分類/搜索、醫療影像、城市監控等領域發揮作用。爲了實現軟硬件協同，平頭哥提供了HGAI軟件開發包，可支持主流開源框架 TensorFlow、Caffe、MXNet 和ONNX，廣泛適用於語音、圖片、視頻等AI推理業務。

雖然BAT均已佈局AI芯片，但具體路徑也各有特色。百度選擇了拆分芯片業務，阿里的雲端高性能芯片自用，RISC-V芯片開源開放，騰訊主要以投資的方式，用盡可能少的投入撬動自研芯片。除AI芯片本身的硬件之外，與之配套的軟件開發體系亦是生態的重要組成部分，包括底層硬件、指令集架構、編譯器、API、基礎庫、頂層算法框架和模型等。由於全球主流深度學習框架均使用CUDA平臺，因此國內AI芯片廠商在生態構建的初期均需兼容CUDA，但是長期國產AI芯片廠商仍需構築自身軟硬件生態。

注：本文來自國泰君安發佈的《中國AI芯片企業的追擊（深度）》，報告分析師：李沐華、齊佳宏

本訂閲號不是國泰君安證券研究報告發布平臺。本訂閲號所載內容均來自於國泰君安證券研究所已正式發佈的研究報告，如需瞭解詳細的證券研究信息，請具體參見國泰君安證券研究所發佈的完整報告。本訂閲號推送的信息僅限完整報告發布當日有效，發佈日后推送的信息受限於相關因素的更新而不再準確或者失效的，本訂閲號不承擔更新推送信息或另行通知義務，后續更新信息以國泰君安證券研究所正式發佈的研究報告爲準。

本訂閲號所載內容僅面向國泰君安證券研究服務簽約客户。因本資料暫時無法設置訪問限制，根據《證券期貨投資者適當性管理辦法》的要求，若您並非國泰君安證券研究服務簽約客户，為控制投資風險，還請取消關注，請勿訂閲、接收或使用本訂閲號中的任何信息。如有不便，敬請諒解。

市場有風險，投資需謹慎。在任何情況下，本訂閲號中信息或所表述的意見均不構成對任何人的投資建議。在決定投資前，如有需要，投資者務必向專業人士諮詢並謹慎決策。國泰君安證券及本訂閲號運營團隊不對任何人因使用本訂閲號所載任何內容所引致的任何損失負任何責任。

本訂閲號所載內容版權僅為國泰君安證券所有。任何機構和個人未經書面許可不得以任何形式翻版、複製、轉載、刊登、發表、篡改或者引用，如因侵權行為給國泰君安證券研究所造成任何直接或間接的損失，國泰君安證券研究所保留追究一切法律責任的權利。

中國AI芯片企業的追擊

1、 AIGC拉動AI算力需求，AI芯片將成為未來科技石油

2、國內AI芯片企業蓬勃發展

推薦文章

一周財經日曆 | 特朗普對等關税將於8月7日生效；Palantir、超微電腦等財報來襲

8月金股搶先睇！港股能否繼續抽升？哪些賽道值得關注

英諾賽科午前飆升逾31% 英偉達最新800V架構供應商名單曝光公司為中國唯一入選芯片企業

亞馬遜Q2業績會實錄：市場對AWS服務需求超過亞馬遜現有容量

特朗普官宣「對等關税」：各國税率10%至41%不等 加拿大上調至35%

盤后大跌6%！亞馬遜交出優秀財報 但云業務仍遜色於微軟谷歌

蘋果第三財季營收940.36億美元 淨利潤同比增長9%

外盤頭條：白宮稱特朗普將在午夜前設定新關税 蘋果季度營收遠超預期 Pimco青睞短至中期歐洲債券

特朗普官宣「對等關税」：各國税率10%至41%不等加拿大上調至35%

盤后大跌6%！亞馬遜交出優秀財報但云業務仍遜色於微軟谷歌

蘋果第三財季營收940.36億美元淨利潤同比增長9%

外盤頭條：白宮稱特朗普將在午夜前設定新關税蘋果季度營收遠超預期 Pimco青睞短至中期歐洲債券