繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

AI「芯」突圍:英特爾Gaudi 3硬剛英偉達搶市場,國產芯片細分賽道謀變

2024-04-15 09:18

國外芯片廠商「狂卷」,國內尋破局。

2024年,AI「芯事」迎來新節點。

近日,英特爾發佈了新一代AI加速器Gaudi 3。英特爾聲稱,新款Gaudi 3芯片與英偉達H100芯片相比,推理能力平均提高50%,能效平均提高40%,運行人工智能模型的速度是H100的1.5倍。

據Intel Gaudi 3白皮書信息顯示,這款產品將與英偉達最新的H200大致相當,在某些領域甚至表現更好。

除了芯片本身的「較勁」,英特爾還計劃主動開放生態,試圖打破英偉達的高牆。此前,英特爾高管接受採訪時曾表示,英特爾「開放」的人工智能堆棧是與競爭對手英偉達的一大區別。

在Gaudi 3發佈的幾天后,市場就有消息傳出,英特爾的Gaudi 3已經準備好了提供給中國市場的版本,將於6月份推出。時代周報就此消息向英特爾覈實,不過英特爾方面沒有具體迴應。

相比國外芯片廠商「狂卷」,國內芯片廠商也正積極破局。

時代周報記者近日從CITE 2024((第十二屆中國電子信息博覽會)瞭解到,目前我國芯片供應仍然相對緊張。雖然國內已有企業推出智能算力芯片,在電商智能搜索、智慧工業、智能駕駛等部分推理場景已開展應用落地,在大模型訓練應用尚處起步階段。國內智能算力芯片綜合性能較英偉達產品存在一定差距,但個別產品在自然語言、圖像處理等算法上能力較強。

英特爾以「開放」突圍

英特爾自2019年以來一直在製造Gaudi系列芯片,不過步伐始終比英偉達慢了兩年。

2019年7月,英特爾推出的Gaudi 1加速器,在彼時規模還很小的AI市場中,對標英偉達2017年推出的Volta V100。隨后,英特爾花20億美金收購Habana Labs,並於2022年5月發佈Gaudi 2。Gaudi 2採用7nm製程打造,英特爾宣稱其工作負載量幾乎是英偉達A100 80GB處理器的2倍,而A100 是英偉達在2020年發佈的一款GPU平臺。

英特爾近日推出的新一代Gaudi 3則採用了臺積電(TSM.US)5nm工藝,對比上一代帶來了4倍的BF16 AI計算能力提升,以及1.5倍的內存帶寬提升。

據英特爾介紹,Gaudi 3對比H100推理能力平均提高50%,能效平均提高40%,運行人工智能模型的速度是H100的1.5倍。英特爾表示,這款產品將與英偉達最新的H200大致相當,在某些領域甚至表現更好。

儘管英特爾未透露Gaudi 3的定價信息,但相對於H100,英特爾表示Gaudi 3將提供更「有吸引力的價格」。該產品將於2024年第二季度面向OEM廠商出貨。

英特爾此舉被視為為搶佔AI芯片市場份額而硬剛英偉達,因為英偉達剛一個月前宣佈了GPU新核彈B200和超級芯片GB200。

但大家似乎只看到英特爾在參數上的「野心」,而忽略了藏於背后的開放策略。

當天和Gaudi 3同時發佈的,還有英特爾面向開放的、可擴展的AI系統的戰略,以及聯合Anyscale、Articul8、DataStax等多家企業宣佈創建的開放平臺。即使是Gaudi 3,英特爾也強調其「開放性」,Gaudi 3提供開放的、基於社區的軟件和行業標準以太網網絡,允許企業靈活地從單個節點擴展到擁有數千個節點的集羣、超級集羣和超大集羣,支持大規模的推理、微調和訓練。

過去十幾年,基於x86架構的處理器在數據中心是絕對王者,而英特爾對X86架構有着絕對的控制。這種專有的處理器架構,最初由英特爾開發,用於早期的個人電腦(PC)。由於英特爾在PC市場的主導地位,X86架構成爲了事實上的標準。英特爾一直保持對X86架構的控制,並且通過授權給其他公司生產和銷售X86處理器來確保其生態系統的穩定和盈利。

近年來,隨着市場發展和與其他處理器架構(如ARM、RISC-V)競爭加劇,英特爾已經開始採取更加開放和合作的策略。

從AI市場來看,目前英偉達在芯片市場佔據着絕對優勢,英特爾希望用產品撬走份額並不容易。富國銀行統計顯示,目前英偉達在數據中心AI市場擁有98%的市場份額,而AMD公司的市場份額僅有1.2%,英特爾則只有不到1%。而美國銀行預計,未來Gaudi 3可能也僅將佔據不到1%的AI加速器市場份額。

今年3月,英特爾全球渠道主管Trevor Vickers在接受CRN的獨家採訪時,談到英特爾「開放」的人工智能堆棧是與競爭對手英偉達的一大區別,這也是讓英特爾的CPU在快速增長的推理領域獲得發展的機會。

「對我們來説,關鍵在於我們如何創建這些生態系統,使它們具有韌性、安全性、高性能並且是開放的,這是我們與合作伙伴能提供的非常重要的部分。」Trevor Vickers表示,英特爾希望擁有一個開放的AI堆棧,希望在將產品推向市場時秉持「一次編寫,隨處交付」的精神。

這種「一次編寫,隨處交付」指的是英特爾的oneAPI開放標準,該標準允許開發人員對不同類型的處理器使用單一的編程模型,無論是英特爾CPU、還是由英特爾或競爭對手製造的GPU,都與英偉達產品的專有性形成鮮明對比,目前英偉達的CUDA平臺僅支持Nvidia設計的處理器。

或推出中國特供版?

英特爾與英偉達的在AI領域的博弈正深入腹地,中國則是其AI芯片應用的「主戰場」之一。

在英特爾發佈Gaudi3幾天后,市場上就流傳出消息稱英特爾或於今年下半年推出兩款專供中國市場的Gaudi 3 AI加速器芯片,只不過性能將大打折扣。時代周報記者就此向英特爾方面詢問,但截至發稿並未得到具體迴應。

去年7月,英特爾就發佈了面向中國市場的Gaudi2。相比國際版Gaudi2,面向中國市場推出的加速卡在性能上差別不大,而集成以太網RDMA端口數量從24個端口減到21個,以符合美國芯片出口管制規定。

無獨有偶,去年10月,英偉達也推出了三款基於其AI芯片H100的「降級版」芯片:H20、L20和L2,並計劃在今年二季度量產。但據參考消息網,由於「中國特供版」AI芯片樣品算力不足,相關公司已暗示英偉達,今年訂購的英偉達芯片數量將遠少於原計劃。

近日,時代周報記者在CITE 2024上走訪,從部分芯片代理商口中得知,目前他們手上銷量較好的產品是英特爾和AMD的CPU,英偉達的產品只能賣中國特供版本。

「不過,也有不少人之前囤了很多H100芯片再轉手賣,價格會相對貴一點。」一位代理商表示。

時代周報記者從超算行業相關人士瞭解到,有不少人手頭囤積幾十到上百片H100現貨,以尋求在流通中獲得價差。根據一位經銷商報價,目前100多片H100芯片的大概價格在280多萬美元左右。

中國信息通信研究院南方分院院長助理張昊在CITE 2024上表示,目前我國智能算力全球佔比超30%,主要依賴美國英偉達GPU芯片,國產自主算力份額僅為5%,國內TensorfiowPyTorch、Caffe等美國AI框架使用率超過90%。

不過,張昊同時提到,當前國內已有企業推出智能算力芯片,在電商智能搜索、智慧工業、智能駕駛等部分推理場景已開展應用落地,在大模型訓練應用尚處起步階段。國內智能算力芯片綜合性能較英偉達產品存在一定差距,但個別產品在自然語言、圖像處理等算法上能力較強。

從性能來看,國產GPU在訓練方面的性能是英偉達A100的50%,和英偉達H100存在兩代以上差距;推理方面,與英偉達A10、T4性能接近,具備替代潛力。

從應用上來看,目前國內如昇騰、寒武紀、天數智芯主流芯片廠商已完成對主流大模型的適配。

「國產芯片加速與國內外大模型適配,具備10億參數大模型預訓練+微調,百億參數大模型推理的能力。隨着大模型種類收斂,以及大模型推理部署普及,國產GPU芯片組建的算力整機和集羣有望在大模型調優、推理應用方面尋求市場開拓機遇。」張昊表示。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。