熱門資訊> 正文
2023-09-06 04:15
國產芯片的「算力之困」,確實撕開了一道口子。
當下的AI賽場上,英偉達無疑是最閃耀的一顆明星。
十多年來,英偉達在生產能夠執行復雜AI任務(如圖像、面 部和語音識別)的芯片方面,建立了幾乎無法撼動的領先地位。
然而,凡事總有變化。
近期,隨着谷歌、IBM等巨頭開始在芯片方面一齊發力,GPU領域的競爭格局,開始有了些微妙的改變。
最近,IBM推出一款全新的14nm模擬AI芯片,效率達到了最領先GPU的14倍。
其最大的亮點,就是藉助神經網絡在生物大腦中運行的關鍵特徵,來減少能耗。從而最大限度地減少人們在計算上花費的時間和精力。
同樣的,身為科技巨頭的谷歌,也在8月底的GoogleCloudNext2023大會上,發佈了一款全新AI芯片CloudTPUv5e,專為大模型訓練推理所設計。
具體來説,CloudTPUv5e允許多達256個芯片互連,聚合帶寬超過400Tb/s和100petaOps的INT8性能。
根據速度基準測試,在CloudTPUv5e上訓練和運行人工智能模型的速度提高了5倍。
由此可見,各大巨頭其實並不甘於在算力問題上永遠被 英偉達「卡脖子」,並開始紛紛推出了各自的芯片,對英偉達的GPU霸權地位發起了「圍攻」。
那麼,在英偉達深不見底的護城河面前,這樣的挑戰前景究竟如何?
英偉達的江山還能坐多久?
從某種程度上説,決定這件事的,不僅僅是英偉達本身的創新能力,還有科技發展固有的定律。
作為計算機行業的黃金定律,摩爾定律一直指導着芯片開發。
但是隨着芯片工藝升級速度的放緩,圍繞在這一定律身上的爭議也在不斷擴大。
所謂摩爾定律,指的是集成電路上可以容納的晶體管數目在大約每經過18個月到24個月便會增加一倍。
然而,隨着芯片技術的不斷發展,摩爾定律正逐漸遭遇瓶頸。
CIC灼識諮詢曾披露,受制於芯片尺寸的物理極限、光刻技術、隧道效應、功耗和散熱、供電能力等問題,從5nm到3nm再到2nm,其間隔都超過了2年時間。
面對這種情況,即使是以「刀法精湛」著稱的黃仁勛,也不得不無奈地宣佈「摩 爾定律已死」,漲價身不由己!
其在去年發佈的 AD102(RTX4090) 芯片,尺寸為 608mm,這僅比 628mm 的 GA102(RTX3090Ti)略小。
按照這樣的技術路徑,傳統GPU的天花板,似乎已經越來越近。
也正因如此,各路巨頭在解決算力之困的同時,也在積極地「另闢蹊徑」,找到一條有別於傳統路線的破局之策。
前面提到的IBM模仿人腦神經結構的類腦芯片,就是這樣的嘗試之一。
然而,在面對傳統芯片瓶頸方面,業界存在着很多種不同的方案,比如量子芯片、光子芯片、類腦芯片,但如同當年GPU取代CPU,成為今天AI計算的主力一樣,在多種技術路徑的博弈中,最終往往會有一個「最優」的路徑勝出,成為新時代通用的芯片範式。
而這樣的「最優」路徑,則理應是一種在技術成熟度、通用性和市場需求等方面,都做到了較好兼顧的一種方案。
就目前的情況來看,量子芯片、光子芯片、類腦芯片等都還處於研發階段,其技術成熟度還有待實踐的檢驗。
此外,量子芯片、光子芯片、類腦芯片等都是針對特定的計算問題而設計的,其在通用性、兼容性上,往往還存在着一定的不足,
例如量子芯片適合解決一些經典計算機難以解決的重要問題。光子芯片適合解決一些高速數據處理和傳輸的問題,如光通信、光互連、光計算等。
而綜合比較下來,目前最有可能勝出的方案,則是多種芯片模塊組合的超異構計算。
什麼是超異構計算?
簡單來説,就像是一個拼圖遊戲,把不同的芯片模塊(如CPU、GPU、FPGA等)按照不同的規則和目標來拼接,形成不同的計算方案。從而處理不同類型的數據和工作負載的技術。
超異構計算的目的是實現計算的最優化,即在性能、功耗、延迟等方面達到最佳的平衡。
在CPU同構計算階段,100%工作由CPU完成;
但在GPU異構階段,80%工作由GPU完成,CPU只完成剩余的20%的工作;
而在超異構計算階段,則80%的工作由各類更高效的DSA完成,GPU只完成剩余20%工作的80%,即16%的工作,剩余的4%交給CPU。
這里的DSA,是一種針對特定領域和場景的計算單元,可以實現高效的數據處理和算法加速。例如神經網絡處理器(NPU)、圖形處理器(GPU)、數字信號處理器(DSP)、視覺處理器(VPU)、安全處理器(SPU)等。
這些「術業有專攻」的特定芯片可以比傳統的GPU更快、更省電、更小巧、更靈活。
但同時,由於高度特化的DSA不太適合做其他方面的工作。所以,還需要用到一些GPU和CPU來輔助和協調這些芯片,完成剩下的一些計算工作。
這樣,在「專人專職」的分工搭配下,芯片就可以實現計算的最優化,即在性能、功耗、延迟等方面達到最佳的平衡。
在面對AI大模型、自動駕駛、元宇宙等新興的領域和應用場景時,AI要做的事情越來越多,越來越難,而傳統的同構芯片已經跟不上AI的步伐,難以給AI提供足夠的算力和速度。
而超異構計算可以提供更高的靈活性和可擴展性,能夠根據不同的數據和工作負載,動態地分配和調度計算資源,實現計算的自適應和智能。
具體來説,超異構計算可以分為兩種模式:靜態超異構計算和動態超異構計算。
靜態超異構計算,是指在設計階段就確定好各個處理器之間的分工和協作方式,適用於一些穩定且可預測的場景,如視頻編解碼、圖像處理等;
動態超異構計算是指在運行時根據實時數據和工作負載來動態地選擇和調度最合適的處理器,適用於一些更具變化的場景,如雲計算、邊緣計算、物聯網等;
通過這類「動靜結合」的方式,超異構計算就能靈活調整負載,實現高效地算力調度。
除此之外,從成本上説,超異構計算同樣是一種有效降低大算力芯片成本的方案。
隨着傳統GPU芯片尺寸的不斷縮小,人們就需要更多的研發投入和更精密的製造設備,這就導致了成本的上升。
知名半導體研究機構Semiengingeering統計了不同工藝下芯片所需費用,其中7nm節點需要的費用已經達到了2.97億美元;
但超異構計算,卻憑藉多種芯片間靈活的分工、協作,巧妙地解決了這一難題。
用一個形象的比喻來説,傳統GPU芯片就像是一輛跑車,要想讓它跑得更快,就需要不斷地改進發動機、輪胎、剎車等部件,因而製造成本會成倍上升。
而超異構計算就像是一輛多功能汽車,它可以根據不同的路況和需求,切換不同的驅動模式,如越野、運輸、載客等,如此一來,就不用一味地改進發動機(縮小芯片尺寸)來提高性能了。
正是由於這樣的優勢,超異構計算不僅突破了傳統GPU的瓶頸,並且也對了國產大算力芯片提供了「彎道超車」的歷史時機。
就目前來看,在超異構計算的賽道上,英偉達等巨頭的佈局也非 常積極和全面,推出了Hopper超級芯片,與GraceCPU和BluefieldDPU集成,構成一個完整的超異構系統。
但國內廠商也同樣開始在這一方向進行了發力,如華為推出了鯤鵬920處理器,這是一款基於ARM架構的高性能CPU,可以與華為自研的昇騰 AI 芯片和崑崙 AI 芯片實現異構協同,支持雲、邊、端等多種場景。
還有一些國內廠商也在研發自己的超異構芯片,例如紫光展鋭推出了虎賁 T7520處理器,這是一款集成了CPU、GPU、NPU、ISP等多種計算單元的超異構芯片,專為5G終端而設計。
從總體來説,超異構計算是否會給國內芯片廠商提供彎道超車的機會,主要取決於以下幾個因素:
·國內芯片廠商在不同類型的計算單元上的技術水平和競爭力,例如CPU、GPU、DPU、FPGA等,以及它們之間的協同和優化能力。
·國內芯片廠商在高速互連和先進封裝方面的創新能力和成本控制能力,例如 2.5D和3D堆疊技術,以及對不同工藝節點和架構的兼容性和可擴展性。
·國內芯片廠商在統一軟件平臺方面的開發能力和生態建設能力,例如支持多種異構設備的編程框架和管理平臺,對不同場景和應用的適配能力。
在這三個方面,目前的國內企業雖然有一定的探索和進展,但總體而言,仍面臨不小的挑戰。
例如,不同類型的計算單元上的技術水平上,國內仍存在着一定的短板,例如華為的鯤鵬920處理器雖然在性能上有所提升,但是在兼容性和生態方面還有不足。
在高速互連和先進封裝方面,對於2.5D和3D堆疊等關鍵技術,目前國內芯片廠商還沒有完全掌握,並且還依賴於國外供應商。
而目前國內廠商目前突破最大,也最具潛力的方向,是軟件平臺的開發能力上。
因為,超異構計算的硬件多樣性和複雜性,給開發者帶來了很大的挑戰。
如果有一個統一的軟件平臺,可以屏蔽底層的細節,提供高效的編譯、調度、優化等功能,那麼就可以大大降低開發者的負擔,提高超異構計算的可用性和普及性。
現階段,阿里雲的異構計算產品家族,包括GPU雲服務器、FPGA雲服務器和彈性加速計算實例 EAIS 等,提供了一系列的異構計算服務和解決方案。
而華為的Atlas異構計算平臺,基於自研的昇騰AI處理器,也提供了從芯片到雲服務的全棧異構計算解決方案。
綜合以上各種因素,以及英偉達自身的研發能力這一「動態變量」進行考慮,未來芯片市場的競爭格局,大致會呈現如下態勢:
國內芯片廠商未來5年在超異構計算上的競爭水平,會有一定程度的提升和突破,解決部分算力「卡脖子」問題,但是還無法完全擺脫對英偉達等國外巨頭的依賴。
在一些特定的場景和應用上,國內芯片廠商可以與英偉達 等巨頭形成有效的競爭,例如在5G、物聯網、邊緣計算等領域,國內芯片廠商可能會推出更適合本地化需求和環境的超異構計算解決方案。
可以説,超異構計算,確實為國產芯片的「算力之困」撕開了一道口子,但從長遠來看,要想完全解決「卡脖子」問題,並與英偉達等巨頭形成對等競爭,仍是一個任重道遠的過程。
風險提示: 投資涉及風險,證券價格可升亦可跌,更可變得毫無價值。投資未必一定能夠賺取利潤,反而可能會招致損失。過往業績並不代表將來的表現。在作出任何投資決定之前,投資者須評估本身的財政狀況、投資目標、經驗、承受風險的能力及瞭解有關產品之性質及風險。個別投資產品的性質及風險詳情,請細閲相關銷售文件,以瞭解更多資料。倘有任何疑問,應徵詢獨立的專業意見。