熱門資訊> 正文
2023-05-14 11:05
財聯社5月14日訊(編輯 俞琪)隨着ChatGPT、百度文心一言等一系列大模型密集上線,AI大模型當下已經遍地開花。本周四,谷歌發佈AI語言模型PaLM 2與OpenAI旗下GPT-4等系統展開競爭,國內雲從科技、引力傳媒等多家A股上市公司亦宣佈AI大模型產品最新進展。在「AI百模大戰」背后,隨之帶動的算力需求開始呈「爆炸式」增長,一場「算力儲備戰」已暗潮洶涌,全球算力市場持續火熱。
據悉,AI由數據、算法(即模型)和算力驅動,其中任意一方的發展會推動其他方面需求的增長。有分析認為,當下行業內雖然擁有更多的數據以及做了更多的AI模型研究,但算力的擴展速度卻沒有跟上。今年4月,OpenAI就因需求量過大而停止了ChatGPT Plus的銷售。對此,東方證券研報認為,主要系計算資源供不應求。
根據數據預測,AI時代算力的增長已遠遠超過了摩爾定律每18個月翻番的速率,預計到2030年全球超算算力將達到0.2ZFLOPS,平均年增速超過34%。華為更是預測,未來10年人工智能算力需求將會增長500倍以上。那麼,身處「智能革命」起點的當下,什麼纔是AI算力的最優解?國內「算力軍備競賽」又走到哪一步了?
▌短期堆起的GPU競爭高地:以量取勝築起大模型算力門檻 低配版英偉達GPU國內炒至10萬元
衆所周知,芯片能力直接影響着高算力訓練效果和速度,相較於基於CPU芯片的通用算力,AI所需的智能算力則主要基於GPU、GPGPU及AISC等AI芯片所提供算力,用於人工智能的訓練和推理。其中,GPU是一種專門用於處理圖形、視頻、遊戲等高性能計算的硬件設備,憑藉相較於其他硬件在算力方面的較大優勢脫穎而出,同時隨着英偉達A100、H100等型號產品的發佈,前款產品在AI推理時吞吐量是CPU的249倍。GPU已成為當前AI算力的核心硬件。
中金公司研報表示,多GPU互聯能力加強可以提高並行計算能力,因而算力提升對GPU數量的要求日益提高。隨着單GPU的計算能力越來越難以應對深度學習對算力的需求,英偉達已經開始用多個GPU去解決問題。對此,業內分析認為,高端GPU的數量基本決定了一個廠商能夠練多大的模型,后期將成為業內判斷企業大模型能力的重要指標。
據TrendForce數據顯示,如果以英偉達 A100 顯卡的處理能力計算,GPT-3.5大模型需要2萬塊GPU來處理訓練數據。亦有業內公認看法,做好AI大模型的算力門檻是1萬枚A100芯片。
目前,全球GPU市場主要由英偉達、英特爾和AMD三家巨頭壟斷,去年Q4獨立GPU份額分別為85%、6%、9%。其中,人工智能、雲端計算和獨立GPU主要為英偉達主導,A100和H100最高浮點算力分別實現19.5 TFLOPS 和67 TFLOPS。
相較於此,我國國產GPU尚處萌芽期,與國際廠商差距更大。但隨着高端GPU的出口限令,針對中國市場推出的特供版A800也已漲10萬元的高價,國內GPU市場需求緊迫。在此情形下國產化迫在眉睫,國產GPU廠商近幾年也不斷涌現,目前國內自研GPU的領軍企業主要是寒武紀、景嘉微、華為昇騰等。其中,景嘉微是國內首家成功研製國產GPU芯片並實現大規模工程應用的企業。行業內專家稱,主打產品JH920的性能與英偉達2016年發佈的GTX 1050相仿,在中高端領域及硬核的算力需求仍存在較長的追趕道路。
對於整個算力市場,業內人士認為,目前燒GPU是最為現實的方案,尤其從國內GPU廠商的角度來看,國產GPU高端化薄弱,只有使更多低端的GPU去追趕和堆疊,通過優化和協調來協同作用,再去組合模擬優化的路徑。
▌下場突圍的存算一體:打破「內存牆」極限難題 全球玩家站上同一起跑線
不過,雖然GPU是目前最成熟的AI算力方案,但長時間來看,在算力昂貴和受限的制約下燒GPU並非長久之策。
在馮·諾伊曼結構計算機中計算和存儲分離,存和算之間性能失配常常導致訪存帶寬低、時延長、功耗高等問題,運算效率被大打折扣,即面臨着「內存牆」的制約問題。通俗來看,方正證券在4月30日研報中解釋,雖然CPU/GPU並行加速技術可以提升算力,但隨摩爾定律逼近極限,存儲帶寬制約了計算系統的有效帶寬,系統算力增長步履維艱。
對此,方正證券認為,存算一體作為一種新的計算架構,其核心是將存儲與計算完全融合,以新的高效運算架構進行二維和三維矩陣計算,具有更大算力(1000TOPS以上)、更高能效(超過10-100TOPS/W)、降本增效三大優勢,能有效克服馮·諾依曼架構瓶頸,實現計算能效的數量級提升。業界普遍認為,其為「AI算力的下一極」,繼CPU、GPU之后的算力架構「第三極」。
在存算一體市場中,海外廠商SST,Syntiant、Mythic因佈局較早,走在商業化前列。不過,在新的技術領域比如基於ReRAM存算一體做大算力芯片,各國還處在同一起跑線,國內外眾多企業紛紛開展存算一體技術的研發,包括英特爾、SK海力士、IBM、美光、三星、臺積電、阿里等巨頭,以及九天睿芯、恆爍股份、億鑄科技、千芯科技、蘋芯科技、知存科技、智芯科等眾多新興AI和存儲企業。
▌AI算力「神藥」量子計算:谷歌、阿里等科技巨頭扎堆進入 國內企業或藉此賽道彎道超車
值得注意的是,在當前GPU、下一步存算一體的背后,還有着一位AI算力「神藥」——量子計算。
據悉,量子計算機是基於量子力學原理構建的計算機,性能差距呈指數級增長。中金公司研報表示,相較經典計算機,量子計算機算力發生爆發式增長,形成「量子優越性」。業內分析認為,量子計算有望徹底解決經典計算的算力不足問題。並且,未來量子計算機肯定能夠助力人工智能,隨着AI所需的算力越來越多,2030年算力以及耗電量都可能出現超高數據級增長,因此對於真正解決AI大規模的算力需求,量子計算機是一個很有潛力的應用方向。
根據中金公司研報顯示,谷歌、IBM、微軟、亞馬遜等全球科技巨頭紛紛推出量子云服務平臺。國內阿里、騰訊、百度、華為近年來也先后佈局量子計算,比如百度成立了量子計算研究所;華為推出了「崑崙」量子計算模擬一體機,在摩爾定律漸趨失效下,量子計算為中國提供彎道超車機會。
此外,有市場分析指出,我國量子計算也在展開融資競爭賽。近一年來,國內包括量旋科技、圖靈量子、華翊量子、未磁科技、本源量子在內的9家量子計算企業獲得融資。
不過,安信證券提到,當前量子計算機的發展還面臨着如退相干等問題,導致當前量子計算仍主要存在於實驗室階段,距離商業化較遠。對此,有業內人士坦言,量子計算行業現在還未發生一些根本性的變化進展,中短期與其寄希望於其他方案來解決大模型所遇到的算力問題,不如指望GPU這些經典計算的硬件價格能下來。