熱門資訊> 正文
2023-03-08 01:02
去年年底,AMD 顯卡部門的高級副總裁 David Wang 在接受日本媒體採訪時談到了遊戲顯卡的 AI 問題。David Wang 表示,英偉達在遊戲顯卡上積極嘗試使用 AI 技術,包括在 GPU 上就使用了大型 AI 推理加速器,但 AMD 有不同的策略:
「AMD 專注於將 GPU 用於用户需要和關心的地方,以便享受遊戲顯卡體驗,否則用户可能不得不為他們永遠用不到的 GPU 功能付費,AMD 相信遊戲卡中的 AI 可以而且應該用於讓視頻遊戲更高級、更有趣。」
PC 遊戲玩家杜白告訴雷科技,他也認可 David Wang 的説法,「像我這種買回來可能用到報廢或者出二手都不會用一次 AI 單元,老黃(英偉達 CEO 黃仁勛)增加了這部分的東西就確實是浪費,單純為提高售價加進來。」
當然,AMD 也並非全盤否定遊戲顯卡上 AI 加速能力的價值,問題在於他們認為英偉達把過多的 GPU 資源給了 AI 加速單元,而這部分成本最終還是要由玩家支付,AMD 更希望讓遊戲卡上的 AI 能直接給遊戲帶來好處。
英偉達顯然不這麼看。過去一段時間,ChatGPT 的大火讓 AI 行業的發展推向了一個新的高潮,而生成式 AI 恰恰需要基於海量的數據進行推理訓練,高算力的 GPU 加速卡自然也成了市場的搶手貨。
根據 Fierce Electronics 報道,ChatGPT 目前需要用 25000 塊英偉達 A100 GPU 芯片來維持訓練。大量公司同樣需要基於英偉達的 CUDA 平臺進行對 AI 的訓練和推理,也包括各類的應用。即便是在消費市場,也有不少人爲了生成式 AI 應用而購買顯卡。
而在遊戲卡的 AI 問題背后,也體現了兩家公司遊戲業務(遊戲卡)和數據中心業務(加速卡)的地位變化。
圖/AMD
根據財報顯示,2022 年 AMD 的遊戲業務收入同比增長了 21%,至 68.05 億美元,反超客户端業務成為 AMD 的第一大業務;相較之下,2022 年(2023 財年)英偉達的遊戲業務收入同比減少了近 34 億美元,下跌 27.2%至 90.67 億美元,被數據中心業務反超,降至第二大業務。
事實上,英偉達和 AMD 在面對 AI 問題上還有更大的不同。
去年 8 月底,英偉達和 AMD 旗下的部分 GPU 產品均被美國政府限制對華出售,包括用於數據中心深度學習等場景的英偉達的 A100、H100 以及 AMD 的 MI250。
根據 New Street Research 數據,英偉達佔據了可用於機器學習的圖形處理器市場的 95%。其中英偉達 A100 是當前最主流的 AI 芯片之一,不僅被海外和國內公司廣泛採用,也適合支持當下流行的 ChatGPT、Bing AI 或 Stable Diffusion 等工具的機器學習模型,能夠高效地用來訓練和使用神經網絡模型。
最近流行的 Stable Diffusion 社區,圖/Civitai
包括谷歌、OpenAI、特斯拉和 Facebook 等領先的 AI 公司都採用了大量的 A100 以及其他英偉達 GPU,用於 AI 的訓練和推理。在國內也有大量公司依賴於英偉達的高端通用 GPU,包括阿里、騰訊、百度等雲廠商和浪潮、聯想、新華三等服務器廠商都是英偉達的重點客户。
而英偉達在去年發佈的 H100,作為 A100 在 AI 行業的替代者,採用了臺積電 4nm 工藝,擁有 800 億個晶體管,支持每秒近 5TB 的外部互聯帶寬,對於大型 Transformer 模型的訓練,英偉達聲稱 H100 將提供 9 倍於 A100 的性能,過去需要數周時間才能完成的訓練可以減少到幾天內。
圖/英偉達
相比之下,AMD 依然更側重於面向數據中心的 CPU 以及 APU。在 MI250 之后,1 月的 CES 消費電子展上,AMD CEO 蘇姿豐正式發佈了全球首款面向下一代數據中心的 APU——Instinct MI300。
圖/AMD
MI300 APU 芯片集成了 CPU 和 GPU,晶體管數量達到了驚人的 1460 億個,還包含 128GB 顯存 ,主要用於 AI 加速計算。AMD 表示,MI300 可以提供 8 倍於 MI250X 的 AI 訓練性能,該芯片可以將推理建模過程的時間從幾個月縮短至幾周,預計下半年上市。
這種產品傾向上的選擇,很大程度上早就做了決定。去年 AMD 主管數據中心業務的副總裁 Forrest Norrod 就指出,英偉達構建了一個豐富的軟件生態系統,出色的 AI 加速卡也幾乎覆蓋了每個市場的需求,AMD 不可能複製英偉達的成功之道。
英偉達首席科學家戴維·柯克(David Kirk)很早就有一個野心——將主要服務於「遊戲」、只做 3D 繪圖渲染的 GPU 算力「通用化」,使之轉變為通用算力中心。
於是在 2007 年,英偉達正式推出了革命性的 GPU 統一計算平臺 CUDA,同時開始基於 CUDA 持續積累算法和軟件生態。但英偉達和 CUDA 的成功,還要等到深度學習算法流行之后。
過去 AI 行業普遍依賴 CPU 進行訓練識別,谷歌大腦項目創始人、前斯坦福人工智能實驗室主任吳恩達在 2010 年曾經爲了讓 AI 識別出「貓」,就使用了 16000 塊 CPU。但在深度學習算法普及之后,AI 需要大量的重複計算,GPU 則因為強大的並行計算能力順勢脫穎而出。而在當時能夠高效滿足 AI 訓練的有且僅有英偉達的 GPU。
到 2011 年谷歌大腦率先將 GPU 應用於深度學習的時候就發現,12 顆英偉達 GPU 提供約等於 2000 塊 CPU 的深度學習性能。乘上 AI 和深度學習的大潮,英偉達幾乎以一己之力承包了前期企業客户的 AI 計算需求,也正是開始建立屬於 CUDA 和英偉達的生態護城河。
自動駕駛公司文遠知行技術總監鍾華在一次採訪回憶稱,英偉達推出了 CUDA 以后,相當於把複雜到燒腦的顯卡編程包裝成了一個簡單的接口,造福了廣大程序員,現在主流的深度學習框架基本都是基於 CUDA 進行 GPU 並行加速。
A100 線上「廚房」發佈會,圖/英偉達
即便在面向 AI 的專用芯片流行之后,英偉達 GPU 依然佔據 AI 芯片市場的絕對領導地位,不管是 2017 年推出的 V100、2020 年推出的 A100 以及去年推出的 H100,都在進一步完善軟件生態和算法積累,時至今日 CUDA 生態已經擁有近 250 萬開發者,建立了難以逾越的生態壁壘。
相比蘇媽(AMD CEO 蘇姿豐)當時還在「收復失地」,老黃至少從七年前就開始為 AI 搖旗吶喊,2016 年英偉達主辦的 GTC China 大會上,他就説道:「我們不再是一個半導體公司,而是一個 AI Computing Company(AI 計算公司)。」
此后多年,黃仁勛在不同場合都在對外強調這一點。
2021 年 8 月,美國半導體工業協會(SIA)宣佈,英偉達 CEO 黃任勛將獲得芯片行業的最高榮譽——羅伯特 · 諾伊斯獎,SIA 總裁兼 CEO John Neuffer 在聲明中説道:
「黃(仁勛)具有遠見卓識和極強的執行力,他促進了芯片行業的發展,顛覆了計算,推動了人工智能。從遊戲到科學計算,再到自動駕駛,黃仁勛的成就與無數創新密切相關,他改變了行業和世界。」
今天英偉達已經在面向 AI 的通用 GPU 領域建立了絕對的領導地位,AMD 即便在產品上能有一定的優勢,在中短期內都很難彌補生態上的巨大差距。
但毫無疑問的是,AMD 不可能放棄數據中心業務和 AI 加速能力,即便是繞過這個領域深耕遊戲芯片市場,終究也會因為在 AI 領域的落后在資金、技術等方面受制於人,反過來又會牽制遊戲業務的發展。
AMD 也明白這一點,所以並沒有逃避競爭,也沒有選擇正面的硬碰硬,而是基於自身的 CPU 優勢,選擇在 APU 上重點發力,與英偉達的拳頭產品 A100/H100 形成差異化競爭。對全球第一大 FPGA 廠商賽靈思的收購,一方面也補足 AMD 的 AI 開發和應用生態,獲得在 AI 芯片上挑戰英偉達的另一種可能。
同時 AMD 也更願意跟大型數據中心的擁有者——雲服務供應商合作,一方面更容易繞開生態上的壁壘,另一方面按照 AMD 的説法,雲廠商的計算需求更加簡單,加速卡的購買量也足夠高。實際上,過去兩年超大型數據中心對 AI 芯片的需求不僅沒有放緩,反而在加速擴張。
説到底,AI 芯片的競爭還是處在一片正在快速擴張的藍海之中,隨着 AI 應用越來越深入我們的生活,更加難以想象 AI 芯片市場的規模極限,其中留給 AMD 和英偉達的空間自然也足夠大。英偉達儘管通過長期積累建立了強大的優勢,但還有足夠的市場需求等待 AMD 滿足,這也是后者的機會所在。
就像 AMD 高管 Forrest Norrod 所説,AMD 不可能複製英偉達的成功之道,但 AMD 仍然可以走出自己的路線。
本文來自微信公眾號「雷科技」(ID:leitech),作者:雷科技互聯網組
風險提示: 投資涉及風險,證券價格可升亦可跌,更可變得毫無價值。投資未必一定能夠賺取利潤,反而可能會招致損失。過往業績並不代表將來的表現。在作出任何投資決定之前,投資者須評估本身的財政狀況、投資目標、經驗、承受風險的能力及瞭解有關產品之性質及風險。個別投資產品的性質及風險詳情,請細閲相關銷售文件,以瞭解更多資料。倘有任何疑問,應徵詢獨立的專業意見。