熱門資訊> 正文
2024-03-26 10:40
本文來自:深網騰訊新聞;作者: 安然
美國時間3月18日下午1點,加州聖何塞會議中心內星光璀璨,人頭攢動。偌大的場館里擠滿了3萬參會人員。「歡迎來到GTC,我希望你明白這不是一場音樂會,你來到的是開發者大會。」穿着黑色皮夾克的黃仁勛走到舞臺中央説。
現場歡呼陣陣。恍惚間,時空彷彿回到2010年喬布斯發佈iPhone4時萬人空巷的場景。不同的是,這次的主角是英偉達創始人兼CEO黃仁勛。
與喬布斯很早就靠着Mac和iPhone被創業者奉為神明不同,黃仁勛用了20多年才站到全球科技中心,成為新的AIGC時代被行業仰望的燈塔。
誰是助力黃仁勛登頂全球創業者C位背后最大的功臣?
如果我們把視野放在更長的歷史來看,這個功臣,不是馬斯克,不是谷歌或者OpenAI,而是支撐英偉達一路走到今天的全球億萬遊戲人。
中國用户印象深刻的是,2000年開始,電腦組裝業務(俗稱「攢機」)盛極一時,英偉達的GeForce系列顯卡因其出色的遊戲性能脫穎而出,成為組裝市場上的熱門選擇,在遊戲愛好者中享有盛譽。
二十年來,英偉達顯卡從每一位遊戲玩家身上賺走的錢,都被黃仁勛拿走投入新業務研發,化作全球通用人工智能大模型底座的「神經元」。
時間倒退回90年代,沒人會想到這位要給遊戲玩家做顯卡的普通創業者,今天會成為和喬布斯一樣的存在。
1993年,從LSI Logic(一家知名的專用芯片公司)離職的黃仁勛選擇在30歲這一年創業。黃仁勛相信,終有一天,PC會成為享受遊戲的消費級設備,他要在PC上做一流的遊戲顯卡。
對於其黃仁勛的這一決定,英偉達副總裁Rev Lebaredian説,黃仁勛是一個對圖形技術潛力有深刻信念的領導者,有能力看到10年后的投資回報。
但偉大從來不是被計劃的。在波譎雲詭的商業世界,沒人能保證10年之后事情會按照預期發展。回看1993年的芯片格局,選擇在遊戲顯卡領域創業不失為明智之舉。
20世紀末,在個人計算機(PC)時代,芯片競爭主要圍繞CPU展開,英特爾和AMD明里暗里都在爭奪微軟這一大客户,GPU在產業上的優勢和需求還未體現出來。
1993年,遊戲《毀滅戰士》(Doom)的大火讓黃仁勛看到了獨立顯卡的「錢景」。
創業前3年,英偉達推出初代產品NV1和NV2。由於兩者都是基於四邊形而非傳統的三角形渲染技術,導致其與當時主流的三維圖形API(如Direct3D和OpenGL)不兼容,這一度把英偉達逼入破產的邊緣。
黃仁勛經常把「我們公司還有30天就要倒閉了」掛在嘴邊正是此次經歷的后遺症。
此后,黃仁勛孤注一擲,解僱了50多名員工,把公司的命運押注在NV3上,也就是我們熟悉的Riva128顯卡。1998年,Riva128的出貨量就超過voodoo系列顯卡(其背后是圖形處理硬件製造商3dfx Interactive),讓英偉達起死回生。
1999年1月,英偉達在納斯達克上市。7個月后,英偉達發佈其首款被冠以「GPU」(圖形處理器)稱號的產品——GeForce 256。

英偉達之所以能在兩年翻身並迅速上市,原因之一是趕上1997年至1998年的全球遊戲浪潮。現在依然耳熟能詳的遊戲《拳皇97》、《質感掃雷》、《星際爭霸》、《生化危機2》、《天堂》都是那個時期的爆款。
英偉達能起死回生,離不開上億遊戲玩家的青睞。
彼時,看到遊戲這一「錢景」的不止英偉達,還有科技巨頭英特爾和微軟,但黃仁勛贏了。
1998年2月,英特爾發佈了首款獨立顯卡i740。由於其2D效果一般,i740一度成爲了英特爾在獨立顯卡市場的絕唱。直至2022年Intel Arc(鋭炫)系列的推出,英特爾才重回獨立顯卡市場。
與英特爾想從獨立顯卡分到遊戲的一杯羹不同,微軟更為徹底,直接進入遊戲主機市場。為和遊戲主機巨頭任天堂和索尼硬剛,2000年微軟找到英偉達,給出了5億美元的合同,讓其為還是祕密項目的初代Xbox開發一款定製GPU——基於GeForce 3的架構的X-Chip。
這5億美元的合同還未落袋為安,英偉達就因為微軟的一個決定再次跌入低谷。
當時,為和索尼的Play Station2搶市場,微軟大幅下調Xbox的售價。爲了打贏這場價格戰,微軟希望英偉達大幅下調X-Chip的價格。
這一提議被黃仁勛一口回絕,直接導致微軟放棄英偉達,轉而讓ATI(當時英偉達最大競爭對手)承接下一代Xbox的GPU設計。
學生時期寧願掃廁所也不會向「壞學生」屈服的黃仁勛,沒有嚥下這口氣,直接和當時最大的「甲方爸爸」微軟對簿公堂。
疊加當時互聯網泡沫陰霾未散,這直接導致英偉達股價大幅縮水。2002年初,英偉達股價一度跌至7美元左右。
直至2002年底黃仁勛拿下索尼的訂單,才緩解了英偉達的燃眉之急。英偉達的這次危機讓黃仁勛充分認識到,依靠單一業務和大客户無異於「虎口拔牙」。
黃仁勛做了一個關鍵決定,英偉達要提高自身的護城河,就要從純粹的圖形芯片製造商轉型為高性能計算解決方案供應商。
為拓展產品線、提高護城河,黃仁勛化身喬布斯、雷軍、埃隆.馬斯克的「小迷第」,不放過任何一個推銷新業務的機會。
打破GPU僅是圖形處理器傳統認知的關鍵一步,是降低GPU編程的難度。2006年英偉達推出通用並行計算平臺CUDA解決了這個問題。
比如CUDA提供了一套基於C/C++的高級編程接口,開發者無須掌握複雜的圖形API或者低級硬件指令,可以使用熟悉的編程語言來編寫GPU代碼;CUDA也附帶了一系列實用的庫(如BLAS庫、FFT庫等)和工具,並提供了性能分析和調試工具,可以幫助開發者更好地優化程序性能。
但建立GPU+CUDA軟硬件協同的生態並非易事,不僅需要在軟硬件方面持續投入研發資金,更需要不斷拓展遊戲之外的新業務場景,以推動整個生態發展。
為拓展新業務,黃仁勛沒有放過任何一個風口。從蘋果Mac、智能手機的普及,到特斯拉開啟智能汽車時代,再到加密貨幣及人工智能,每個風口都能看見英偉達產品的身影。
2007年,英偉達推出面向移動平臺(筆記本電腦等)的圖形處理器——GeForce 8M系列,並發展了蘋果這一客户。不過,二者的合作並沒有維持太久,2010年后,蘋果Mac開始有意識的減少使用英偉達的GPU。
英偉達被蘋果拋棄原因有三,一是2008年至2009年期間,使用英偉達GeForce 8600M GT GPU的MacBook出現黑屏、幕顯示異常、系統崩潰等問題,這直接引發用户的集體訴訟;二是蘋果有意自主研發SoC處理器,並於2010年推出了首款自研SoC芯片A4;三是因為專利糾紛,蘋果開始在Mac產品中使用英特爾的處理器。
信任一旦出現裂痕就很難完全修復,失去蘋果這一重要客户的黃仁勛開始親自下場拉跑業務。爲了拓展手機客户,自稱是「米粉」的黃仁勛曾親自為小米手機站臺,並在現場大喊,「小米威武」。
這一幕發生在2013年9月小米3手機發佈會現場。「雷軍讓我來和大家講兩句,而且不可以講英文,要講中文。很高興和雷軍一起發佈世界第一款Tegra 4手機,我也是米粉,小米威武。」黃仁勛站在雷軍身邊手舞足蹈的説。

黃仁勛親自為小米3手機站臺
Tegra是英偉達於2008年針對智能手機等小型移動設備推出的一款基於ARM架構的系統級芯片(SoC)。2013年初,Tegra更新至Tegra 4。
事實上,全球首款採用英偉達Tegra 4處理器芯片的智能手機並非小米,而是兩個月前發佈的中興U988S移動版。黃仁勛之所以對小米如此熱情,還把小米3定義為「世界首款Tegra 4手機」或許是因為彼時的小米是中國最紅的手機公司,雷軍也因推出便宜的紅米手機成為「雷布斯」。
從英偉達的營收構成看,英偉達其他業務(包含OEM和知識產權等)確實在2014財年達到了歷史高點,為15.32億美元,超過遊戲相關業務的15.11美元。

不過,黃仁勛的熱情並沒有持續打動雷軍,由於英偉達在基帶芯片領域有短板,Tegra 4處理器並未整合基帶芯片,所以小米3移動版在搭載Tegra 4處理器時,還外掛了展訊的基帶芯片,這不僅會提升設計複雜性還會增加生產成本。
小米3移動版成為唯一一款大規模搭載Tegra 4的小米手機。
有了小米3手機的「負面效應」,英偉達包含OEM的「其他業務」營收開始一路下滑。2015財年至2021財年,該業務營收分別為13.29 億美元、7.83億美元、6.98億美元、7.77億美元、7.67億美元、5.05億美元、6.31億美元。
有了此前被微軟「背刺」的經歷,黃仁勛自然不會把雞蛋放到一個籃子里。在和小米合作之前,黃仁勛還將Tegra 芯片推薦給了特斯拉創始人埃隆.馬斯克。
2012年,特斯拉宣佈採用英偉達Tegra 3芯片,並在2014年交付的Model S高端車型上率先使用。Tegra 3芯片被用於處理車輛攝像頭和傳感器收集的數據,以支持特斯拉Autopilot系統的初步自動駕駛功能。
Model S的交付推動了智能汽車產業發展浪潮。為搶佔風口,英偉達於2015年推出專為汽車應用設計的計算平臺系列DRIVE系列,包括面向車載信息娛樂系統的DRIVE CX和麪向自動駕駛系統的DRIVE PX。

黃仁勛和馬斯克在2015年英偉達GTC大會上
黃仁勛和馬斯克的「蜜月期」僅持續了5年多。為減少對外部供應商的依賴,並更好地控制自動駕駛技術路徑和進度,馬斯克堅持自研自動駕駛軟硬件。
2016年特斯拉還在Autopilot 2.0系統上採用英偉達的Drive PX 2計算平臺作為其硬件基礎,但在Autopilot 3.0(2019年推出)就轉向自家研發的軟硬件系統FSD(Full Self-Driving)。

圖為英偉達2007—2023財年研發費用的變化(百萬美元)
從2006推出CUDA至2019年,伴隨着英偉達拓展遊戲之外新業務,其研發費用開始翻倍增長。但從營收構成看,颼颼增長的研發費用並沒有在新業務中起到化學反應。2020財年之前支撐英偉達營收增長的一直是遊戲業務,營收佔比一直在50%以上。
可以這麼説,在英偉達花錢拓展新業務的背后,全球的遊戲玩家都有出一份力。
英偉達對遊戲玩家也頗具敬畏之心,在加密貨幣大火的那兩年(2019年至2020年),為確保遊戲顯卡更多地服務遊戲玩家,特意限制了部分遊戲顯卡在加密貨幣挖礦中的性能。
黃仁勛增加新業務的關鍵是拓展GPU的應用範圍,讓客户瞭解獨立顯卡不僅能提升遊戲體驗,GPU強大的並行計算能力還可賦能智能手機、新能源汽車及人工智能等領域。
儘管英偉達在手機、汽車等領域發展不盡如人意,但命運對黃仁勛的饋贈在十年前已經埋下。
2012年,「深度學習教父」辛頓帶着他的兩位學生Alex Krizhevsky和Ilya Sutskeverz(后來成為OpenAI的首席科學家),參加了全球最為權威的計算機視覺大賽ImageNet大賽,並一舉奪冠。其設計的深度卷積神經網絡AlexNet把圖像識別錯誤率錯誤率從上一年的26.2%降至15.3%。
AlexNet之所以能降低圖像識別錯誤率原因之一是,辛頓團隊一改傳統使用CPU訓練的做法,改用英偉達GPU訓練。相比谷歌貓(Google Brain於2012年推出的項目)用了16000顆CPU,AlexNet只用了4顆英偉達GPU。
AlexNet的一戰成名讓深度學習的研究人員意識到,GPU不僅可以給《光環》、《俠盜獵車手》等電子遊戲渲染圖形,其並行計算的優勢同樣擅長運行神經網絡的訓練。
事實上,早在20世紀七八十年代,學術界就有了關於神經網絡和深度學習的研究和理論,但其開始崛起主要是因為GPU的出現,而讓行業相信GPU可以提高模型訓練效率的正是辛頓。

從左至右依次為Ilya Sutskeverz、Alex Krizhevsky和辛頓
如果説,辛頓是從GPU的算力方面發現「遊戲」在加速深度學習中的作用,那麼DeepMind和OpenAI 則是從訓練方法論上發現了遊戲的厲害之處。
2016年3月9日,圍棋機器人AlphaGo因戰勝世界著名棋手李世石而名噪一時。AlphaGo之所以能一戰成名,源頭還要從其訓練AI方法—「讓系統玩遊戲」説起。
DeepMind打造通用人工智能的起點是會玩遊戲的系統,因為其創始人戴密斯.哈薩比斯認為,在人工智能的開發過程中,研究人員應該密切評估其進展,而遊戲則提供了這種評估標準。因為在遊戲中,分數和結果都是確定的,可以為人工智能體系提供即時的反饋信號,方便重複實驗以測量性能提升。
比如,DeepMind就曾通過他們打造的深度神經網絡反覆學習《越獄》遊戲,密切跟蹤哪些動作有效、哪些無效。兩個多小時后,該系統玩遊戲的速度和精度就超越了所有人類玩家。
OpenAI之所以會想出用GPU訓練對話和生成式模型也是源於辛頓的提醒。

DOTA2 OpenAI機器人
「GPU出現在我們多倫多實驗室,要感謝傑弗里.辛頓,他説我們應該試試 GPU。最初我們也沒搞懂GPU怎麼發揮作用,但隨着 ImageNet數據集的出現,卷積神經網絡非常適合GPU的模型。它讓訓練變得非常快,能做規模遠超以前的訓練。」前OpenAI聯合創始人、首席科學家Ilya Sutskever在和黃仁勛的「爐邊談話」中如此闡述。
和DeepMind一樣,OpenAI也發現遊戲在訓練和測試人工智能系統優勢。
OpenAI廣為世人所知的傑作是聊天機器人軟件ChatGPT。但在人工智能領域,OpenAI在2019年就因為其訓練的神經網絡OpenAI Five(由5個神經網絡組成的隊伍)擊敗了DOTA 2的世界冠軍戰隊OG而名噪一時。
Dota 2是一個多人線上遊戲,其在海外的知名度不亞於《星際爭霸Ⅱ》。因為Dota 2遊戲規則複雜多變,此前沒人相信人工智能可以戰勝專業選手。但OpenAI Five卻通過反覆訓練和學習做到了。
從另一層面看,其實硅谷的商業和技術精英中,本身就存在着大量遊戲愛好者。
現在,讓神經網絡玩遊戲已經成為訓練AI的重要手段之一,這對於英偉達來説,猶如一個輪迴。
30年前,英偉達從GPU起家,步履蹣跚,靠着遊戲顯卡和玩家活下來。30年后,憑藉其在並行計算的積累,英偉達在AGI世界中開闢出一條康莊大道。
ChatGPT大火以后,訓練大模型要搶購英偉達的高端GPU已成為行業共識。黃仁勛經常拿出來講的一個故事是,公司在2016年把首臺搭載了8塊P100 GPU的DGX-1送給了OpenAI。
2016年8月,黃仁勛把第一臺DGX-1捐給成立不到一年的Open AI,此前捐款一億美元的馬克思也被邀請見證
過去一年,全球大型科技公司瘋搶英偉達芯片和服務器。
英偉達的H100 GPU不僅是Meta、亞馬遜、甲骨文、谷歌等科技巨頭爭搶的對象,還一度成為和黃金類似的硬通貨。
去年,一臺由8張A800組成的服務器一度從230萬被炒至到330萬,誰能搶到英偉達芯片就猶如拿到了一臺印鈔機。
比如,超微電腦(主業是服務器解決方案)過去一年市值從默默無聞到如今股價暴漲1300%,部分原因是其創始人梁見后有對黃仁勛鼎力相助的情分,超微電腦總能第一時間拿到英偉達顯卡。
在國內,英偉達的芯片和服務器價格一路水漲船高,成為百度、阿里、騰訊、字節、美團等巨頭和創業公司佈局AGI大模型的核心競爭力。
當然,英偉達也並非能完全高枕無憂,已有多家公司宣佈其研發的AI芯片計算能力超過英偉達。比如,創業公司Groq就宣稱其推出的AI加速芯片LPU推理性能是英偉達GPU的10倍,成本僅為其十分之一。
不過,硬件的算力僅是一部分,英偉達CUDA生態上豐富開發者社區、開源項目和第三方支持庫等已為其構築了堅不可摧的護城河。畢竟,生態的切換是一個龐大且複雜的工程。
從整個財年看,遊戲業務(Gaming)首次被數據中心(Datacenter)業務超越是2023財年(對應自然年為2022年)。2022年ChatGPT的橫空出世讓行業看到了人工智能「技術奇點」到來的可能性。
2024財年,英偉達數據中心業務營收475.25億美元,是遊戲相關業務營收的4.6倍。直到此時,在遊戲領域蟄伏了20多年的英偉達才真正找到屬於自己的財富高增長密碼。