熱門資訊> 正文
2025-09-29 15:13
本文來自:聰明投資者
9月25日,英偉達創始人黃仁勛戴着顯眼的紅色眼鏡,到Bg2 Pod做了一場播客對話,時長超過100分鍾。
而去年10月4日,同樣的兩個主持人布拉德·格斯特納(Brad Gerstner)和克拉克·唐(Clark Tang)還走進英偉達總部,跟黃仁勛暢聊80分鍾。
當時黃仁勛提出了一個被廣泛引用的觀點:AI的真正爆發點不是訓練,而是推理,而且推理的增長幅度將是「十億倍」。
一年之后,他説,「其實當時還是低估了」。
這次訪談,是黃仁勛眾多頻繁演講交流中比較深入的一次,而且直面了市場近期最關心的爭議。
比如,英偉達既是OpenAI的投資者,又是其重大供應商,似乎形成了某種「循環收入」?比如,未來供給擴張過快,2026年會不會出現產能過剩?以及英偉達的護城河究竟有多深?
黃仁勛直面所有問題。
「我們的股權投資不與採購掛鉤,它只是一次押注未來巨頭的機會。」
「我認為OpenAI很可能會成為下一個萬億美元市值的超大規模公司。如果真是這樣,那麼在它成長到那個規模之前進行投資,就是我們能想到的最明智的決策之一。」
「所以如果有人告訴我,未來全球每年的AI基礎設施資本支出將達到5萬億美元,我會覺得這個數字完全合理。」
「在通用計算全面完成向加速計算和AI的遷移之前,我認為出現供過於求的可能性極低。這還需要幾年時間。」
「極致協同設計的核心,就是同時優化模型、算法、系統和芯片。摩爾定律時代,你只要讓CPU變快,一切就會自然提速。但當芯片性能停滯,你必須跳出框架創新。這就是英偉達改變遊戲規則的地方。」
「外界對我們有誤解,仍然停留在‘英偉達是一家芯片公司’的印象里。沒錯,我們造芯片,而且是世界最頂尖的芯片。但英偉達的本質是一家AI基礎設施公司。」
「壁壘在於兩點:協同設計的極致性和規模的極致性。」
他還談到密切的合作伙伴埃隆·馬斯克,盛讚説,「埃隆的巨大優勢在於,他能在一個人的大腦里整合並處理這些相互依賴的複雜系統,甚至包括融資。他本身就是一個巨大的GPT,一臺超級計算機,是終極的GPU」。
而談到中國時,黃仁勛的讚美一如既往,明確表示:這是一個充滿活力、富有創業精神的高科技產業環境,現代化程度很高。他甚至説,「他們只比我們慢了‘納秒’而已」。
面向未來,黃仁勛描繪了一張藍圖:「我認為在未來五年內,會有一件特別酷的事情發生:人工智能將與機電一體化、機器人技術真正融合。」
可以想象的是,「每個人都能擁有自己的R2-D2」。是的,就是星球大戰中那個陪伴了多個天行者的聰明活潑的忠誠夥伴。
聽下來緊迫感很強,而這列火車正在指數級加速。黃仁勛的提醒是,「最聰明的做法,就是在它還沒快到無法企及之前,趕緊上車,和它一起加速前進。」
全文很長,認真讀了好幾遍,聰明投資者(ID: Capital-nature)把大家可能最關注的幾個話題整理出來,mark並分享下。
格斯特納:如今你超過40%的收入來自推理業務。而真正的推理革命,也就是「鏈式推理」,纔剛剛拉開序幕,對嗎?
黃仁勛:它的增長將會是十億倍。我們不只是面對一個行業的增長,而是站在一場全新的工業革命前夜。
格斯特納:大約一年半前,大家在預訓練領域情緒有些悲觀,很多人説:「糟了,預訓練到頭了,我們投得太多了。」可你卻説:「推理的增長不是一百倍、一千倍,而是十億倍。」
黃仁勛:我得承認,其實我當時還是低估了。
現在我們已經清楚有三條規模定律:預訓練規模定律、后訓練規模定律,以及推理規模定律。
所謂「后訓練」,本質上就像AI在練習一項新技能。它會不斷嘗試各種方法,直到做對為止。而要做到這一點,就必須依賴推理。
今天的強化學習,其實已經把訓練和推理完全融合在一起,這讓整個過程變得更加複雜,而這就是所謂的「后訓練」。
過去的推理是一種「一次性」的過程。但今天我們強調的是新的推理方式,讓模型在給出答案之前先「思考」。
一個模型「思考」的時間越長,答案的質量就越高。在這個思考過程中,它可以查資料,覈實事實,學習新知識。再思考,再學習,最后生成答案。
關鍵在於,不要急於給出第一個答案。
所以,真正推動AI演進的,並不只是單一的預訓練,而是預訓練、后訓練和推理三者共同作用。
格斯特納:和一年前相比,你現在是不是對「推理會實現十億倍增長」、以及「這種增長會把智能推向怎樣的新高度」更有信心了?
黃仁勛:我今年的信心更足,看看如今的AI代理系統就知道了。
AI已經不再是單一的語言模型,而是一個由多個模型組成的系統。它們可以同時運行,調用工具,做研究,處理各種任務,而且都是多模態的。
格斯特納:幾天前,你宣佈了與OpenAI的Stargate項目達成重大合作。能否談談這次合作對你意味着什麼?以及為什麼你認為這對NVIDIA來説是明智之舉?
黃仁勛:我先回答最后一個問題,再展開説。
我認為OpenAI很可能會成為下一個萬億美元市值的超大規模公司。因為它和Meta、谷歌一樣,既有面向消費者的服務,又有面向企業的業務。這樣的雙重佈局,讓它極有可能成為全球下一個萬億級巨頭。
如果真是這樣,那麼在它成長到那個規模之前進行投資,就是我們能想到的最明智的決策之一。
投資必須投在自己熟悉的領域,而這恰好是我們的核心專長。而且他們願意讓我們參與,這非常難得。
我們和OpenAI已經在多個層面合作。這次新合作特別之處在於,OpenAI第一次決定自建AI基礎設施。
這意味着,我們會直接在芯片、軟件、系統乃至「AI工廠」層面與他們合作,幫助OpenAI成為一個完全自營的超大規模公司。
這個過程會持續相當長的時間。這背后是他們正在經歷的「雙重指數級增長」。
第一個指數增長來自用户數。因為AI的效果越來越好,應用場景越來越多,幾乎所有應用都在接入OpenAI,導致使用量爆炸式增加。
第二個指數增長來自單次使用的計算量。過去AI是「一次性」推理,現在則需要經過「思考」才能給出答案。
格斯特納:你剛纔提到「OpenAI極有可能成為萬億美元公司」,在此之前,他們的數據中心建設主要依賴微軟,而現在,他們希望掌握完整的技術棧。
黃仁勛:對,就像自己建工廠一樣。他們希望和我們建立一種類似埃隆與X的關係,走向自主建設。
格斯特納:華爾街25位負責研究英偉達的賣方分析師,他們的共識預測卻是英偉達的增長將在2027年趨緩,到2030年的年增速只有8%。
黃仁勛:我們很清楚,但這沒關係。我們一直以來都能超越他們的預期。
格斯特納:這種觀點部分源於擔心:當下的短缺最終會帶來未來的產能過剩。他們或許相信2026年的增長,但對2027年以后的情況心存疑慮,認為市場可能飽和。
黃仁勛:我倒不覺得這是矛盾。我從三個角度來解釋下:
第一點,也是最根本的一點,是基於物理定律的必然趨勢:通用計算的時代已經結束,未來屬於加速計算和人工智能。
你可以這樣想:全球價值數萬億美元的計算基礎設施,有多少需要更新換代?
所有人都同意摩爾定律已死,通用計算的效率瓶頸已現。下一步必然是從通用計算轉向加速計算。我們和英特爾的合作正是基於這個共識,通用計算必須和加速計算結合,這反而給他們帶來了新機會。
第二點,人工智能的第一個落地場景其實早已無處不在,比如搜索、推薦引擎和電商。
過去,超大規模計算的基礎設施主要是CPU,用來支撐推薦系統;未來,它將轉向GPU,為人工智能服務。
你只要看看傳統計算和超大規模計算的遷移方向,它們正在從CPU向加速計算與AI轉移。支持Meta、谷歌、字節跳動、亞馬遜等公司完成這一轉型,就是一個數千億美元的市場。
格斯特納:光是考慮TikTok、Meta、谷歌服務的40億用户,就已經產生了巨大的算力需求。
黃仁勛:沒錯,這一切都是由加速計算的變革驅動的。即便不算AI帶來的新應用,僅僅是AI改變現有工作方式這一點,就足夠龐大。
到目前為止我講的都只是基礎。就像煤油燈被電燈取代,螺旋槳飛機被噴氣機取代,舊模式終將被淘汰,這很簡單。
真正令人震撼的是,當我們進入AI與加速計算的時代,會誕生哪些全新的應用?這就是生成式AI的機會。
這個機會有多大?你可以類比馬達取代體力勞動,而今天我們有了人工智能。我稱之為「AI工廠」。這些AI超級計算機會不斷生成token,用來增強人類智能。
人類智能對全球GDP的貢獻有多大?大約55%到65%,差不多50萬億美元。
這50萬億美元的經濟活動,未來都將被AI增強。
回到個人層面,假設我花1萬美元為一位年薪10萬美元的員工配一套AI系統,能讓他的生產力提升一倍甚至兩倍,我會不會這麼做?答案是肯定的。
在英偉達,我們的每一位軟件工程師、每一位芯片設計師,都已經在用AI協作。覆蓋率是100%!
這意味着我們設計更多芯片,迭代更快,公司整體增長也更快。我們僱傭更多的人,效率更高,收入和利潤都更高。為什麼不呢?
現在,把英偉達的故事放大到全球GDP。
AI和過去的IT最大的不同在於:過去軟件是提前寫好的,運行在CPU上,需要人去操作;未來,AI會持續生成「通證」,機器必須不停思考才能生成。
軟件將永遠在線運行,而不是一次性寫好。爲了讓AI思考,就需要一個「工廠」。
假設未來AI生成了10萬億美元的token價值,毛利率是50%,那麼就需要一個價值5萬億美元的「AI工廠」——也就是AI基礎設施來支撐。
所以如果有人告訴我,未來全球每年的AI基礎設施資本支出將達到5萬億美元,我會覺得這個數字完全合理。
這就是未來:從通用計算轉向加速計算,用AI重塑所有超大規模計算,並最終增強人類智能。
格斯特納:我們估算,目前這個市場的年規模大約是4000億美元。照此計算,未來的潛在市場規模(TAM)比現在要高出四到五倍。
黃仁勛:沒錯。阿里巴巴的吳泳銘(Eddie Wu)昨天還説,到這個十年末,他們數據中心的電力容量會增加10倍。你想想看,他們的電力翻十倍,而英偉達的收入幾乎與電力消耗成正比。
他還提到另一點:token的生成速度每隔幾個月就會翻倍。
這意味着什麼?意味着每瓦性能必須持續呈指數級提升,這也是我們不斷推出更高性能產品的原因。同樣,每瓦帶來的收入也會隨之提升。未來,「瓦特」幾乎就等同於收入。
格斯特納:你所描繪的,實際上是這樣的場景:全球GDP的增長即將再次提速,因為我們將擁有數十億AI「同事」為我們工作。如果GDP是勞動力和資本投入的產出,那麼它必然會加速。
黃仁勛:是必然的。看看AI領域正在發生什麼。大語言模型、AI代理的崛起,正催生一個全新的產業。OpenAI已經是歷史上營收增長最快的公司,而且還在指數級增長。
因此,AI本身就是一個高速成長的產業。而支撐它的,是「工廠」和基礎設施,這也意味着我們的產業在成長。而且,下游產業同樣在成長。
能源行業就是一個例子。無論是核能還是燃氣輪機,正在迎來新一輪復興。
再看看我們基礎設施生態系統中的公司,幾乎所有人都在增長。
格斯特納:當然,這些龐大的數字也引發了爭論——會不會出現「供過於求」或者「泡沫」?扎克伯格上周在播客里就説,未來某個時點很可能出現需求的「真空期」,Meta可能在某些領域會超投100億美元。但他認為這是可以接受的,因為這是關乎未來的必要風險。這聽起來有點像「囚徒困境」,不是嗎?
黃仁勛:但他們都是「快樂的囚徒」。
格斯特納:能展開説説嗎?我們估算,到2026年,AI相關收入將達到1000億美元,這還不包括Meta,也不包括推薦引擎、搜索等現有業務的AI化部分。
黃仁勛:就算是1000億美元吧。但整個超大規模計算行業的體量是數萬億美元。而且要記住,這個行業正在全面轉向AI。
在任何人創造新市場之前,你必須先把這塊基數算進去。
格斯特納:懷疑論者會説,要支撐你的論點,我們需要看到AI收入從2026年的1000億美元,增長到2030年至少1萬億美元。你真的認為未來五年能有這樣的速度嗎?
黃仁勛:我認為我們其實已經做到了。
超大規模公司們已經完成了從CPU到AI的轉型,它們的收入基礎如今完全依賴AI。
沒有AI,TikTok無法運行;沒有AI,YouTube Shorts無法運行;沒有AI,Meta的個性化內容也不可能實現。過去很多依賴人工的環節,現在都交給AI了。
過去,內容是預先寫好的,推薦引擎只是從有限的選項里挑選。而現在,AI能夠生成無限的可能。
格斯特納:但推薦引擎正是我們經歷CPU向GPU過渡的關鍵驅動。在過去三四年,它們也一直在演進。
黃仁勛:沒錯。不過扎克伯格自己也承認,Meta在GPU應用上的確有點迟緩。GPU對Meta來説纔是一兩年的新事物。
至於搜索,是不是也用上了GPU?當然,這更是全新的變革。
格斯特納:所以你的意思是,到2030年AI收入達到1萬億美元幾乎是板上釘釘的事,因為我們實際上已經接近目標。你覺得在未來三到五年內,出現供過於求的概率有多大?
黃仁勛:在通用計算全面完成向加速計算和AI的遷移之前,我認為出現供過於求的可能性極低。這還需要幾年時間。
我再補充一點:直到所有推薦引擎都基於AI,直到所有內容生成都基於AI——而消費者內容的生成本質上依賴推薦系統,這些傳統上屬於超大規模計算的應用,包括購物、電商等,都將被AI重塑。
格斯特納:但這些新建設項目,涉及的投資是以萬億計。是不是意味着你們必須無條件地持續投入?即便經濟放緩,或者出現某種過剩,你們也得繼續砸錢嗎?
黃仁勛:實際情況正好相反。我們在供應鏈的最末端,是對需求做出響應。現在,所有投資人都清楚,全球普遍存在算力短缺。
這並不是GPU產能不足,而是需求一直被低估。如果客户下單,我們就會生產。
過去幾年,我們已經全面梳理過供應鏈。從晶圓廠到封裝,再到HBM內存,都已做好準備。如果需求翻倍,我們也能隨時翻倍產出。所以供應鏈不是問題。
我們現在只等需求信號。當雲服務商、超大規模數據中心、客户們制定年度計劃並給出預測時,我們就據此生產。
但迄今為止,所有的預測都被證明偏低。所以我們一直處在追趕狀態。
這種追趕已經持續好幾年。我們收到的每份預測,都比去年顯著增加,但實際需求仍然會超過它們。
格斯特納:你是否看到,一些傳統的超大規模數據中心運營商現在都在加大投入……
黃仁勛:這是因為「第二波指數級增長」來了。第一波是AI的普及和使用量的指數上升;第二波則是推理的應用爆發。
一些超大規模客户,他們的內部工作負載非常龐大,必須從通用計算轉向加速計算,所以消化產能沒問題;另一些客户的工作負載更復雜多樣,因此一開始對需求的判斷比較猶豫。
但現在大家都明白了:他們嚴重低估了所需的算力。
我最看好的一類應用就是傳統數據處理——包括結構化和非結構化數據。我們很快會宣佈一個重大計劃,把數據處理全面加速化。
要知道,目前全球絕大多數的數據處理還是跑在CPU上:Databricks、Snowflake的負載大部分是CPU,甲骨文的SQL處理也一樣。幾乎所有人都用CPU做SQL查詢。
未來,這些都會由AI來完成。
這是一個巨大而開放的市場。對英偉達來説,這需要一個完整的加速層,以及針對特定領域的數據處理庫和方法,我們必須把它們構建出來。
格斯特納:也有一些反對聲音。CNBC在談論過剩和泡沫;彭博討論的是「資金循環」和「循環收入」。
所以當你們或微軟、亞馬遜投資的公司,同時又是你們的大客户,比如你們投資了OpenAI,而OpenAI又向你們採購數百億美元的芯片……請告訴我們,分析師們擔心的「循環收入」問題,到底錯在哪?
黃仁勛:10吉瓦的算力,大約價值4000億美元。而這4000億必須由他們真實的銷售和收入來支撐,而這些收入正在呈指數級增長。
資金來源無非三種:資本金、股權融資和債務融資。他們能拿到多少資金,取決於市場對他們維持收入能力的信心。聰明的投資人和貸款人會綜合考量,這就是他們的商業模式。
這和我們沒關係。
當然,我們必須與他們保持緊密聯繫,確保能支持他們的持續擴張。但這屬於收入邏輯,而不是投資邏輯。
我們的股權投資不與採購掛鉤,它只是一次押注未來巨頭的機會。正如我之前説過的,這些公司極有可能成為下一個萬億美元級的超大規模企業。
誰不想投資這樣的公司呢?我唯一的遺憾是,當他們早期邀請我們投資時,我們因為資金有限,投得太少了。
真希望當時能把所有的錢都投進去。
格斯特納:而現實是,如果你們的產品不夠好,比如Vera Rubin芯片性能不佳,他們完全可以去買別的芯片。他們沒有義務必須用英偉達的產品。而且正如你説的,這只是一次機會性的股權投資。
黃仁勛:沒錯。但我們確實做了幾筆很棒的投資,比如xAI和CoreWeave。事后看,這些都非常明智。
格斯特納:2024年,你們從Hopper芯片開始切換到年度發佈周期;2025年的Grace Blackwell帶來了大規模升級,迫使數據中心進行全面改造;2026年下半年將是Vera Rubin,2027年是Ultra,2028年是Feynman。
這個年度節奏目前進展如何?主要目標是什麼?英偉達內部的AI是否在其中發揮了作用?
黃仁勛:沒有AI,英偉達不可能做到今天這樣的速度、節奏和規模。我們所有的進展都依賴AI。
為什麼要採用年度發佈?因為token的生成速度正在以指數級增長,客户的使用量也在以指數級增長。像ChatGPT上線還不到兩年,周活躍用户已經接近8億。
格斯特納:而且每個用户都在生成更多token,因為推理時花費的思考時間更長。
黃仁勛:對。這其實是兩條指數曲線疊加的結果。如果性能不能以同樣的速度提升,token生成的成本就會持續攀升。
摩爾定律已經停滯,晶體管的成本和能效改進幾乎為零。除非有新的系統性創新,否則局面無解。
幾分點的折扣根本彌補不了性能鴻溝。唯一的辦法,就是每年實現數量級的性能躍遷。
晶體管的紅利已經消失,我們必須在系統層面徹底重構,打破所有邊界,重新設計芯片、軟件棧和系統。
這就是所謂的極致協同設計。從未有人在如此高的層面上做過這樣的整合。
格斯特納:能簡單解釋一下「極致協同設計」嗎?
黃仁勛:極致協同設計的核心,就是同時優化模型、算法、系統和芯片。
摩爾定律時代,你只要讓CPU變快,一切就會自然提速。但當芯片性能停滯,你必須跳出框架創新。
這就是英偉達改變遊戲規則的地方。
我們做了兩件事:發明了CUDA和GPU,並提出了大規模協同設計的理念。
因此,我們進入瞭如此多的行業,構建了龐大的庫並進行聯合優化。從技術棧到數據中心層面,涵蓋交換機、網絡、軟件、NIC、橫向擴展、縱向擴展,全都整合。
結果就是,從Hopper到Blackwell實現了30倍性能提升,這是任何摩爾定律都無法做到的。這就是「極致」。
而能做到這一點,還因為我們有最豐富的軟件和人才積累。
英偉達向世界貢獻的開源軟件比幾乎任何公司都多,覆蓋AI、圖形學、數字生物學、自動駕駛等領域。這些龐大的軟件資源,讓我們真正能夠執行深度而極致的協同設計。
格斯特納:我聽到你的一位競爭對手説,英偉達的年度發佈周期不僅能持續降低Token生成成本,還讓對手們根本追不上。因為你們為供應鏈提供了長達三年的路線圖,使整個供應鏈更有黏性和信心去規劃未來的產能。
黃仁勛:在提這個問題之前,可以先想一想:要支撐每年數千億美元的AI基礎設施建設,我們需要提前一年投入多少資源?
僅在晶圓和DRAM的採購上,就得花掉數百億美元。這個規模幾乎沒有哪家公司能做到。
格斯特納:那麼你會説,你們的競爭壁壘比三年前更牢固了嗎?
黃仁勛:競爭比以往任何時候都激烈,但進入這個賽道的門檻也比任何時候都高。
因為晶圓成本不斷上漲,如果不進行大規模協同設計,就根本不可能實現數量級的性能跨越。
壁壘在於兩點:協同設計的極致性和規模的極致性。當客户要部署1吉瓦的算力時,意味着需要40萬到50萬塊GPU。
讓幾十萬塊GPU協同運轉,本身就是奇蹟。客户必須在我們身上下注。
你要反問自己:什麼樣的客户會在一款尚未經過市場驗證的架構上,提前下500億美元的訂單?再問,作為供應商,你為什麼要為一款剛剛完成設計的芯片,提前投產價值500億美元的晶圓?
對英偉達來説,這能實現,因為我們的架構已經被反覆驗證過。客户的規模巨大,供應鏈也必須匹配這種規模。
沒有對我們交付能力的絕對信任,任何一家公司都不會願意提前為你生產如此龐大的零部件訂單。
他們願意一次性拉動數千億美元的生產計劃,這種信任和規模本身就是壁壘。
格斯特納:站在第一性原理的角度,我會問:你們是在拓寬,還是在縮窄自己的護城河?
黃仁勛:我會説,我們的機遇,遠比市場普遍認知的要大得多。
外界對我們有誤解,仍然停留在「英偉達是一家芯片公司」的印象里。沒錯,我們造芯片,而且是世界最頂尖的芯片。
但英偉達的本質是一家AI基礎設施公司,我們是客户的AI基礎設施合作伙伴。與OpenAI的合作就是明證。
我們與客户合作方式非常靈活,不要求他們必須買全套,也不要求買整個機櫃。他們可以只買一顆芯片,一個組件,或者只買我們的網絡設備。
有些客户只買CPU,或者只買GPU,再配其他廠商的CPU或網絡設備,我們完全接受。
無論怎樣,我唯一的請求是:總得從我們這兒買點東西。(笑)
格斯特納:你説過,AI不僅關乎更好的模型,更需要世界級的「建設者」。在我看來,這個國家最頂尖的建設者也許就是埃隆·馬斯克。
黃仁勛:如果他第一個建成吉瓦級的超算,我一點都不會意外。
格斯特納:請談談「建設者」的優勢。
黃仁勛:這些AI超級計算機是極其複雜的系統。
技術複雜,融資複雜,土地、電力、機房和供電同樣複雜。把所有這些整合並運行起來,這是人類歷史上最複雜的系統工程之一。
埃隆的巨大優勢在於,他能在一個人的大腦里整合並處理這些相互依賴的複雜系統,甚至包括融資。他本身就是一個巨大的GPT,一臺超級計算機,是終極的GPU。
他有強烈的緊迫感和真正的建設意願。當意願與能力結合時,奇蹟就會發生。他確實是獨一無二的。
唐:説到這點,現在全球一個核心爭論是GPU與ASIC(專用集成電路,即為某個特定用途而設計的「定製芯片」)的對決。考慮到谷歌TPU的成功,你現在怎麼看市場格局的演變?
黃仁勛:谷歌的成功在於遠見。他們在一切開始前就推出了TPU1。
就像創業一樣,應該在市場爆發前就進入,而不是等到市場達到萬億美元規模時再加入。
風險投資里有個常見的謬論,只要能在大市場中拿到幾個點的份額就能成功。這完全錯誤。
真正的邏輯是:你要在一個小市場里佔據100%,並隨着市場成長而成長。TPU當年就是這麼做的,那時這個賽道只有我們和他們。
格斯特納:但前提是,你得祈禱這個小市場最終會長大。實際上,你在創造一個新行業。
黃仁勛:沒錯。這也是今天所有想做ASIC的公司面臨的挑戰。
我曾在LSI Logic工作過,那家公司最早提出ASIC概念,但現在已經不復存在。
為什麼?當市場還很小的時候,ASIC模式確實有效。你找個代工廠,幫你完成設計、封裝、生產,他們抽取50%–60%的毛利。
但當市場足夠大時,模式就會轉向COT(客户自有工具,Customer-Owned Tooling)。蘋果的智能手機就是典型案例:出貨量巨大,他們絕不會把一半利潤交給別人,而是必然採用COT。
所以,當TPU的業務規模大到一定程度時,最終也會走向COT,這是毫無疑問的。
當然,ASIC依然有它的用武之地,比如視頻轉碼器或智能網卡。這類市場規模有限,不會無限膨脹。
你可以用ASIC去做推薦系統里的嵌入式處理器,這是可行的。但要拿它作為AI的核心計算引擎,就完全不現實了。
AI世界變化太快,你需要應對低延迟、高吞吐、推理、Token生成、視頻生成等各種迥異的工作負載,這些需求不可能靠單一ASIC解決。
格斯特納:像Trainium或一些歐洲的新創公司,他們的ASIC芯片更像是「大棋盤里的一枚子」。而你們已經搭建了一個極其複雜的系統、一座「工廠」,而且在不斷開放,比如Grace CPU,就是把不同工作負載分配給最合適的硬件。
黃仁勛:沒錯。我們剛剛開源了Dynamo,一個面向分佈式AI工作負載的編排系統,因為未來的AI工廠一定是分佈式的。
格斯特納:你們推出的NVLink Fusion(英偉達推出的新一代互聯技術,它能把不同廠商的CPU、GPU或加速器高速連接起來,讓它們像一個整體一樣協同工作。相比傳統的封閉互聯,NVLink Fusion更開放,允許Intel、ARM等生態無縫接入,從而擴大了英偉達「AI工廠」的影響力),甚至向英特爾——你們剛剛投資的競爭對手,敞開了大門。這説明你們希望整個行業一起來建設這座「工廠」。
黃仁勛:這次合作把英特爾生態、英偉達AI生態和我們的加速計算平臺打通,就像我們和ARM已經實現的那樣。未來還會有更多合作伙伴。
這是一次雙贏:我會成為他們的大客户,而他們也為我們打開更廣闊的市場。
格斯特納:大多數人可能不知道,但我認為你對中國的瞭解不亞於美國任何一位領導人。
黃仁勛:我們去中國已經30年了。
格斯特納:能否重申一下,你認為我們國家應該怎麼做,才能在全球人工智能競賽中處於最佳的獲勝位置?
黃仁勛:我們和中國確實是競爭對手。但要認識到,中國希望自己的企業做大做強,這是再自然不過的事。他們理應如此,而且也應該得到儘可能多的支持,這是他們的權利。
別忘了,中國有着世界上一些最優秀的企業家,他們大多畢業於全球頂尖的STEM學校,是全世界最渴望成功、最有衝勁的一羣人。
在他們的職業文化中,「996」工作制就是一個典型例子——每周工作六天,從早上九點到晚上九點。這種方式效率極高,雖然外界爭議不少,但它已經成為他們的文化特徵之一。
整體上,這是一個充滿活力、富有創業精神的高科技產業環境,現代化程度很高。
我聽到過一些聲音,比如「中國永遠造不出AI芯片」。這完全是無稽之談。還有人説「中國不擅長製造」。如果非要説他們最擅長什麼,那就是製造。
有人説他們比我們落后很多年——一兩年?還是三四年?事實上,他們只比我們慢了「納秒」而已,就是這麼微小的差距。所以,我們別無選擇,必須直面競爭。
那麼問題來了:什麼才符合中國的最佳利益?
答案很清楚:維持一個充滿活力的產業。中國領導層也公開表示過,而且理應如此,他們希望中國成為一個開放的市場,吸引外國投資,讓國際公司進入並在市場上競爭。
我相信,也希望我們能夠回到過去的狀態。
回到你剛纔提到的未來,我對此依然充滿信心。因為中國領導人就是這麼説的,我對此深信不疑。我相信這是符合他們利益的做法:既讓外國企業在中國投資、競爭,同時又保證本土企業能在充滿活力的競爭中成長。
另外,他們也明確希望走向全球,參與國際競爭。這是一個相當明智的願景。
至於我們美國,任務就是賦能我們的技術產業。我很榮幸能身處一個被譽為「國家寶藏」的行業。我們必須意識到,這確實是我們的國之瑰寶,是我們最頂尖、獨一無二的產業。
所以,我們為什麼不讓這個產業放手去拼,在競爭中脫穎而出?為什麼不讓它走向世界,把技術傳播到各個角落,建立一個以美國技術為基礎的全球體系?
這樣,我們才能最大限度地提升經濟成就和地緣政治影響力,讓這個在關鍵時刻至關重要的產業蓬勃發展。
雖然有很多討論正在進行,但我始終會回到一個基本事實。我堅信,讓英偉達能夠參與並服務中國市場的競爭,這最符合中國的利益。
同時,這也最符合美國的利益。這兩個事實完全可以同時成立,而且我相信它們都是真實的。
我一直相信智慧和真理終將勝出,這也是我一路走來的信念。
格斯特納:今天我們已經多次提到「指數增長」。未來學家雷·庫茲韋爾(Ray Kurzweil)曾説過:在21世紀,我們體驗到的進步將不止100年,而是相當於兩萬年的進步。展望下未來?
黃仁勛:我認為在未來五年內,會有一件特別酷的事情發生:人工智能將與機電一體化、機器人技術真正融合。到那時,我們每個人身邊都會有能自由活動的AI。
大家其實都能想象,我們終將迎來屬於自己的「R2-D2」。它會陪伴我們成長,記住我們的一切,成為我們的向導和夥伴。
再想象一下:未來在雲端部署80億個GPU,為全球80億人提供服務,每個人都有一個量身定製的AI模型。這完全可能實現,也非常令人振奮。人工智能不僅存在於雲端,還會無處不在:在你的汽車里,在你的機器人里,在各種設備中。
與此同時,我們還將逐步理解生命科學的複雜性。對生物系統的理解和預測,甚至可能讓我們為每個人建立一個數字孿生。
就像我們在亞馬遜有一個用於購物的「數字分身」,在醫療健康領域,我們也完全可以擁有一個。
這個系統能預測衰老過程、潛在疾病,甚至預警可能即將發生的重大健康事件——比如下周,甚至明天下午。這不是幻想,而是迟早會實現的。
很多CEO常常問我:面對這種快速演化的未來,我們該怎麼辦?答案其實很簡單:在一列正以指數級加速前進的火車面前,你唯一要做的,就是跳上去。
一旦上車,問題會在途中得到解決。試圖預測這列火車最終會駛向何方,然后打算在某個路口攔截它,這是徒勞的。
最聰明的做法,就是在它還沒快到無法企及之前,趕緊上車,和它一起加速前進。