熱門資訊> 正文
2025-01-08 09:21
智東西
作者 陳駿達
編輯 心緣
智東西拉斯維加斯1月7日報道,今天,在備受關注的CES開幕演講后,英偉達創始人兼CEO黃仁勛在當地接受了智東西等全球媒體近1個小時的深度採訪,採訪中,他點名表揚中國車企,迴應RTX 5090的超高定價,承認AI PC人才不足、需求尚未爆發,提出三大Scaling Law將共存的觀點,更詳細剖析了英偉達昨日新發布、新動向背后的種種考量。
老黃今天還換下了昨天那件「開了光追」的皮衣,他稱那件皮衣對今天的場合來説可能有點太過了。
黃仁勛稱,理想、小鵬、小米、蔚來、比亞迪等企業對智能駕駛趨勢的影響可能比特斯拉的還大。
談到貿易戰,他相信政府將做出明確的決定,無論結果如何,英偉達都將盡力幫助客户和市場。
英偉達本次發佈的RTX 5090旗艦產品與次旗艦在價格、性能上有顯著差異,黃仁勛稱這一選擇是是爲了滿足極致發燒友的需求,而入門級產品較低的顯存配置是爲了和其算力平衡。現場有記者試圖套話,讓老黃分享60系列的細節,但他稱自己無可奉告。
近期,Scaling Law終結和變化的討論依舊持續,黃仁勛認為未來一段時間里,三大Scaling Law將會共存,即算力的提升、測試時計算和推理過程中的數據反哺,自己沒有看到AI發展的物理瓶頸。
儘管英偉達市值已站穩3萬億美元大關,但黃仁勛展現出極為剋制、精簡、專注的發展策略。英偉達不會涉足電力等算力基建,近期沒有新的收購計劃,不過多涉足計算層和庫層,也不打算直接服務企業,將集中精力去做那些只有英偉達才能做成的產品,最新的Digits個人超算、NVLink 72都是此類產品的代表。
AI PC領域發佈不斷,但銷量還未完全起飛。黃仁勛認為設計師、開發者等羣體的AI PC需求真實存在,他們將通過WSL2這一虛擬平臺將雲端的AI技術帶到PC之中。
物理AI是老黃眼中的重要趨勢之一,它將幫助AI理解世界,但我們至今仍然缺少一個物理世界的基礎模型,英偉達希望通過Cosmos催生GPT-3級別的物理模型,這對機器人和智能駕駛的落地有重大意義。
Agent是AWS、微軟等企業押注的重點,英偉達也推出了面向企業的agent藍圖,但老黃稱英偉達不會與這些企業直接競爭,主要是為企業agent開發提供基礎和幫助。
以下是對黃仁勛本次採訪的完整編譯(為提高可讀性,智東西在不違背原意的前提下進行了一定的增刪修改):
一、黃仁勛:英偉達目前仍是小公司,暫無新收購計劃
1、記者:首先恭喜你們。這是很棒的一年。你們仍然領先業界至少兩年。去年你們為計算機定義了新的一年,也就是數據中心。我完全同意。你必須從建設工作開始,再往后發展。現在你們已經完成了整個系統的工作,包括GB200 NVL72。是不是該讓英偉達開始考慮基礎設施、電力和系統中的其他部分了?
黃仁勛:英偉達的規則是隻做別人沒做的事,或者我們能做得明顯更好的事。所以我們開始做事的標準其實很高。這就是為什麼我們實際上不算是一家老牌企業。我們之所以做我們做的事,是因為如果我們不去造NVL72,誰會去造呢?誰有能力製造?如果我們不製造Spectrum X這類交換機,誰能做呢?
我們雖然有32000人,還仍然是相對較小的公司,我們仍然是一家小公司,需要確保我們的資源高度集中在我們能做出獨特貢獻的領域。
2、記者:去年在GDC大會上,你分享了你們在以色列增加投資和活動的情況。加強了你們作為該國最大僱主之一的地位。你們在2024年繼續擴張,收購了兩家以色列公司。你們打算如何進一步增加在以色列的投資?具體來説,我們很快會聽到一個正在進行中的新交易嗎?
黃仁勛:我們在全球範圍內吸引優秀人才。目前收到了超過一百萬份簡歷申請,公司在以色列的員工已達到近5000人。我們已成為以色列發展最快的企業僱主之一,這讓我感到非常驕傲。
即使在當前局勢緊張的情況下,我們的以色列團隊依然展現出卓越的表現。他們始終保持專注,交出了令人驚歎的成績單。僅在過去七周內,團隊就成功開發出了Spectrum X和Bluefield 3等重要產品。我為他們的專業能力和敬業精神深感自豪。
關於新的收購計劃,今天暫時沒有要宣佈的消息。
二、AI PC需求確實存在,將實現雲端級AI能力
3、記者:你們昨晚發佈了很多關於AI PC的消息。這些產品的銷量今年還沒有真正起飛。你認為英偉達能幫助改變這種狀況,推動這些產品的採用嗎?是什麼阻礙了它們的發展?
黃仁勛:這是一個很好的問題。AI技術最初是在雲端環境下發展起來的。如果回顧英偉達過去幾年的增長軌跡,你會發現主要集中在雲計算領域,這是因為訓練AI模型需要強大的超級計算機。這些模型規模龐大,在雲端部署和通過API調用是很容易的。
我們認為,仍然有設計師、軟件工程師、創意人員和愛好者喜歡使用PC來開發這些東西。當然,其中一個挑戰是,由於AI在雲端,而且雲端投入了大量精力和工程開發,開發AI PC的人很少。
不過,我們也注意到有大量的設計師、軟件工程師、創意人員和技術愛好者,他們更傾向於在PC上進行AI開發工作。其中一個挑戰在於,由於AI生態系統主要集中在雲端,加上雲服務提供商投入了大量資源進行開發,導致端側AI開發的人才相對較少。
但令人欣喜的是,Windows PC完全有能力支持AI開發。特別是通過WSL2(Windows Subsystem for Linux 2)這個強大的虛擬化平臺,我們可以將原本為雲端打造的AI技術引入到PC中。我們正在努力確保PC硬件和WSL2平臺能夠完美支持這些技術。
我堅信這是未來的正確方向。我個人對此充滿熱情,所有PC製造商也都表現出極大的興趣。我們正在與合作伙伴一起,讓所有PC都具備運行AI的能力,包括優化Windows系統,這樣我們就能把雲端的AI生態系統完整地帶到個人電腦上。
三、需要打造物理世界基礎模型,Cosmos將幫助AI理解世界
4、記者:昨晚CES開幕演講的某些部分感覺就像是在SIGGRAPH大會上,非常技術性。現在你們的受眾更廣了,我想請你解釋一下這些內容的意義。
黃仁勛:首先,我承認我的講解不夠清晰,但這不是主要問題。要知道,英偉達本質上是一家技術公司,而不是消費品公司。我們的技術會影響並塑造消費電子產品的未來。雖然他們很熱情地邀請我們,但我們始終是一家專注技術的公司。當然,這並不能成為我沒有把技術解釋得更好的藉口。
我們昨天宣佈的一個最重要的突破是開發出了一個能夠理解物理世界的基礎模型。就像GPT是理解語言的基礎模型,stable diffusion是理解圖像的基礎模型,我們現在創造了一個能夠理解物理世界的基礎模型。
它能夠理解摩擦、慣性、重力、物體的存在和持續性,以及幾何和空間關係等概念。這些其實都是兒童與生俱來就能理解的東西,兒童對物理世界的理解方式是目前的語言模型所無法企及的。
我們堅信一個能理解物理世界的基礎模型是必不可少的。現在有了這個模型,所有你能用GPT和stable diffusion完成的任務,都可以用Cosmos來實現。比如説,你可以與它進行對話。
你可以跟這個世界模型交談,詢問它當前環境中的情況。基於它通過攝像頭獲取的信息,它能理解並描述」有很多人圍坐在桌前,他們在一個房間里」這樣的場景。
Cosmos本質上是一個理解現實世界的模型。那麼為什麼我們需要這樣的模型呢?因為如果你希望AI能在現實世界中自然地運作和互動,它就必須具備這種理解能力。
應用場景在哪里?自動駕駛汽車需要理解物理世界,機器人需要理解物理世界。這個基礎模型就是實現這些應用的關鍵起點。Cosmos會讓機器人成為現實。
四、三大Scaling Law將共存,測試時計算將構成良性循環
5、記者:昨晚你提到,我們在見證一些新的Scaling Law的出現,特別是測試時計算(Test-time Compute)。我認為OpenAI的o3模型表明,從計算機的角度來看,擴展推理的成本非常高。英偉達在提供更具成本效益的AI推理芯片方面做了什麼?從更廣的角度來看,你們如何從測試時計算的擴展中獲益?
黃仁勛:首先,對於測試時計算來説,無論是在性能還是成本效益方面,最直接的解決方案就是提升我們的計算能力。新架構的推理性能可能比上一代Hopper高30到40倍。通過將性能提高30到40倍,我們就能將成本降低30到40倍。因為數據中心的其他成本基本保持不變。
所以改進的最佳方式,也是摩爾定律在計算曆史上如此重要的原因,就是它降低了計算成本。我之所以提到我們的GPU性能在過去10年增長了1000到10000倍,是因為這反過來説明成本降低了1000到10000倍。在過去20年里,我們將計算的邊際成本降低了100萬倍。這使得機器學習變得如此合理。只需讓計算機從這里到那里。
所以最好的改進方式就是降低計算成本,這也是為什麼摩爾定律在計算發展史上如此重要。我提到過去10年我們的GPU性能提升了千倍到萬倍,這同時也意味着成本以相同的幅度下降了。
在過去20年中,我們把計算的邊際成本降低了百萬倍。正是這種成本的大幅下降,讓機器學習變得切實可行。未來我們會繼續推動計算能力的提升,也將繼續帶來計算成本的降低。
從另一個角度來看這個問題。現在通過測試時計算的擴展來獲得答案需要多次嘗試。這些答案會被用作下一輪訓練的數據。這些數據又會成為預訓練數據。所有我們收集的數據都會被用於預訓練和后訓練的數據池中。通過不斷改進超級計算機的性能並降低訓練成本,我們最終可以讓每個人使用AI推理的成本都變得更低。
這個過程需要一定時間。這三個擴展定律會在未來持續發揮作用,並且相互影響。從技術角度看,每一次迭代我們都在提升模型的智能水平。同時,用户對AI的要求也在不斷提高,他們提出更具挑戰性的問題,這就要求系統具備更強的智能。這種需求的增長會導致測試時擴展的持續發展,形成一個良性且不斷擴大的循環。
五、DLSS 4是在「預測未來」,但渲染仍是重要基礎
6、記者:關於DLSS4,你昨晚做了一些演示。我想請你詳細講解一下,比如多幀生成技術。它是否仍然是渲染兩幀,然后在中間生成並進行插值?還有關於文本重壓縮的內容,在你們的材料中,在視頻里提到的。這是遊戲開發商需要專門採用的技術嗎?還是是驅動程序層面的功能,可以讓所有遊戲或至少大部分PC遊戲受益?
黃仁勛:我們在Blackwell中讓着色器處理器能夠運行神經網絡。這樣就可以在着色器管線中混合使用代碼和神經網絡。這一點非常重要,因為紋理和材質都是在着色器中處理的。
如果着色器不能運行AI,就無法利用神經網絡在算法上帶來的進步,比如壓縮技術。現在的紋理壓縮效果比過去30年使用的算法要好得多。壓縮比有了很大提升,對於很多紋理可以額外壓縮5倍。考慮到現在遊戲體積都很大,這是一個重要的進步。
第二點是關於材質。材質決定了光線在表面的傳播方式,它的各向異性特性會讓光線以特定方式反射,從而展現出金漆或純金等不同效果。這種特性本質上是在原子層面發生的。用數學方法很難描述這個過程,但我們可以用AI來學習它。這種神經材質技術將是一個重大突破,能讓計算機圖形變得更加生動逼真。
關於DLSS,幀生成不是插值關係,而是字面意義上的預測。你是在預測未來。沒錯,你是在預測未來。你不是在對過去進行插值,你是在預測未來。這樣做的原因是因為我們試圖提高幀率。
7、記者:AI現在是不是在PC遊戲中扮演了更決定性的作用,傳統需要渲染的幾何特徵是不是都轉向生成了?
黃仁勛:不是的,讓我解釋一下為什麼。在ChatGPT最初推出時,雖然很多人認為可以直接進行生成,但內部人員都知道這並不現實。因為系統需要真實的基礎數據作為條件。就像我們現在用上下文來引導聊天或提示一樣,在回答問題前必須理解背景。這個背景可能是PDF文件、網絡搜索結果,或者是明確的提示詞。
遊戲也是同樣的道理。你需要提供上下文,不僅要考慮劇情,還要考慮空間關係。通過提供初始的幾何形狀或紋理作為條件,系統才能生成新內容或提升分辨率。這種方式和ChatGPT使用上下文是一樣的。在企業應用中,我們稱之為梯度檢索增強生成。未來的3D圖形將建立在這種3D條件生成的基礎上。
以DLSS 4為例。4幀畫面總共有3300萬像素,但我們只渲染了其中的200萬。神奇的是,我們用這200萬像素生成了另外3100萬像素。關鍵在於這200萬像素必須精確定位。有了這個基礎,我們就能生成剩余的3100萬像素。更重要的是,因為節省了計算資源,這200萬像素可以渲染得非常精美,為生成其他像素提供了優質的參考。
這種變革將影響遊戲的方方面面,從像素到幾何形狀和動畫。這個過程花了六年時間。當初宣佈DLSS時很多人都不相信,部分原因是我沒有解釋清楚。但現在大家都認識到生成式AI就是未來。關鍵是要有條件設置,要有藝術家的創意指導。
Omniverse和Cosmos的關係也是如此。Omniverse作為Cosmos的3D引擎,本質上是一個生成引擎。我們可以精確控制渲染的程度,減少直接渲染來生成更多內容。當減少控制和模擬時,我們就能模擬更大的世界。因為在背后,我們有一個強大的生成引擎在創造真實世界。
六、5090面向極致發燒友,5070 12GB顯存與算力達成平衡
8、記者:我有一個關於遊戲玩家和消費者的問題。我們注意到RTX 5090和5080之間存在巨大差距。5090的CUDA核心數量是5080的兩倍多,價格也翻了一番。為什麼你們要在旗艦產品和次旗艦產品之間做出如此大的差異?
黃仁勛:原因是這樣的,一旦有人想要最好的產品,他們就一定會選擇最好的。你知道,市場並沒有那麼多細分。而且我們的發燒友們,如果他們想要最好的,給他們稍微好一點的,或者爲了省下100美元而選擇稍差一點的,他們是不會接受的。他們就是想要最好的。
當然,2000美元確實不是小數目,這確實是一個相當高的價值。但要記住,這項技術將用於你的家庭影院級別的PC環境。而那臺PC,你已經在顯示器和音響上投資了約1萬美元,你肯定會想要最好的GPU。所以我們很多客户,他們就是追求絕對最好的。
9、記者:我是來自韓國的記者。作為一名遊戲玩家,我感到非常興奮。因為當您談到內存時,特別提到了HBM,為什麼沒有選擇三星的?
黃仁勛:我認為三星基本上不生產顯卡的相關產品,是嗎?他們生產嗎?請不要告訴他們我說了這些。抱歉,是我的錯。我不太清楚。
這沒什麼特別的原因。如您所知,SK和三星是兩家最大的製造商。我不太確切知道具體情況,可能也不是什麼重要的事情需要記錄。他們正在努力。是的,他們正在努力,一定會成功的。我對三星能夠成功開發HBM充滿信心。
我對三星的成功充滿信心。要知道,三星最早創造了HBM。英偉達使用的第一批HBM內存就來自三星。他們會重新崛起的,他們是一家偉大的公司。韓國人非常有雄心壯志,這是好事。雖然他們需要重新設計,但我相信他們一定能做到。他們正在快速推進,對此非常投入。SK和三星都是優秀的公司,尤其在內存領域。所以我相信他們會繼續取得成功。你們昨天也看到了我們產品中使用了多少HBM內存,HBM內存對我們來説非常重要。
10、記者:我的問題是,為什麼5070仍然只使用12GB顯存?現在很多遊戲都需要更大的顯存,特別是在目標分辨率下。
黃仁勛:我們一直在尋找計算引擎、計算能力、帶寬和顯存容量之間的最佳平衡。雖然很難做到完美,但這是我們的目標。顯存和計算能力必須相匹配——顯存太多會浪費計算資源,計算能力太強又會受限於顯存容量。所以找到這個平衡點是我們面臨的一個重要課題。
11、記者:看到昨晚的5070的性能和4090差不多,價格還降了那麼多,很讓人興奮。你對60系列有什麼期待嗎?
黃仁勛:昨晚我們發佈了四款RTX Blackwell顯卡,其中性能最低的一款都超過了當前市面上最強的GPU,這真是令人難以置信。這充分展示了AI技術的強大。如果沒有AI、張量核心和DLSS4這些創新技術,我們不可能達到這樣的性能水平。説到60系列,我其實沒什麼特別要説的。
12、記者:英偉達的Blackwell架構在統一性方面有什麼優勢?這種統一架構對開發者和最終用户帶來了哪些好處?
黃仁勛:是的,這確實是一個重要的優勢。我們的Blackwell架構GPU具有強大的通用性,能夠支持從Agentic AI到完整機器人系統的各類應用。無論是在雲端服務器、自動駕駛汽車、機器人還是遊戲系統中,英偉達的架構都保持完全一致。這是我們深思熟慮后做出的戰略決策。
選擇統一架構的核心原因是爲了給軟件開發者提供一個無縫的開發平臺。開發者只需要開發一次,就能確保他們的程序可以在任何搭載英偉達芯片的平臺上運行。就像我昨天提到的,我們可以在雲端開發AI模型,然后輕松地將其部署到個人電腦上運行。這種能力是獨一無二的。
具體來説,雲端的AI容器可以直接下載到PC上運行。比如SD-XL、Flux、Llama等模型,只需要從雲端下載並部署到PC就能立即使用,這種便利性將在未來得到更廣泛的應用。
七、英偉達不直接服務企業,不過多涉足計算層和庫層
13、記者:雖然超大規模客户對你們產品的需求已經很明顯,但我想了解你們在擴大收入來源方面的緊迫感。特別是在開拓新的企業客户和政府數據中心市場,以及在超大規模計算領域,尤其是在亞馬遜等公司開發自己的AI芯片的情況下。你們感受到多大壓力?能否詳細介紹一下你們在企業和政府客户方面的進展?
黃仁勛:我們的緊迫感源自客户的實際需求。我很高興看到客户在雲端使用我們的技術。我們的技術進步速度非常快。每年性能翻一番,就意味着成本降低一半。這比摩爾定律最好時期的進步還要快。我們會繼續積極滿足客户需求,無論他們在哪里。
關於企業市場,現在主要有兩大服務行業。我們的策略是與這兩個領域合作,幫助他們打造解決方案。NeMo、NIMs和Blueprints都是開發Agentic AI的工具包。比如我們與ServiceNow的合作就很成功,他們即將推出一系列基於這些技術的agent服務。這就是我們的基本策略。我們也會與埃森哲等解決方案提供商合作。埃森哲在幫助客户採用這些系統方面做得很好。所以第一步就是提供幫助。
14、記者:許多公司都在開發Agentic AI,你們要如何與AWS、微軟和ServiceNow這樣的企業競爭或是合作呢?
黃仁勛:英偉達並不是一家直接服務企業的公司,而是一家技術平臺公司。我們正在為ServiceNow開發工具包、庫和AI模型。這是我們的工作重點。我們主要與ServiceNow、SAP、Oracle、Synopsys、Cadence、西門子等公司合作。
雖然我們在專業領域有很強的優勢,但我們不想過多涉足AI的計算層和庫層。我們的任務是為這些公司開發工具。這個工作很有挑戰性,因為我們實際在做的事情就是得把ChatGPT整合到容器中。優化這些端點和微服務非常複雜。不過一旦完成,客户就可以在任何雲平臺上使用我們的產品。
這就是為什麼我們開發了NIMs和NeMo。我們的目的不是與客户競爭,而是幫助他們。如果雲服務提供商想使用這些技術,我們也會全力支持。事實上,已經有很多雲服務提供商在用NeMo訓練他們的邏輯模型,他們的應用商店里也有NIMS。
這些技術都是我們后來開發的。NIMs和NeMo的作用,就像CUDA和CUDAx庫一樣重要。CUDAx庫對推廣NVIDIA平臺起到了關鍵作用。我們為行業開發這些庫,就是爲了讓企業不必從零開始開發。
八、Digits主要面向數據科學家,小模型有望登上AI眼鏡
15、記者:你們昨天發佈了Digits,你認為當前非遊戲PC市場最大的未滿足需求是什麼?
黃仁勛:感謝你的提問。讓我先解釋一下Digits。它是一個深度學習GPU智能訓練系統,主要面向數據科學家。現在的數據科學家大多使用PC、Mac或工作站工作。對大多數PC用户來説,運行機器學習、數據科學軟件如pandas或PyTorch都不是問題。
我們最近推出了一款小型設備。它體積小巧,可以放在桌面上,支持無線連接。使用起來就像在操作雲服務一樣方便,相當於一個私人AI雲。為什麼要開發這樣的設備?因為開發者需要頻繁使用計算資源。
如果完全依賴雲服務,成本會很高。現在有了這個設備,相當於擁有了一個私人開發雲。這對那些需要持續進行開發的數據科學家、學生和工程師來説非常有價值。
Digits的發展前景非常廣闊。雖然AI起源於雲端,未來可能仍然以云爲主,但目前的計算設備已經跟不上AI發展的步伐。這就是為什麼我們要開發新的解決方案。
説到超級智能,這其實並不是什麼新鮮事。在我們公司,每個領域都有非常優秀的專家。我身邊都是這樣的人才,我很慶幸能和他們一起工作。我自己只是普通人,但我的管理團隊、領導者和科學家們都是各自領域的佼佼者。
這就是我們即將迎來的未來。你會有各種AI助手幫你完成工作,比如寫作、分析問題、規劃供應鏈、編程、設計芯片等。它們還能幫你做營銷活動和製作播客。這些AI助手隨時待命,為你提供幫助。當然,這項技術的應用非常廣泛。但要記住,是人在使用工具,機器終究是工具。
16、記者:我想問問昨天發佈的新模型產品,特別是小型的模型。這些模型能在智能眼鏡上運行嗎?在開發時你們有考慮過智能眼鏡嗎?因為按照你們的發展方向,智能眼鏡似乎會成為人們體驗AI助手的重要平臺。
黃仁勛:是的,我對能回答「我在看什麼?怎麼去那里?」這類問題的智能眼鏡很感興趣。它可以幫助閲讀,與AI結合帶來的可能性令人興奮。我會這樣使用Cosmos:雲端的Cosmos負責視覺理解,如果要在設備本地運行,就用Cosmos提煉出一個小型模型。這樣Cosmos就成了知識遷移的工具,可以把知識轉移到更小的AI模型中。
這是可行的,因為小型AI模型雖然通用性較差,但在特定領域非常專注。這就是為什麼可以進行定向的知識遷移。我們總是先建立基礎模型,然后逐步提煉出更小的模型。
九、中國車企對智駕趨勢影響更大,5年前還沒有明確把握
17、記者:我想問一個關於自動駕駛汽車的問題。2017年英偉達在CES上展示了一輛演示車,並在5月GDC與豐田合作。從2017年到2025年,這項技術有了哪些變化?當時存在什麼問題,現在又有什麼技術突破?
黃仁勛:我認為,未來所有可移動的設備都會具備自動化功能。不會再有需要人力的普通工作。20年后如果還看到有人開着車回家,那會很有趣,但這顯然毫無必要。未來的汽車雖然保留了手動駕駛選項,但都必須具備自動駕駛功能。現在路上的10億輛汽車幾乎都不能自動駕駛,但20年后,這10億輛車都將具備自動駕駛能力。我們仍然可以選擇自己開車,但這個趨勢已經非常明顯了。
5年前,我們對這項技術的穩定性(Robustness)還沒有把握,但現在已經非常確定了。傳感器、計算機和軟件技術都已經相當成熟。有充分證據表明,新一代汽車,尤其是電動汽車,幾乎都會配備自動駕駛功能。
我認為有兩家公司推動了這個變革,讓傳統車企改變了想法。一個是特斯拉,影響很大,但更大的影響可能來自中國令人驚歎的技術進步。中國新興電動車企的技術非常出色,比亞迪、理想、小鵬、小米、蔚來等等。他們的自動駕駛技術已經發展得很好,現在正在走向全球。這為未來的汽車樹立了標準——必須具備強大的自動駕駛能力。我認為這個行業已經發生了根本性的改變。
技術的成熟和我們對它的認知都需要時間,但現在形勢非常好。Waymo是我們重要的合作伙伴,他們在舊金山的表現非常出色。
十、物理AI成缺失關鍵因素,需打造GPT-3級別物理模型
18、記者:你們昨天發佈產品是個好的開始,但神經渲染面臨的一大挑戰是DirectX中的各種窗口。你們需要做什麼來減少引擎運行的阻力?你們是怎麼和微軟合作的?
黃仁勛:微軟一直很配合我們的開發工作。如果API需要改變,他們都很配合。但我們在DLSS中的大部分工作不需要改變API,主要是要改變引擎。因為這涉及場景的語義理解,不只是簡單的繪製調用。場景主要存在於虛幻引擎、磷火引擎等遊戲引擎中。這就是為什麼DLSS現在已經集成到了一百多個引擎里。
特別是從DLSS 2/3/4開始,一旦完成集成,即使遊戲是為3開發的,也能享受到4帶來的部分改進。所以我們必須為基於場景語義的AI處理搭建管道。這確實是必須要做的事。
19、記者:重大的技術變革從來不是一家公司能完成的。比如互聯網、個人電腦,還有最近的綠色技術。但這些技術最終都會在某個時刻匯聚,帶來巨大的轉變。説到AI,你覺得現在還有什麼缺失的部分會阻礙我們的發展,還是説一切都已經準備就緒了?我知道AI比較複雜,應用方式也很多,但我想知道你認為還有什麼不足的地方。
黃仁勛:讓我從兩個方面説明。首先是語言和認知AI方面。我們正在提升AI的認知能力,讓它具備多模態和良好的推理能力。其次是如何把這項技術應用到AI系統中。AI不是單個模型,而是一個知識系統。Agentic AI就是把各種模型整合在一起——有檢索模型、搜索模型、圖像生成模型、推理模型、規劃模型等。這是一個完整的知識系統。
這幾年,業界不僅在改進基礎AI,也在探索AI的應用。但我們還缺少一個關鍵要素,那就是物理AI。物理AI需要像認知AI那樣有基礎模型。就像GPT-3是第一個達到實用水平的語言基礎模型,讓我們能在上面開發各種功能。
所以我們必須讓物理AI也達到這樣的水平。這就是我們在開發Cosmos的原因。一旦達到這個水平,把模型推向市場,就能激活大量應用場景。有了基礎模型,下游任務就能順利開展。這個基礎模型也可以作為教師模型,就像我們之前説的。這對Cosmos來説很重要。
第二個缺失的部分是我們正在用Omniverse解決的問題——把Omniverse和Cosmos結合成一個物理系統。以物理學基礎,這樣我們就能用這個基礎來控制生成過程,讓Cosmos生成的內容更可靠,而不只是看起來逼真。Cosmos加上Omniverse很可能成為一個重要的突破點。
十一、AI發展沒有物理限制,貿易戰背景下將盡力滿足需求
20、記者:關於貿易戰,現在仍然還比較活躍。你擔心這會影響大家的盈利前景嗎?
黃仁勛:我不擔心。我相信政府能在貿易談判中做出明智的決定。我們要做的就是,無論結果如何,都盡力幫助客户和市場。我們可以再看看形勢的發展。
21、記者:英偉達是如何考慮市場策略的?AI發展的下一步需要什麼? 是否存在物理限制?
黃仁勛:我們只在市場真正需要我們的時候纔會行動,只有當市場存在空白,而且我們確實應該去填補這個空白的時候。我們傾向於做那些與現有市場不同的事情,或者做那些如果我們不做就沒人會做的事情。這就是我們的理念——不要重複別人已經在做的事。我們不是去搶佔市場份額,而是去創造新的市場。
我們不會爲了搶佔份額而進入一個已有的市場,這不是我們的風格。我們更願意開拓全新的市場。比如説,市場上沒有Digits這樣的產品。如果我們不開發它,可能永遠都不會有人開發,因為軟件系統太複雜了。同樣,如果我們不開發高級神經圖形學,也不會有其他人去做。這些都是我們必須承擔的使命。
説到需求,我們當然需要更好的傳感器和攝像頭來解決問題。未來幾年,隨着更先進攝像頭的普及,特別是智能攝像頭和智能眼鏡的出現,我們將收集到海量的視頻數據,這讓我非常期待。
22、記者:我來自以色列。在過去幾年里,AI特別是生成式AI在經濟上有了很大發展。我想請教您,那些參與這個浪潮的公司,它們現在的發展速度是否可持續?短期內能否維持這樣的發展勢頭?
黃仁勛:談到AI的發展前景,就我所知並沒有物理限制。我們之所以能快速推進AI計算,是因為我們能夠統一開發CPU、GPU、NVLink以及所有軟件和系統。如果這些工作分散在20個不同的公司,整合起來會非常耗時。正是因為我們掌握了所有集成技術和軟件支持,才能如此快速地推進系統發展。從Hopper、H100到H200再到下一代,我們將持續提升每個單元的性能。
第二點,由於我們能夠優化整個系統,實際性能提升遠超單純的晶體管性能提升。雖然摩爾定律已經放緩,晶體管性能的代際提升不大,但我們的系統整體性能仍在逐年大幅提升。所以我認為目前沒有明顯的物理瓶頸。
隨着計算能力的提升,幾個重要的擴展定律將繼續發揮作用:首先,研究人員可以用更大的模型訓練更多數據;其次,強化學習和合成數據生成能力會不斷提升。
第三,隨着成本持續下降,應用範圍會進一步擴大。只要沒有物理上的根本限制,AI就會持續快速發展。
十三、與聯發科合作很滿意,未來可能會擴大臺灣公司規模
23、記者:我來自中國臺灣。主題演講提到Digits AI超算CPU正在與聯發科合作。您能談談與聯發科和臺積電等臺灣企業的合作嗎?英偉達還會在臺灣建設總部嗎?
黃仁勛:我們在臺灣有很多員工,但現有的建築太小了。我需要找到解決方案,可能會在Computex上宣佈。我們正在物色地產,如果你知道好地方,請務必第一時間只告訴我一個人。
關於聯發科,我們在多個領域都有合作。比如在自動駕駛汽車領域,我們一起為行業提供完全軟件定義的智能汽車解決方案。
我們在汽車領域的合作非常順利。此外,新的Grace GB10 CPU也是與聯發科合作開發的。我們共同設計架構,實現了芯片間的互聯以及CPU和GPU的內存一致性。
聯發科在設計和製造方面都做得很出色。第一次就做出了完美的芯片,性能優異。大家都知道聯發科在低功耗方面的優勢,確實名不虛傳。我們很高興能與這樣優秀的公司合作。
十四、計算機圖形進入指數增長期,未來所有行業都將經歷如此變革
24、記者:我來自印尼,想請教您對學生學習方向的建議。
黃仁勛:這是個很好的收尾問題。讓我先分享下個人經歷,再談談對新一代學生的建議。我這一代是第一個必須學會使用計算機做科研的世代。上一代人還在用計算器、計算尺和紙筆。我們這代人必須學會用計算機編程、設計芯片、模擬物理。計算機是我們工作的工具。而下一代則需要學會運用AI工作,因為AI就是新時代的計算機。
未來在生物學、林業、農業、化學、量子物理等各個領域,都需要思考如何藉助AI開展工作。在計算機科學領域,則是研究如何用AI推進AI本身的發展。供應鏈管理、運籌學等領域也是如此。
如果想當記者,就要思考如何用AI提升報道質量;想當作家,就要思考如何用AI提升寫作水平。未來每個學生都必須學會使用AI,就像現在的學生都必須會用電腦一樣。
這就是根本區別,也體現了AI革命的深遠影響。這不僅僅關乎大語言模型,AI將融入未來的方方面面。這是最具變革性的技術,發展速度驚人。
感謝大家的關注。對於遊戲行業和玩家們,很高興看到行業從最初用GPU推進AI,發展到現在用AI推進圖形技術。
我們在RTX Blackwell、DLSS 4、神經渲染、神經着色等方面的工作,都得益於AI的進步,現在又反過來推動圖形技術發展。值得注意的是,計算機圖形學原本增長放緩,但AI的加入帶來了超級加速。現在可以實現每秒200-400幀的完全光追畫面。
我們進入了計算機圖形的指數增長期,幾乎每個領域都是如此。這就是為什麼我認為不僅是我們行業,很快所有行業都會經歷快速變革。
感謝大家,新年快樂!