熱門資訊> 正文
2025-01-08 16:46
21世紀經濟報道記者倪雨晴 拉斯維加斯報道
在CES 2025主題演講中,英偉達大秀了一系列AI新品。
CES是消費電子主場,此次英偉達也是以消費級顯卡GeForce RTX 50系列打頭陣,同時公佈了巨型芯片Grace Blackwell NVLink72、小型超級計算機Project DIGITS、世界基礎模型平臺Cosmos等。
雖然是消費端產品居多,但是技術新詞也不少。美西時間1月7日,CES開幕當天,黃仁勛接受了21世紀經濟報道等媒體的採訪,對前一日發佈的新品進一步解讀,也談到了AI的新趨勢。
當黃仁勛踏進採訪間,他率先拿起的是Project DIGITS,愛不釋手地説這很「cute」,並表示大家可以使用這台AI超級計算機。
採訪中,黃仁勛也對DIGITS再釋義,DIGITS是「deep learning GPU intelligence training system」(深度學習GPU智能訓練系統)的縮寫。他坦言這款產品更適合科學家、開發者等使用,但是他認為DIGITS潛力巨大,因為「人工智能可以開啟一個新篇章,它把世界上的計算機拋在后面。」
有意思的是,縱觀英偉達過去的發展歷史,其實他最早就是希望作為一家to C的公司,比如之前做遊戲主機。但現實卻相反,他選擇了做算力的提供方。現在,通過DIGITS這樣的「電腦主機」,又開拓了偏C端的AI PC路徑。
一位AI業內人士向21世紀經濟報道記者表示:「從這款產品看,英偉達更多的是對產業鏈進行整合,既包括對Arm架構的應用、自己的全新框架系統的整合,也包括GPU、CPU的能力整合,這是對於自身產品能力外溢的一種自信和體現。這條產品線對於英偉達來説是一家性價比比較高的戰略選擇,並不會消耗太多的成本,因為大部分技術框架都是現成的,只不過是再豐富一條產品線,但是會對AI PC市場產生影響。」
另一方面,隨着AI應用不斷涌現,推理成本也成為關注焦點。黃仁勛談到,英偉達通過不斷提升硬件性能(如Blackwell GPU系列)和優化計算架構,大幅提高AI推理性能並降低成本。例如,新一代GPU的推理性能較上一代提升30到40倍,從而顯著降低了數據中心的運行成本。此外,隨着算力增強,訓練和推理中的數據和模型精度不斷提高,也推動了整個行業的發展。
談及AI目前的發展速度是否可持續時,黃仁勛表示,從他所知的情況來看,沒有任何物理限制阻礙這種發展。之所以能夠如此快速推進AI計算,是因為英偉達具備高度集成的能力,能夠將CPU、GPU和主板整合在一起。
黃仁勛也多次説到了三個「scaling law」,它們共同推動AI的發展,並且不斷降低成本,他認為AI計算的發展可以非常快速地持續推進。
此外,黃仁勛一如既往地看好機器人、自動駕駛,他認為未來幾乎所有的車都會具備自動駕駛能力。同時黃仁勛對智能眼鏡和AI技術的結合表示感到興奮,這種設備可以通過雲端的Cosmos模型支持,將複雜AI能力壓縮為小型模型,用於實時分析和交互。
採訪最后,黃仁勛再次強調了GeForce顯卡系列和AI相輔相成的關係,過去是AI GeForce助力了AI的發展,現在AI又反過來加速革新GeForce。
以下為21世紀經濟報道記者整理的核心問答:
記者:去年你定義了一個全新的計算AI框架,你認為現在是時候重新考慮基礎設施和系統組件的優化了嗎?
黃仁勛:確實如此。我們關注那些極具挑戰的領域,比如AI計算中最困難的部分。我們通過提升AI的計算密度來優化系統。無論運行速度多快,我們始終希望實現更高效的能耗比。
記者:雖然英偉達發佈了AI PC相關產品,但是今年相關產品銷量並未大幅增長,英偉達是否有能力改變這一現狀?
黃仁勛:AI的開發最早是在雲端完成的。過去幾年里,應為的增長主要來自雲端,雲端AI已經變得非常強大,尤其是在處理複雜的大型模型時。例如,這些模型非常龐大,適合在數據中心運行和部署。
然而,我們仍然認為,有許多設計師、軟件工程師、創作者和AI愛好者更喜歡在個人電腦上工作。問題在於,目前AI的大部分開發都需要在雲端進行,涉及大量的數據傳輸和計算,而這對很多人來説並不方便。
幸運的是,Windows系統中的WSL 2(Windows Subsystem for Linux)提供瞭解決方案。這是一個虛擬化環境,可以在Windows上運行第二操作系統,並支持Docker容器。通過確保AI技術能夠在PC上的WSL 2環境中運行,我們可以將雲端的計算能力帶到個人電腦上。
我們正在努力推動這一轉變,我認為這就是正確的解決方案,我感到非常興奮,開發者們能夠利用Windows加上WSL 2在本地運行AI模型。
記者:發佈會宣佈了諸多進展,對於那些可能對AI缺乏瞭解的聽眾來説,你是否能用更簡單的方式解釋這些概念?
黃仁勛:作為一家科技公司,我們技術在影響並推動未來的消費者電子領域發展。昨天一個重要的宣佈內容是,我們推出了一個名為「Cosmos」的基礎模型。正如GPT專注於語言的基礎模型、Stable Diffusion專注於圖像,Cosmos是一種能夠理解物理世界的模型。
它可以理解摩擦力、慣性、物體存在感以及幾何和空間關係等物理屬性。這些是兒童都能理解的物理現象,但當前的語言模型卻無法處理。我們相信需要一個能理解這個物理世界的基礎模型。
一旦Cosmos建立起來,它就能像GPT和Stable Diffusion那樣支持許多應用。例如,您可以對Cosmos模型説,「告訴我這個房間里現在的情況」,它可以基於攝像頭看到的信息回答你。
總之,Cosmos是一個理解物理世界的模型。它的意義在於,只有讓AI理解物理環境,AI才能在現實世界中做出有意義的操作。自動駕駛汽車需要理解物理世界,機器人也需要理解物理世界。因此,Cosmos這樣的模型是實現多模態的起點。
就像GPT模型推動了人工智能應用的發展,Llama對於人工智能的各種活動至關重要,而Stable Diffusion則激發了圖像和視頻生成模型的發展一樣,我們期望Cosmos能夠成為推動下一波人工智能創新的關鍵。
記者:你提到了scaling law,特別是測試時間計算方面。但是計算成本變得非常昂貴,有些運行需要耗費數千美元。英偉達如何應對這些高昂的成本?是否有解決方案可以讓推理計算更具成本效益?
黃仁勛:解決推理計算性能和成本問題的直接方法是提升我們的計算能力。這也是為什麼我們推出了Blackwell GPU NVL 72,其推理性能相比Hopper提升了30到40倍。通過這種提升,我們將推理計算的單位成本降低了同等幅度,因為數據中心的其他開銷基本保持不變。
從歷史上看,計算技術的進步一直依賴於降低計算成本。過去20年,我們將邊際計算成本降低了約100萬倍,使得像機器學習這樣的技術成為可能。同樣的趨勢也會發生在推理階段:通過不斷提升性能,推理成本將會繼續下降。
此外,我們還有一種方式。今天,許多測試時間計算階段的輸出會變成預訓練、后訓練模型的輸入數據。這些數據會被用於后續的模型改進,這種方法不僅降低了訓練和推理的綜合成本,還能讓模型變得更加智能。當然,這一過程需要時間。因此,這三種scaling law將會並存一段時間。
一方面,我們會努力提升所有模型的智能水平,另一方面,人們會不斷提出更加複雜的問題,並期待得到更加智能的回答,這個循環將會持續不斷地進行下去。
記者:你提到英偉達正在增加以色列的投資,並在當地擴展業務。您能談談英偉達未來在以色列的計劃嗎?
黃仁勛:我們幾乎從全球各地招聘頂尖人才。目前,我們的公司在全球範圍內收到了超過100萬份求職簡歷,而我們只有大約32000名員工。在以色列,我們從最初收購Mellanox時的約2000名員工,增加到現在的近5000名員工。英偉達是以色列增長最快的僱主之一。
在過去幾年里,以色列團隊開發了NVLink、SpectrumX,我為團隊感到自豪,但是今天沒有新的合作或投資宣佈。
記者:我們注意到英偉達最新的旗艦顯卡RTX 5090和RTX 5080之間存在較大的性能差距。5090的核心數量是5080的兩倍,而價格也高出一倍。為什麼會設計出這樣大的差距?
黃仁勛:原因很簡單,總有一些用户想要「最好的」。如果我們提供稍差一點、便宜100美元的產品,他們也不在乎。對於他們來説,最重要的是品質。當然,2000美元的花費不算小,但其價值是值得的。
但請記住,這些技術通常被用於家庭影院級的環境。這些用户往往已經在顯示器和音響系統上投入了上萬美元,因此他們也希望配備最好的GPU。我們的很多客户都有這樣的需求,他們願意爲了獲得頂尖性能而投資更多。
記者:AI在PC遊戲中越來越重要,你是否認為未來傳統的實時渲染會完全被AI生成的內容取代?
黃仁勛:不會。還記得有人首次提出:「為什麼不直接用ChatGPT生成一本書?」當時內部沒人預料到這一點。原因在於,你需要為它提供基礎,這就是條件反射的概念。
AI生成的內容需要「條件」或「上下文」作為輸入,而這些條件的生成仍然需要傳統渲染技術。例如,在視頻遊戲中,爲了生成符合場景的AI內容,系統需要先提供初步的幾何形狀、紋理和光照信息。這些信息構成了AI生成內容的「上下文」。
記者:毫無疑問,超大規模企業對產品的需求是存在的,能否具體説明一下貴公司在擴大收入基礎、吸引企業客户方面的緊迫感,尤其是在亞馬遜等公司開發AI芯片的背景下,政府建設自己的數據中心以與超大規模雲服務商競爭。你感受到的緊迫性有多強?能説明一下在企業和政府方面的需求或進展嗎?
黃仁勛:我們的緊迫感源自於為客户服務,我從不為某些客户也在開發其他芯片而感到困擾。我們只是在做不同的東西。我很高興他們在雲端使用NVIDIA,也很高興他們使用NVIDIA來開發他們的AI,我認為他們做出了好的選擇。我們的技術發展速度非常快,每年性能翻倍,同時成本也幾乎減半,這比摩爾定律的速度還要快。
目前,企業的關鍵在於兩個行業的服務,軟件行業和解決方案工程師,后者幫助客户將軟件適配到業務流程中。我們的戰略是與這兩個生態系統合作,幫助它們構建具有自主能力的AI。
總之,過去一年我們在構建自主AI工具包方面取得了很大進展,現在關鍵是如何部署這些技術並加速應用。
記者:你提到了Agent AI,像AWS、微軟、Salesforce這樣的公司,這些公司也有平臺,你們是如何合作的?
黃仁勛:我們不是一家虛擬企業公司,而是一個科技平臺公司。我們將構建工具包、庫和模型。我們關注ServiceNow、SAP、Oracle、Synopsys、Cadence和西門子等公司,他們在垂直領域很專業,但他們並不希望將精力投入到計算層和AI庫的開發上。因此,我們為他們提供了這一解決方案。
我們開發了NIM和NEMO技術,如果我們的CSP(雲服務提供商)希望使用它們——實際上許多CSP已經在使用了——他們可以用來訓練他們的語言模型。我們為行業創造了這些庫,這樣他們就不需要自己去做,不需要重複構建這些東西了。
記者:你發佈了Project DIGITS,你怎麼看待非遊戲PC市場中的一些最大未滿足的需求?
黃仁勛:DIGITS代表的是 「deep learning GPU intelligence training system」。Digits是一個面向科學家和機器學習工程師的平臺,今天,他們使用PC、Mac或工作站來進行這些工作。坦率地説,對於大多數人來説,用PC進行機器學習和數據科學,可能並不適合。
現在,我們有了一款小設備。它可以放在你的桌子上,像你與雲端互動一樣,它是無線的。它就像是你自己的私人數據中心。為什麼你不想擁有類似的設備呢?你可以用它來進行機器學習模型的開發。如果你一直在雲端工作,雲端的延迟非常高。所以,我們使得擁有個人開發環境變得可能。
這對科學家和學生們來説,你可以隨時讓系統保持運行。我認為,等待着Digits的是巨大的潛力市場,因為人工智能可以開啟一個新篇章,它把世界上的計算機拋在后面。
記者:自動駕駛領域,與2017年相比,2025年行業有什麼區別?2017年遇到的問題是什麼?而2021年的技術創新是什麼?
黃仁勛:首先,未來所有的移動設備都會實現自動化。在未來,大多數汽車你仍然可以選擇駕駛,但所有的汽車都有能力自動駕駛。
5年前,這項技術是否能強大並不確定,但現在技術,傳感器技術、計算機技術和軟件技術已經非常成熟。我認為現在有太多證據表明,新一代汽車,尤其是電動汽車,幾乎每一輛都承諾具有自動駕駛能力。這些技術不再是實驗性質,而是正在廣泛落地。
特斯拉無疑是這個領域的領導者之一,但我們也看到來自中國的創新正在快速崛起。例如比亞迪、小鵬、蔚來、小米等公司展示了非常先進的技術水平。這些公司在汽車行業中設立了新的標準,證明了自動駕駛和電動車技術的潛力。
我認為世界已經發生了變化。雖然技術成熟的過程花費了一些時間,我們的認知也在不斷發展,但現在我認為,自動駕駛的未來已經非常接近現實。
記者:問一個關於昨天宣佈的新模型的問題,能否在智能眼鏡中運行?
黃仁勛:我對能連接到雲端的智能眼鏡感到非常興奮,它還涉及到你能夠連接到虛擬現實技術、可穿戴技術,這一切都非常酷。如果你沒有把大模型放在設備本身中,那麼你就可以使用Cosmos在雲端提供內容,它的規模很小。因此,Cosmos成爲了一個知識傳遞工具,它將知識轉移到一個更小的AI模型中。
之所以能做到這一點,是因為這個更小的AI模型高度專注,可以實現更精準的知識轉移。是的,你仍然可以蒸餾出更多、更小的模型。這也是為什麼我們一開始會從構建一個基礎模型開始,然后再逐步構建更小的模型。這種方式使得整個模型架構更加高效並減少失真。
記者:有關於貿易和關税的問題,政策可能會影響到所有人,你對此有何擔憂嗎?
黃仁勛:我不擔心這個,我相信政府會為自己的貿易談判做出正確的決策。我們會根據情況做好自己能做的。
記者:AI目前的發展速度是可持續的嗎?是否有可能在短期內保持這種增長?
黃仁勛:從我所知的情況來看,沒有任何物理限制阻礙這種發展。我們之所以能夠如此快速地推進AI計算,是因為我們具備高度集成的能力:我們能夠將CPU、GPU和主板整合在一起。
同時,我們還將所有的軟件和系統整合在一起。如果這需要由20家不同的公司來完成,並且需要相互集成,那會非常耗時。但因為我們在硬件、軟件和系統層面都實現了一體化支持,所以我們可以非常高效地推進系統的發展。
其次,由於我們能夠跨整個系統進行優化,性能的提升遠遠超過了僅靠晶體管密度提高所能實現的幅度。摩爾定律的進展速度已經放緩,但通過系統級的優化,我們的整體性能提升依然非常顯著。
我認為,這種發展沒有物理上的限制。隨着計算能力的提高,研究人員可以使用更多數據訓練更大的模型。同時,合成數據生成技術(synthetic data generation)也在持續擴展。我們有三個scaling law ,它們共同推動AI的發展,並且不斷降低成本。因此,我認為AI計算的發展可以非常快速地持續推進。
記者:你提到了英偉達與聯發科、臺積電等中國臺灣公司的合作,能否分享一下你在中國臺灣的業務計劃?
黃仁勛:我們在中國臺灣有很多員工,我們的辦公樓已經不夠用了,我需要找到解決辦法。
我們與聯發科在多個領域有合作,其中包括自動駕駛相關的軟件開發。我們還共同開發了一款集成芯片,將CPU和GPU無縫結合。聯發科的團隊在設計芯片時與我們密切合作,做得非常出色。事實上,這款芯片的硅片第一次流片就非常成功,展現了聯發科在低功耗芯片方面的卓越能力。我們非常高興能與他們合作。
記者:關於教育方面,我想知道學校和學生應該學習哪些知識和技能,以應對未來的發展需求?
黃仁勛:我這一代人是第一代必須學習如何使用計算機來完成科學工作的羣體。在我們之前,人們只使用計算器、滑尺和紙筆。而我的一代人學會了用計算機編寫軟件、設計芯片以及模擬物理現象。我們用計算機完成了我們的任務。
下一代人將是第一批學習如何使用AI完成工作的羣體。AI就是新一代的計算機,每個領域都需要學習如何使用它。無論是生物學、農業、化學還是量子物理學,AI都將成為不可或缺的工具。未來的每個學生將需要學習如何使用AI,就像今天的學生必須學習計算機一樣。這種轉變說明了AI革命的深遠影響。
AI不僅僅是關於大型語言模型,它將成為未來幾乎所有領域的一部分。這是一項極具變革性的技術,發展速度非常快。我非常感謝你們對這個領域的興趣,以及您們對推動行業發展的支持。
如果你觀察計算機圖形領域的摩爾定律曲線,你會發現它實際上已經開始減速了。但隨着AI的加入,整個行業得到了極大的推動,性能提升進入了指數增長的軌道。
現在,幀率已經達到了每秒200、300甚至400幀,同時所有的圖像都實現了光線追蹤,效果極其美觀。AI技術徹底改變了計算機圖形領域的增長趨勢,我們正在見證一條全新的指數增長曲線。這不僅僅侷限於計算機圖形領域,它幾乎影響了每一個行業。
這就是為什麼我們的行業會發生如此迅速的變化,而其他行業也會隨之快速變革的原因。