熱門資訊> 正文
2025-01-08 10:33
《Without Your Shotgun》復古又動感的旋律戛然而止,穿着閃亮的新夾克,英偉達CEO黃仁勛走向CES的舞臺中央。
「Are you excited in Las Vegas(你們喜歡拉斯維加斯嗎)?」「Do you like my jacket(你們喜歡我的夾克嗎)?」
而在此之前,整個拉斯維加斯都在屏息以待,直到黃仁勛掏出了RTX 50系列消費級顯卡(GPU),會場才被掌聲與歡呼聲淹沒。
這是黃仁勛時隔多年再次來到CES(Consumer Electronics Show,國際消費類電子產品展覽會)發表主題演講,上一次還是在2019年,他在CES上發佈了RTX 20系列顯卡。
當地時間下午2點,距離活動開始還有4個小時,就有參會者來到了演講會場Mandalay Bay Arena。演講開始前,會場門口已經排起了看不到頭的隊伍,在人羣中,一位觀眾對「甲子光年」調侃:「這幾個小時我已和旁邊人嘮成朋友,再等下去就快成兄弟了。」
全世界的媒體也將目光聚焦在英偉達。
「我主要期待英偉達在芯片、機器人和在汽車方面的新動作。」一位來自日本的電視記者對「甲子光年」説道。而來自印度報業托拉斯的記者Yashita則表示,去年10月英偉達推出印地語AI模型,所以她更關注這次新發佈會對印度AI產業帶來的促進與影響。
這一次,黃仁勛的主題演講有以下重點內容:
發佈史上最快的消費級顯卡RTX 5090;
提出Scaling Law仍在繼續,並表示要創建一個名為Grace Blackwell NVLink72的巨型芯片;
在NIM微服務中新增Nemotron系列模型和用於視頻搜索和摘要的AI代理,入局Agentic AI;
發佈Nvidia Cosmos世界基礎模型平臺,以助推Physical AI的發展;
發佈人形機器人合成數據藍圖Isaac GR00T Blueprint和新一代智駕芯片Thor;
發佈全球最小的個人AI超級計算機Project DIGITS。
FPSolution VC創始合夥人、SpaceX前華裔高管Lewis Hong在聽了黃仁勛的演講后做了一個大膽的推斷:「英偉達接下來也許會直接吃掉所有‘Magnificent 7’的‘餅’,或許*可以跟他們抗衡的只有Elon Musk(埃隆·馬斯克)了。」
「Magnificent 7」指的是當前科技領域*影響力的七家公司:微軟(MSFT)、亞馬遜(AMZN)、Meta Platforms(META)、Alphabet(GOOGL)、蘋果(AAPL)、特斯拉(TSLA)、英偉達(NVDA)。
1小時35分鍾的演講,黃仁勛的每一句話都像是一枚精準投射的芯片,深深嵌入了觀眾的腦中,而這些「芯片」包括了英偉達的陽謀與野心。
一、史上最快的消費級顯卡
在黃仁勛這次演講中發佈的產品中,最受關注的莫過於RTX 5090。
RTX 5090是迄今為止最快的GeForce RTX GPU,在Blackwell架構創新和DLSS 4的加持下,RTX 5090的性能是RTX 4090的2倍。
它在多款熱門遊戲中都表現優異,這些遊戲包括《賽博朋克2077》《黑神話:悟空》等,同時在D5 Render渲染器上也有不錯的表現。
但也有現場觀眾對「甲子光年」表示,這些遊戲的測試結果參考價值有待商榷。比如,《瘟疫傳説:安魂曲》這款遊戲在使用了DLSS 3(NVIDIA的深度學習超級採樣技術第三代)和光追技術(RT)的情況下,RTX 5090的性能提升也不到50%,其相對於RTX 4090的性能提升低於預期,特別是光柵化性能增長幅度較小,光追性能也沒有得到充分驗證。
從參數上來説,RTX 5090擁有920億個晶體管,具備4000 AI TOPS(每秒萬億次操作)的性能,能夠實現380 RT TFLOPS(每秒萬億次浮點運算)的光線追蹤性能,具備1.8 TB/s的內存帶寬,能夠快速地讀取和寫入數據,具有125 Shader TFLOPS的着色器性能。
與RTX 5090 GPU一同發佈的是RTX 50全系列產品,包括RTX 5080、RTX 5070 Ti、RTX 5070等。值得注意的是,與4090發佈時的1599美元相比,售價爲1999美元的5090還是漲價了。
與此同時,搭載了RTX 5070的AI PC也在CES上發佈。這台5070筆記本電腦具有與4090相當的性能,但能耗只有4090的一半。
「很難以置信對吧,我們把一個4090顯卡縮小並塞到了這檯筆記本電腦里!」黃仁勛有些得意地説。
黃仁勛表示,之所以能實現這一技術,是因為英偉達使用Tensor Core(張量計算核心)生成了大部分像素,先回溯需要的像素,然后再用AI生成其他像素,「能源效率已經超出預期,計算機圖形學的未來是神經渲染,它是人工智能和計算機圖形學的融合。」
RTX 50系列AI PC的價格也隨之公佈,其中搭載了RTX 5090顯卡的AI PC售價爲2899美元。
二、超級芯片隊長
發佈完RTX 50系列顯卡后,黃仁勛話鋒一轉,開始大談AI。
在關於Scaling Law是否「撞牆」的討論絡繹不絕的當下,黃仁勛堅信Scaling Law仍在繼續,而且除了Pre-Training Scaling Law(預訓練縮放定律)之外,還出現了后兩個階段的Scaling Law,分別是Post-training Scaling law(后訓練縮放定律)和Test-Time Scaling Law(測試時間縮放定律)。
這個表態並不讓人意外,畢竟Scaling Law與英偉達的生意息息相關。
黃仁勛表示,從ChatGPT到OpenAI o1、OpenAI o3、再到Genimi 1.5 Pro,這些新模型的強大能力都印證了Scaling Law的延續。
在演講現場,黃仁勛還向大家展示了包括液冷、風冷、x86服務器等在內的Blackwell全系列產品。
「當然,我們需要的計算量是驚人的,我們希望社會有能力擴展計算量,以生產越來越多更新、更好的產品。Scaling Law正在推動對Nvidia計算的巨大需求,也推動了對Blackwell架構芯片的巨大需求。」黃仁勛從自己的角度說了大實話。
介紹完Blackwell全系列產品后,黃仁勛拿出了一個巨大的芯片,並擺出了一個驚訝全場的造型,儼然成爲了漫威電影中的「美國隊長」。
他手里拿着的是GB200 NVLink 72的展示樣品。這個巨大的晶圓上有72個Blackwell GPU和144個芯片,擁有14TB的內存,和1.2PB/s的帶寬,AI浮點性能達到了1.4 ExaFLOPS,與上一代相比每瓦性能提高了4倍。
「基本上全世界的互聯網流量都能在這個芯片上進行處理。」儘管聽起來有些誇張,但「超級芯片隊長」黃仁勛就是這麼説的。
三、代理型AI助力企業工作流自動化
基座模型是生成式AI的基石。
在演講現場,黃仁勛推出了基於Llama的一系列模型,包括Llama Nemotron Nano、Super和Ultra。它們涵蓋從PC和邊緣設備到大型數據中心等所有領域。
英偉達還發布了運行在NVIDIA RTX AI PC上的基礎模型,可增強數字人、內容創造、生產力和開發能力。
這些模型都以NIM微服務的形式提供。NIM微服務是由Black Forest Labs、Meta、Mistral和Stability AI等*模型開發商為RTX AI PC開發的關鍵組件,可以部署在RTX PC、工作站和雲端。其用例涵蓋大型語言模型(LLM)、視覺語言模型、圖像生成、語音、用於檢索增強生成(RAG)的嵌入模型、PDF提取和計算機視覺等。
同時,NIM微服務還將與*AI開發和代理框架兼容,包括AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、Langflow和LM Studio。
總結來看,英偉達為幫助生態系統構建代理型AI做了三件事:
Nvidia Nims,它基本上是一個打包好的人工智能微服務;
Nvidia Nemo,本質上是一個數字員工入職和培訓評估系統,英偉達可以幫助客户的數字員工(人工智能代理)做培訓、以適應客户公司的具體業務;
Nvidia AI Blueprints,它提供了一整套藍圖,用於將PDF轉換為播客,以及另一個用於構建視頻搜索和摘要的AI代理。此外,還有四個額外的NVIDIA Omniverse藍圖,使開發人員能夠更輕松地為物理AI構建可用於模擬的數字孿生。
在發佈會現場,黃仁勛還展示了Project R2X。這是一個支持視覺的PC化身,可以將信息放在用户的指尖,協助桌面應用程序和視頻會議通話,閲讀和總結文檔等。
四、AI的下一個前沿是物理AI
演講過半,黃仁勛突然向現場觀眾提出了一個問題。
「想象一下,你正在給大模型做上下文提示,按照我的習慣,我可能會在問問題之前上傳幾個PDF文件。這些PDF被大模型轉換成tokens,因此這些PDF文件可能被轉換成數十萬個tokens,並且通過Transformer的每一層進行處理。但如果我上傳的不是PDF,而是周圍的環境怎麼辦?如果你在上傳之后你給大模型的不是提示,而是一個請求,讓它去某地拿起一個盒子並且把它帶回來怎麼辦?」
黃仁勛其實是想引出AI與物理世界的關係。
「甲子光年」去年5月就曾提出,能源、信息和行為是現代社會和自然界中三個基本而相互關聯的概念——科技的進步,就是三者之間轉化能力加強的反映。隨着AI對物理世界映射能力的不斷優化,其將會在實踐中構建一條AI影響世界發展的動態平衡線。
2024年,讓AI理解物理世界,成爲了AI產業界的新浪潮。
曾經在英偉達工作過的羣核科技董事長黃曉煌告訴「甲子光年」:「這幾年,隨着深度神經網絡的發展,用機器模擬人腦已經獲得了巨大突破,標誌性事件就是ChatGPT的誕生。但我們也意識到,我們發展AI本來是希望AI能替代人類打掃衞生、做家務,現在卻是人類在打掃衞生、做家務,而AI在寫詩作畫。所以,讓AI從虛擬世界走入物理世界,去幫人類執行物理世界的任務,是技術發展的必經之路。」
這次CES上,黃仁勛揭幕了英偉達的下一代重磅產品——Nvidia Cosmos世界基礎模型平臺。
世界基礎模型(WFM),指的是通過輸入多種模態的數據(包括文本、圖像、視頻和動作)來生成和模擬虛擬世界,從而準確地模擬場景中物體的空間關係及其物理交互的模型。
Nvidia Cosmos是一個用來加速物理AI(能夠讓機器人和自動駕駛汽車等自主機器感知、理解和執行物理世界中的複雜動作的AI)開發的平臺,它由一套開源的擴散(Diffusion)和(Auto-regressive)模型組成,用於生成物理感知視頻。這些模型在2000萬小時的現實世界人際互動、環境、工業、機器人和駕駛數據之上訓練而成,包含9000萬億個tokens。
該平臺將模型分爲了三類:
Nano,針對實時、低延迟推理和邊緣部署進行了優化的模型;
Super,針對高性能基線模型;
Ultra,針對最高質量和保真度,最適合用於提煉自定義模型。
具身智能創業者Edward告訴「甲子光年」,他這次最關注的是開源的世界模型,Cosmos World Foundation Model開源模型讓訓練的門檻變低了,對數據的需求減少了,這對於機器人開發非常重要。
「通過‘Sim-to-Real’的方式,我們可以更快地實現像自動駕駛領域那樣的突破。特別是英偉達在這方面的優化,讓‘Sim-to-Real’的質量更高了,這對整個行業的進展幫助很大。」Edward説。
除了幫助生成大型數據集外,Nvidia Cosmos還能通過將圖像從3D擴展到真實場景,縮小仿真與現實之間的差距。將Omniverse(一個用於構建3D應用程序和服務的應用程序編程接口和微服務開發平臺)與Cosmos相結合至關重要,通過其高度可控、物理精確的仿真提供關鍵保障,有助於*限度地減少世界模型常見的幻覺問題。
目前,Nvidia Cosmos已在Github上開源。開發人員可以根據自己的需求,直接使用Cosmos平臺上的模型來生成基於物理的合成數據,也可以用NVIDIA NeMo框架通過自己的視頻對模型進行微調,以適應特定的物理AI設置。
Nvidia Cosmos主要用於機器人和自動駕駛場景,目前,1X、Agility Robotics等機器人公司和XPENG、Uber和Waabi等自動駕駛公司都已經與Cosmos合作開發模型。
「The next frontier ofAIis Physical AI。(AI的下一個前沿是物理AI)」這句話,去年年中黃仁勛就説過,這一次在CES 2025,他又一次面向世界強調了一遍。
五、合成數據與新一代智駕芯片
人形機器人是一個380億美元的超級市場,英偉達自然不會放過這一超級風口,很早就發佈了一系列機器人基礎模型、數據管線和仿真框架,以加速下一代人形機器人的開發進程。
「通用機器人的ChatGPT時刻即將到來。」黃仁勛在演講中下了判斷。
他宣佈英偉達正式推出用於合成運動生成的NVIDIA Isaac GR00T Blueprint,該Blueprint可幫助開發者生成海量的合成運動數據,以便通過模仿學習來訓練人形機器人。
模仿學習是機器人學習的一個子集,它能讓人形機器人通過觀察和模仿人類專家的示範來獲取新技能。在真實世界中收集這些廣泛、高質量的數據集既繁瑣又耗時,而且成本往往高得令人卻步。通過用於合成運動生成的Isaac GR00T Blueprint,開發者只需少量人類示範,就能輕松生成海量的合成數據集。
自動駕駛汽車同樣是英偉達關注的焦點。在演講中,黃仁勛宣佈英偉達推出下一代智駕芯片「Thor」。此前,英偉達Thor芯片原本計劃於2024年年中量產,但后來進度大幅推迟。
1月7日,極氪汽車宣佈,未來新車型將搭載NVIDIA Thor智駕芯片。此外,極氪與自動駕駛公司Waymo基於SEA-M架構聯合開發的全球*量產原生無人駕駛汽車——ZEEKR RT將在2025年開啟大規模交付。
值得注意的是,在現場公佈的將搭載Thor智駕芯片的車企中沒有蔚來,這或許與蔚來去年7月宣佈其自研的智駕芯片「神璣NX9031」正式流片有關。
英偉達還展示了其最新的自動駕駛平臺——Hyperion 9以及DriveOS系統。Hyperion 9平臺基於英偉達最新的Blackwell架構打造,它配備了12個攝像頭、9個雷達、1個激光雷達、12個超聲波傳感器,在傳感器配置和處理能力上都有顯著提升。
六、全球最小的個人AI超級計算機
在演講的最后,黃仁勛發佈了一款令人眼前一亮的產品——AI超級計算機Project DIGITS。
就像變魔術一樣,黃仁勛把一個超級計算機「變小」,然后拿了出來。
該計算機是基於此前的AI超級計算機DGX-1升級而成,但體積更小,功能更強。通過Project DIGITS,用户可以使用自己的桌面系統開發和運行模型推理,然后在加速雲或數據中心基礎設施上無縫部署模型。
Project DIGITS搭載了全新的Grace Blackwell超級芯片(GB10),在FP4精度下可以提供高達1千萬億次浮點運算的AI性能。GB10採用NVIDIA Blackwell GPU,配備最新一代CUDA核心和第五代Tensor核心,通過NVLink-C2C芯片到芯片互連連接到高性能NVIDIA GraceCPU,其中包括20個採用Arm架構構建的節能核心。
GB10超級芯片使Project DIGITS僅使用標準電源插座即可提供強大的性能。每台Project DIGITS都具有128GB的統一、一致內存和高達4TB的NVMe存儲。藉助這台超級計算機,開發人員可以運行多達2000億個參數的大型語言模型,從而增強AI創新。此外,使用NVIDIA ConnectX網絡,兩臺Project DIGITS AI超級計算機可以連接起來,運行多達4050億參數的模型。
正如前文所説,1小時35分鍾的演講,黃仁勛的每一句話都像是一枚精準投射的芯片,深深嵌入了觀眾的腦中。
而這一枚枚芯片又如同種子一樣在觀眾腦海中快速生根發芽,並開出了未來之花。
這是一種很難用語言形容這樣的感受,直到會場里的標語提醒了我們——「Step Into Tomorrow」(走向明天)。
【本文由投資界合作伙伴微信公眾號:甲子光年授權發佈,本平臺僅提供信息存儲服務。】如有任何疑問,請聯繫(editor@zero2ipo.com.cn)投資界處理。