繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

CES開幕前黃仁勛演講排長隊,英偉達計劃做巨型芯片應對AI需求

2025-01-07 15:58

  英偉達CEO黃仁勛的演講掀起了2025年全球消費電子展(CES)的第一波高潮。

  CES開幕前,美國拉斯維加斯當地時間1月6日下午17:20,位於Mandalay bay的大廳已經排起幾條一眼望不到頭的百米長龍。這時距離黃仁勛CES主題演講開始有一個多小時,人們或交談或玩着手機等待演講入場,有人乾脆席地而坐打開電腦工作等待。有現場人士透露,早在下午4點就已經有人來到這里排隊。

  此次登臺的「皮衣刀客」黃仁勛仍穿着黑色皮衣,但與往常的不同,這次的皮衣外觀狀似鱷魚皮,在臺上反射着光。一開場,黃仁勛就笑着問觀眾來到拉斯維加斯是否興奮、是否喜歡他的皮衣。

  黃仁勛的主題演講備受關注。據外界猜測,英偉達此次來到CES,可能會帶來顯卡RTX50系列的更新,並且可能談及人形機器人領域的進展。實際上,英偉達此次發佈的產品比此前外界猜測的更多,不僅包括RTX50系列顯卡,還包括機器人芯片Thor、基礎世界模型Cosmos,黃仁勛在臺上還抱起一個巨大的芯片模型表示,英偉達計劃造一個巨型芯片,使用72個Blackwell GPU。

  黃仁勛此次透露的消息還包括:人工智能發展所依據的Scaling Law(縮放定律)繼續生效、人類正在產生更多可供訓練用的數據、Blackwell芯片正在全力生產、2026財年英偉達汽車業務預計增加到50億美元收入。

將造巨型芯片

  今年CES,AI是絕對的主角。早在2024年10月,CES就官宣了CES2025開幕前夜主題演講的重磅嘉賓——英偉達CEO黃仁勛。按照慣例,CES開幕前夜的演講被「非官方」地看作是整個展會的「開幕致辭」,也是重要的風向標。

  或許和不久前發生在拉斯維加斯的特朗普酒店爆炸案有關,當日進入會場前工作人員進行了嚴格的安檢。記者在現場看到,等候入場的隊伍根據合作伙伴、分析師等分為多條。分析師隊伍中,不少人在討論黃仁勛可能會講什麼,以及討論關於英偉達的「護城河」問題。雖然也有分析師提到其他芯片選擇,但目前來看還是很難和英偉達的GPU較量。

  從往屆看,2017年,英偉達在AI和自動駕駛技術方面的表現受到外界關注時,黃仁勛就曾在CES演講臺上出風頭,這也標誌着消費電子行業的新篇章開啟。一位當年的參會人士對記者回憶,當時的演講會場人滿為患,現場掌聲不斷,不少人是圍在會場門口聽完了他的演講。

  此次站上「AI風口」的黃仁勛,其演講也備受期待,演講中頻頻響起觀眾的掌聲,黃仁勛透露的信息豐富度也頗高。

  與此前外界預測相符,黃仁勛透露了消費級遊戲顯卡更新,發佈了採用Blackwell架構的新顯卡GeForce RTX50系列。Blackwell架構最初推出時,是用於AI場景使用的GPU,現在也用到了消費級遊戲顯卡上。黃仁勛説,英偉達以往用GeForce賦能人工智能,而現在可以用人工智能革新了GeForce了。具體而言,在GPU上運行的神經網絡可以推斷和預測未被渲染的像素,生成額外的幀,最終形成流暢畫面。RTX5090 D GPU有920億個晶體管,性能是RTX4090 D GPU的2倍。

  從具體性能和價格看, RTX5090顯卡AI算力3400 TOPS,價格1999美元。TRX5080、RTX5070Ti、RTX5070顯卡AI算力分別為1800 TOPS、1400TOPS、1000TOPS,價格分別為999美元、749美元、549美元。RTX50系列顯卡將於今年1月開始面世,用於筆記本的RTX50芯片將於3月開始上市。

  市場此前沒有準確預料到的是,此次英偉達也針對AI芯片產品宣佈了諸多更新,並透露了不少生產進度信息。黃仁勛表示,英偉達的Blackwell芯片正在全力生產中,主要雲服務提供商均已建立相關係統,大概有15家電腦廠商已經推出了約200種不同型號和配置。

  英偉達準備推出巨型芯片和最小的個人AI超級計算機,成為此次演講中頗具亮點的信息。臺上,黃仁勛舉起一個很大的芯片模型向觀眾展示,這個芯片幾乎遮住了他的上半身。他透露,英偉達計劃做一個名為Grace Blackwell NVLink72的巨型芯片,該芯片將使用72個Blackwell GPU,有130萬億個晶體管,重量達1.5噸,有60萬個零部件,大約相當於20輛汽車,功耗120千瓦,芯片背后有一根「脊柱」連接所有部件。這個芯片還包含5000根銅纜,總長度達2英里。這個芯片有14TB內存,內存帶寬為每秒1.2TB,基本上相當於全世界互聯網上的所有流量都能在此處理。

  黃仁勛説,這是有史以來最大的單一芯片,該芯片已經在全球45家工廠中生產,英偉達會將部件拆卸並送往各個數據中心重新組裝,「我們需要的計算量是相當驚人的,如果我們必須建造一艘‘船’,這基本上就是一艘‘巨輪’。」

  通過做小型AI計算機,英偉達的AI佈局也延伸到了更細分的AI計算場景。黃仁勛透露,英偉達正在開發一個名為「Project Digits」的計算機項目,搭載了英偉達還在研發的超級芯片GB10,這個芯片採用Blackwell架構,在FP4計算精度下最高可提供1 PFLOPS AI算力,這個計算機則將成為全球最小的AI超級計算機。這款計算機面向數據科學家、AI研究人員、學生等。

機器人芯片Thor面世

  黃仁勛此次演講也談及一些AI領域的熱點話題。此前業界掀起過關於Scaling Law失效的討論,認為AI模型演進放緩。「經過研究人員驗證的Scaling Law還在繼續生效,這個規律意味着訓練數據越多、模型越大、計算量越高,模型能力就越強。」 黃仁勛此次則釋放了信心。

  關於AI的範式變化,黃仁勛稱,Scaling Law已從預訓練階段(Pre-training scaling)走向后訓練階段(Post-training scaling),現在又走向了測試階段(Test-time scaling「reasoning」)。后訓練階段的Scaling Law使用了強化學習技術和人類反饋的數據,類似於一個人持續嘗試直到做出正確答案,可以更好解決數學問題並更好地進行推理。測試階段的Scaling Law則可以通過資源分配的方式改進模型表現,而不是通過改進參數的方式。

  「現在,(模型效果)取決於要使用多少計算量來產生所需答案。長時間思考是得出問題答案的一種方式,不需一次性回答。(做法)可以是將問題分解為多個步驟,你可能會產生多個想法,AI系統則會評估想法中哪個是最好的。現在測試時間縮放(Test-time scaling)已被證明非常有效。」黃仁勛説。

  業界也在關注數據缺乏是否會阻礙模型演進。黃仁勛的判斷也較為樂觀,他表示,人類每年產生的數據量是上一年的兩倍。接下來幾年中,人類會產生更多數據,超過以往人類已產生的所有數據,而且這些數據還擁有更多模態,包括視頻、圖像、聲音。

  相比文字領域的大模型,業界還在期待機器人領域更好的模型出現。黃仁勛的判斷是,機器人領域需要不同的模型。機器人需要的是接收請求后輸出動作(action tokens)而非文本(text tokens),所需模型不是GPT這種語言模型,而是世界模型。這個世界模型必須理解重力、摩擦力、慣性、幾何空間關係、因果關係以及物體永存性,「就像一個球從檯面上滾動,滾出畫面,這個球依然存在。」而現在大多數模型都很難理解這些規律。

  據此,黃仁勛表示,英偉達推出了可理解物理世界的世界基礎模型Cosmos,Cosmos可以接受文本、圖像或視頻的提示輸入,生成虛擬世界狀態,可用於自動駕駛汽車(AV)和機器人等物理人工智能系統的開發。Cosmos可以生成合成駕駛場景,將訓練可用的數據提高几個數量級。

  此前,有人形機器人業內人士向記者表示,人形機器人單個算力芯片的最高近300TOPS,這個算力遠遠不夠,預計人形機器人所需算力在200TOPS以上,英偉達下一代機器人芯片Thor的算力將達到2000TOPS以上。此次,黃仁勛透露了新進展,即新的Thor芯片正在全力生產,其處理能力是上一代Orin芯片的20倍。Thor是一個通用的機器人計算機平臺,除了汽車,還可用於AMR機器人、人形機器人等。

  爲了本屆CES做了大量準備的不只英偉達,其他芯片廠商也摩拳擦掌,一場圍繞AI的比拼已經開始。黃仁勛演講前,當地時間今日上午,AMD英特爾等競爭對手已在CES發佈新品。第一財經記者看到,在拉斯維加斯街頭建築的大屏幕上,高通投放了驍龍芯片相關的AI廣告,在拉斯維加斯的小火車車身上,英特爾投下了AI PC的相關廣告。

  當天英特爾發佈了全新英特爾酷睿Ultra處理器(第二代),最新產品的亮點還是在於AI功能的增強, 與上一代HX系列處理器相比,英特爾酷睿Ultra 200HX系列的多線程性能提升達41%6。在整個平臺上,全新處理器的GPU、CPU和NPU能夠帶來高達99 TOPS的算力。

  英特爾臨時聯合首席執行官兼英特爾產品首席執行官Michelle Johnston Holthaus來到CES,並評價這是x86架構在塑造個人計算的未來,英特爾會在2025年繼續推動發展AI PC的產品組合,並且會在2025年下半年批量生產向客户展示的採用英特爾18A製程工藝的產品。

  AMD則發佈和展示了包括鋭龍9000X3D、鋭龍9000HX、鋭龍AI 300、鋭龍AI Max、以及鋭龍Z2系列等在內的諸多新品,覆蓋臺式機、筆記本以及掌機等產品線。其中最搶眼的是鋭龍AI Max和AI Max+筆記本芯片。該芯片擁有多達40個基於RDNA 3.5架構的計算單元(CU),搭載16個Zen 5 CPU內核和32 個線程,配有一個帶寬為每秒256GB 的新內存接口,支持高達128GB的內存供CPU、GPU和XDNA 2 NPU AI引擎共享。AMD還將揭祕代號為「Fire Range」的HX3D移動處理器,具體發售日期將會是2025年上半年。

  (實習生屠佳若對此文亦有貢獻)

  (本文來自第一財經)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。