繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

下注NPU、發佈跑一萬參數大模型的服務器,高通、AMD芯片大廠都在「爭」什麼?丨智湧要聞

2024-06-09 12:18

作者丨邱曉芬

編輯丨蘇建勛

為期三天的2024年臺北電腦展(Computex 2024),6月7日已落下帷幕。在這一次的展會上,AI成為貫穿一切的主題。英偉達、AMD、英特爾、高通等芯片大廠的話事人們紛紛做了主題演講,也讓這次展會的參與人數比上一屆暴漲了 80%。

除了用主題演講表明對於未來AI的立場之外,各大芯片大廠或秀出了自己的新產品,或公佈了未來的產品路線圖。而這些公司在展會上的一舉一動,也刺激着他們的股價表現。

在臺北電腦展舉辦之前,芯片大廠們的股價已經有了不同程度的提振;而在為期三天的展會期間,AMD、英偉達的股價雙雙增長了4%左右,高通的股價也有 3%的提升,Arm更是有10%的股價提升。

在Computex 2024上,各大芯片大廠在「鬥」什麼?背后又藴藏着各家什麼思考?這又將如何影響未來的行業走勢?

Computex 2024

AMD:迎戰英偉達,CPU+NPU+GPU多面下注

相比於英特爾在GPU產品線上的「保守」,AMD這次在Computex上顯得相當激進,策略是在CPU、NPU、GPU方面同時下注。

比如,在AI服務器芯片領域,此次AMD發佈了重磅的Instinct MI325X,並且計劃在2024年四季度上市。AMD還直接把英偉達不久前發佈的H200拉出來對標,在最關鍵的性能、內存、帶寬等參數上全面發起進攻。

根據介紹,相比英偉達H200,AMDInstinct MI325X的計算性能是其1.3倍、內存容量是其2倍、帶寬是其1.3倍。

能夠跑多大的模型,也是當下這些先進GPU面臨市場考覈時的一大考覈標準。據AMD方面介紹, 一臺搭載着AMDInstinct MI325X的八卡服務器,最多可以跑一萬參數的大模型,是同等條件下英偉達H200服務器的雙倍。

在此次展會上,AMD創始人蘇姿豐也首次罕見明確了未來AMD在GPU上的產品節奏——每年都會迭代一款新的產品,2024年年底是AMDInstinct MI325X,2025 年將發佈Instinct MI350X系列。

而值得注意的是,在不久前英偉達的財報會議上、以及此次的展會上,英偉達黃仁勛也都恰好也提及了,在 Blackwell芯片之后,英偉達也將保持一年一迭代的產品節奏。雙方火藥味頗濃。

lisa su發佈Instinct MI325X

這也不難理解,AMD MI系列的芯片未來是支撐起他們營收的一大關鍵點。根據AMD方面此前樂觀預計,在2024年年底,數據中心GPU將給AMD帶來高達20 億美元的收入。蘇姿豐此前也暗示,這顆芯片得到了行業的廣泛關注和好評。

在此次Computex上,AMD除了抓住數據中心的機會,另一手還抓住了AI PC在端側的機遇,發佈了兩款王炸產品。

此次,他們發佈了AMD Zen 5架構的鋭龍9000系列桌面處理器,這顆處理器被AMD方面自封為「地表最強消費級CPU」。

由於基礎架構的升級,這顆處理器的性能有了大幅度提升。AMD官方專門把英特爾的酷睿 i9-14900K拉出來做了對比。AMD的這顆芯片在遊戲場景中的速度快了 4%-23%,測試速度快了 7%-56%。

這次,AMD還秀了他們的朋友圈,惠普、微軟、聯想等PC廠商都即將推出搭載這顆芯片的筆記本產品。

去年以來,爲了加強AI PC在端側的計算能力,AMD還嘗試開闢出獨立的NPU產品,集成到他們的CPU上——早在去年,AMD發佈了首顆集成了NPU的 X86處理器(鋭龍 7040系列)。

但在此次展會上,AMD的NPU的計算能力有了超強升級。據AMD方面介紹,AMD鋭龍AI 300系列上搭載的NPU,可以提供超過 50TOPS的AI算力——紙面上是上一代產品的5倍。

一邊迎戰英偉達,一邊掣肘英特爾,是AMD如今的雙線策略。

英偉達:畫了餅,但股價炸了

這次Computex上,英偉達不像英特爾、AMD一般發佈新產品,黃仁勛的演講基本是重新介紹了他們不久前在GTC上的產品和服務細節(包括NIM微服務、AI工廠等等)。

「炒冷飯」之余,黃仁勛也透露出了更重要的信息點,公佈了他們產品未來的規劃——

據他介紹,英偉達將在2025年推出Blackwell芯片的迭代版本,Blackwell Ultra AI芯片,並在2026年更新下一代全新架構Rubin,在2027年推出基於這一全新架構的升級版Rubin Ultra。

黃仁勛還稍微透露了全新架構Rubin的結構:全新的GPU、新的基於Arm架構的CPU、配備NVLink 6、融合InfiniBand或以太網交換機的先進網絡。

這也意味着,英偉達將會繼續在高算力這一條路上矇眼狂奔。而股價也給予了相應的反饋。在展會期間,英偉達的股價衝上了三萬億美元的大關,超越了蘋果,僅次於微軟。而英偉達股價飆升也堪稱火箭速度,值得注意的是,在一年前,英偉達的股價還沒有超過1萬億美元。

英特爾:鞏固數據中心市場,開發存量

在過去,隨着AI大模型的普及千行百業,數據中心的一大趨勢是出現多元化算力,GPU逐漸稱為AI服務器的一項關鍵部件——一般情況下,一個AI服務器的芯片配置一般是1-2個CPU,再搭配8塊的GPU。

與此同時,AI服務器在數據中心的依舊保持高增長態勢,IDC此前數據顯示,2023年中國加速服務器市場中,GPU服務器佔據了九成市場。這一市場趨勢之下,GPU的增長勢頭遠遠蓋過了CPU。

英特爾雖然也在佈局GPU的產品,但主力還是放在鞏固他們在CPU的傳統優勢,開發服務器的存量市場。

這其實也不難理解,一位行業人士告訴《智能涌現》,由於GPU服務器的價格太高,目前對於一些數據量不大的模型,行業中也在嘗試用表現更好的CPU來覆蓋一部分AI計算任務。

此次,英特爾發佈了他們的新一代數據中心芯片「至強6」。

英特爾至強 6

「至強 6」分為兩個版本:性能核(E核)和能效核(P核),分別側重高性能和低能耗,讓用户根據實際使用訴求取用。這顆芯片是基於英特爾的 Intel 3製程工藝生產而成。

有「電老虎」之稱的數據中心,能耗一直是行業在持續攻堅的難題,這正是此次「至強 6」的一大賣點。據英特爾方面介紹,和上一代產品第五代至強處理器相比,「至強 6」的功效能耗比大大提升——最高可以節省280w功耗,四年的時間,能夠減排二氧化碳34kmt。

爲了開發存量市場,這次「至強 6」也能帶來更強大的服務器機架整合能力,幫助老客户進行老服務器產品的升級。比如,此前使用英特爾第二代至強可擴展芯片需要200個機架,但「至強6」只需要66個,機架整合率3:1。

這意味着,數據中心可以節省更多空間的同時,還能進一步獲得更高的算力。據英特爾方面介紹,相比於此前的服務器芯片,「至強 6」最多有4.2 倍的性能提升。

在GPU產品上,不久前英特爾已經發布了Gaudi3,但在此次Computex上,英特爾雖然沒有公佈太多產品進展,但英特爾CEO基辛格還是在演講中暗搓搓提示——他們的Gaudi3,未來會比競爭對手更便宜。

英特爾CEO基辛格

高通和微軟:「Copilot+PC」從概念走向現實

不久前,微軟在開發者大會上提出了AI PC的新概念」Copilot+PC「。而在此次 Computex上,這也成爲了行業一大關注熱點。

值得注意的是,引領移動生態的芯片大廠高通,這次也不願意放過AI PC的機遇,和微軟有了合作綁定,Copilot+PC全面搭載了高通的NPU——驍龍X系列平臺。

所謂的「Copilot+PC,微軟是在電腦系統內置了40多個AI小模型,讓筆記本也能夠支持多元的AI能力。

比如,AI PC可以根據郵件等信息,對你的行程安排提出建議;或者AI也可以為你提供主動服務,比如根據攝像頭識別到你的狀態,幫你提供對應的建議,或者是幫你和網站的客服溝通等等。

而爲了滿足AI端側計算的需求,微軟還和高通對Copilot+PC下了定義,起草了具體的參數標準——比如,電腦的NPU需具備40TOPS以上的算力、配備至少16GB的內存、和256GB的SSD。此外,電腦還要有更長的的電池續航時間。

在AI PC上,算力上的一項趨勢是,AI負載有逐漸從CPU、GPU,下放到NPU上。根據高通方面介紹,高通的NPU特點正是兼顧了低功耗和高性能——驍龍XElite NPU的每瓦特性能,是蘋果M3芯片的2.6倍,是英特爾酷睿Ultra7處理器的5.4倍。

高通這顆NPU在AI PC上的落地速度也很快。在Computex上,華碩、宏碁、戴爾、聯想、惠普等廠商都官宣了和高通的合作,微軟的「Copilot+PC」概念正走向現實,快速複製到多個廠商上,而高通也順勢擴充自己在PC行業的地位。

Arm:披露AI進展,但還是很審慎

一直以來,Arm在AI上的佈局可謂相當謹慎,或者可以説是有些緩慢。在這次Computex上,Arm終於有所行動。此次,Arm推出基於人工智能優化的Arm終端計算子系統 (CSS) 、以及相對應的Arm Kleidi軟件系統。

Arm 終端事業部產品管理副總裁 James McNiven

Arm終端計算子系統 (CSS) 包括這些成分:Arm最新的Armv9 CPU、Arm Immortalis GPU、以及最新的CoreLink系統互連、系統內存管理單元 (SMMU)。這些都將基於3納米工藝生產,這也是迄今速度最快的Arm計算平臺。

看起來有點複雜,可以這麼理解Arm這次的產品思路——過去Arm是芯片廠商的上游,提供的是芯片IP,但在AI時代下,下游的終端廠商希望能夠更快推出產品,產業鏈需要更加集成化,而Arm也順應了這一速求。Arm終端計算子系統 (CSS) 的推出,意味着Arm往前走了一步,提供了更加集成的IP方案,縮短下游產品的上市進程。

不過,Arm對於人工智能的態度依舊審慎。儘管目前市面上幾乎所有的手機芯片都是基於Arm架構打造,但端側AI算力都是用各家自己的NPU來應對。

在一次公開採訪中,Arm 終端事業部產品管理副總裁 James McNiven回覆《智能涌現》在內的媒體稱,不會專門做一個Arm的NPU產品線,支持手機廠商們的自由選擇空間。

end

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。