繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

AMD RDNA3架構深入揭祕:一大分七小、AI/光追飛躍!

2022-11-14 20:40

作為各家新處理器、新顯卡平臺中最后一個登場的,AMD RDNA3架構的RX 7000系列顯卡終於來了!

新品正式解禁上市前,AMD也向快科技分享了諸多細節,包括芯片設計、架構佈局、技術特性等,一起先睹為快!

AMD高級副總裁、大中華區總裁潘曉明先生(Spencer Pan)表示,AMD一直致力於將優異的Radeon顯卡帶給發燒友和遊戲市場,用不斷精進的圖形能力令用户收穫極致體驗,用一款又一款的優秀產品引領行業進入一個全新高性能時代。

對於全新的RX 7000系列顯卡,潘曉明一樣充滿了期待與憧憬,並強調,AMD將一如既往的為廣大玩家和行業帶來優秀的產品,滿足時代的需求。

AMD Radeon技術事業部工程研發高級副總裁王啟尚表示,AMD的願景是為全世界數十億的遊戲玩家能夠提供更卓越的遊戲體驗,包括鋭龍處理器、Radeon顯卡、雲遊戲服務,以及PS5、Xbox Series X/S、Valve Steam Deck新一代的遊戲機,還有最新的特斯拉電動汽車,把遊戲體驗帶進汽車市場。

OK,接下來進入RDNA3的奇妙世界。

衆所周知,如今的高端GPU越發複雜、龐大,晶體管數量動輒幾百億,儘管有更先進工藝的加持,但在性能提升的同時,功耗也急劇飆升,不得設計誇張的散熱方案,甚至離不開水冷,導致能效比(每瓦性能)非常差。

AMD RDNA則從誕生開始就是一個極其高能效的GPU架構。初代就比此前的Vega架構在能效提升了多達50%,RDNA2又提升了54%,如今的RDNA3居然再次提升了54%,又一次超越了原定的設計目標!

三代RDNA架構發展下來,能效累計提升幅度已經超過350%,在整個GPU歷史上都堪稱一個奇蹟。

RDNA3架構最大的創新之一,就是將AMD鋭龍、EPYC上大獲成功的chiplet小芯片設計,第一次引入到了GPU之上

AMD將一顆完整的大芯片按照功能模塊劃分成不同的小芯片,各自使用最合適的製造工藝,再通過帶寬高達5.3TB/s的高性能扇出型封裝互連,組合成一個有機的整體。

RDNA3家族的頂級核心Navi 31,一共包括一個GCD、六個MCD。

其中,GCD也就是Graphics Compute Die,包括計算單元、顯示單元、媒體單元等,採用先進、昂貴的5nm製造工藝,面積約306平方毫米

MCD也就是Memory Cache Die,包括顯存、Infinity Cache無限緩存,採用成熟的6nm製造工藝,單個面積約37.5平方毫米

Navi 31核心總面積約531平方毫米,共有577億個晶體管,集成密度約1.1億個晶體管/平方毫米。

相比之下,RX 6900系列所用的Navi 21核心為單芯片設計,臺積電7nm,268億晶體管,面積519平方毫米,集成密度約5160萬晶體管/平方毫米。

換言之,Navi 31在總面積幾乎不變的情況下,晶體管數量翻番,密度也翻了一倍。

作為對比,NVIDIA RTX 4090 AD102核心仍是單芯片,臺積電4N工藝(本質也是5nm),608平方毫米,763億晶體管,集成密度1.26億個/平方毫米。

MCD部分比較簡單,每顆內部集成一個64-bit GDDR6顯存控制器、16MB Infinity Cache無限緩存,后者頻率為2.3GHz。

六顆組成384-bit、96MB的規格,合計帶寬最高達5.3TB/s,比RDNA2架構提升了足足2.7倍。

其中單純由384-bit 20GHz GDDR6顯存提供的帶寬最高為960GB/s,剩下的超過80%都來自Infinity Cache。

那麼,為什麼還是不使用更高頻率的GDDR6X顯存?

王啟尚指出,RDNA 3架構旨在提高能效,而GDDR6X顯存需要更高的供電以維持更高的帶寬。AMD Infinity Cache這樣的創新技術搭配GDDR6,就可以在更低的功耗下,實現更高的顯存帶寬性能。

GCD部分主要可以分為三大塊兒,分別是統一計算單元、顯示引擎、雙媒體引擎,都是全新設計的。

接下來,我們逐一看下這三大件。

CU計算單元,仍然是RDNA3的基本組成模塊,但這次煥然一新,而且有了新名字,叫做「統一計算單元」。

何謂統一?就是圖形渲染、光線追蹤、人工智能可以共享所有的計算資源,提供更高的單位功耗性能、單位面積性能。

計算單元內部又可以分為幾個不同功能模塊,首先是VGPR(通用寄存器),負責資源的共享與調度分配,其容量比RDNA2上增加了50%,從而提升了所有功能的性能。

順帶一提,計算單元部分的集成度非常高,單位面積晶體管比上代增加了足足165%。

流失處理器模塊,RDNA3架構邁進了一大步,採用Dual Issue也就是雙路發射設計,能夠向Wave32 SMID單元同時派發兩路不同的指令。

這個指令可以是整數,可以是浮點,可以是AI,看需要而定。

這就讓指令分發效率直接提升了一倍,可以更好地利用計算單元中的所有功能,達成更高的性能、能效,而且混合指令的利用也更加靈活、高效。

RDNA3還極大地強化了AI,每個計算單元內有兩個AI加速器,並加入新的AI指令,提升AI吞吐量,綜合性能提升超過2.7倍,可以輕松滿足當下乃至未來AI加速場景的需求。

光線追蹤也進化為新一代,可實時跟蹤的光線數量增加了多達1.5倍,還有新的光追專用指令集、新的光線盒排序與遍歷算法。

最終,RDNA3每個計算單元的光追性能提升了多達50%,雖然不能説超越對手,但至少大大縮小了差距。

RDNA3架構還設計了新的「時鍾頻率解耦」(Decoupled Clocks)機制,也就是讓着色器、前端的工作頻率彼此獨立,都跑在最合適的頻率上。

其中,前端頻率為2.5GHz,比上代提高了15%,可以更高效地處理工作負載;着色器頻率為2.3GHz,能效更高,可以節省最多25%的功耗。

這一設計也為整體能效再進一步做了很大的貢獻。

總的來説,憑藉一系列改進,RDNA3的計算性能提升了足足2.7倍,浮點計算能力達到61TFlops(每秒61萬億次計算)。

多媒體一直是AMD GPU的強項,各種新技術、新標準總是會優先嚐試。

RDNA3集成了新的Radiance顯示引擎,不但支持HDMI 2.1a,還行業第一家率先支持最新的DisplayPort 2.1視頻輸出標準,包括UHBR 13.5,而現在距離新標準正式發佈還不到一個月!

DP 1.2可提供最高54Gbps的顯示鏈接帶寬,這足以支持8K165Hz、4K480Hz、2K900Hz的超高清高刷顯示輸出,還能以每通道12-bit色深,渲染出驚人的680億種顏色。

支持如此超高分辨率、超高刷新率,一方面可以顯示更豐富、更高質量的視頻內容,另一方面也可以更適應超高幀率遊戲。

RX 7900系列本就是面向未來4K遊戲的,而在當下主流的2K分辨率,很多遊戲都可以跑出超高幀率,比如《守望先鋒2》超過600FPS,《無畏契約》超過800FPS,使用DP2.1可以讓遊戲幀率、顯示器刷新率更加匹配,遊戲體驗更加絲滑。

戴爾、三星、華碩、LG、宏碁等都在開發DP 2.1接口的顯示器,預計將從2013年初開始陸續上市。

最后是新的雙媒體引擎,頻率提升多達80%,首次加入了對AV1格式的支持,可以做到8K60的編碼、解碼。

目前,各家GPU方案都已經完整支持AV1,再加上移動SoC的跟進,硬件平臺已經完全到位。

另外,RDNA3還支持AVC、HEVC(H.265)格式的同步編解碼,效率更高,並引入了AI增強視頻編碼,包括串流預分析、串流預濾波等。

值得一提的是,RDNA3架構還支持全新的SmartAccess Video協同編解碼技術,可在鋭龍處理器、Radeon顯卡之間智能劃分解碼和編碼工作負載,4K分辨率下的多串流編碼中,可提供最高30%的性能提升。

匯總一下RDNA3 Navi 31 GPU的主要亮點:

1、首次小芯片設計,頻率提升15%,能效提升54%。

2、峰值帶寬提升2.7倍,浮點性能高達61TFlops。

3、統一計算單元,每時鍾周期雙指令發射,升級光追單元,加入AI單元。

4、全新顯示、媒體引擎,完整支持DP 2.1輸出、AV1編解碼。

遊戲特性方面,重點説一下AMD FSR。

截止10月底,AMD FSR超分辨率技術已經覆蓋216款遊戲,其中85款已為最新的FSR 2.x。

下一個「小」版本是FSR 2.2,重點進一步改善畫質,比如減少快速移動物體的重影,同樣基於時域放大算法,不需要依靠AI或者專用的AI硬件,《極限競速:地平線5》首發支持。

下一個「大」版本是FSR 3,支持全新的AMD Fluid Motion Frame補幀技術,預計可帶來比FRS 2最多2倍的幀率提升,2023年推出,正面對標NVIDIA DLSS 3。

產品方面首發兩款,再回顧下主要規格:

RX 7900 XTX:

96個計算單元,96MB Infinity Cache緩存,核心遊戲頻率2.3GHz、最高就是頻率2.5GHz,搭配384-bit 24GB GDDR6顯存,等效頻率20GHz,整卡功耗355W。

RX 7900 XT:

84個計算單元也就是精簡1/8,Infinity Cache緩存減少到80MB,核心遊戲、加速頻率分別降至2.0GHz、2.4GHz,顯存位寬降至320-bit,容量20GB,整卡功耗也降至300W。

值得一提的是,AMD(ATI)上一次使用「XTX」為旗艦顯卡命名,還要追溯到2006年的 Radeon X1950 XTX、X1900 XTX,已經過去了16年之久。

AMD表示,選擇讓XTX品牌迴歸,意在向世界宣佈RX 7900 XTX將是AMD中更強大的顯卡。

RX 7900系列公版設計基本延續了RX 6900系列的風格,三風扇,標準2.5插槽厚度,長度從276mm略微延長到287mm,機箱兼容方面不會增加困難。

輔助供電接口仍是兩個標準的PCIe 8針,而沒有使用新的、容易莫名燒燬的PCIe 5.0 12VHPWR 16針接口,確保兼容性和安全性,同時供電能力從330W增加到355W,可以提供更充裕的空間。

性能方面,解禁之前先看看一些官方數據。

RX 7900 XTX 4K遊戲性能相比於RX 6950 XT提升最多達70%,大量遊戲可提升50%。

RX 7900 XT也能帶來最多50%的性能提升。

光追性能也取得了巨大的進步,4K分辨率和超高畫質下,《賽博朋克2077》、《消逝的光芒》、《殺手3》等遊戲可帶來50-80%的性能飛躍,都輕松超過60FPS的平均幀率及格線。

顯卡將於12月13日正式上市,RX 7900 XTX定價僅為7999元,相比RTX 4090便宜了接近40%,預計和RTX 4080基本在同一檔次,但性能顯然會碾壓后者。

RX 7900 XT定價為7399元,勢必會給只有192-bit顯存的RTX 4070 Ti以極大的壓力。

王啟尚也強調,AMD的理念是希望能夠把發燒級的、面相未來的顯卡,用比較親民的價錢,讓更多的遊戲玩家能夠有全新的體驗。

華擎、華碩、技嘉、微星、撼迅、藍寶石、瀚鎧、訊景、盈通等品牌都會在第一時間發佈各自的RX 7900系列顯卡,並同步上市。

備貨方面,AMD表示整個團隊都在夜以繼日地準備供貨,預計應該是充足的,但不排除玩家熱烈追捧,初期供需緊張。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。