AMD RDNA3架構深入揭祕：一大分七小、AI/光追飛躍！

2022-11-14 20:40

作為各家新處理器、新顯卡平臺中最后一個登場的，AMD RDNA3架構的RX 7000系列顯卡終於來了！

新品正式解禁上市前，AMD也向快科技分享了諸多細節，包括芯片設計、架構佈局、技術特性等，一起先睹為快！

AMD高級副總裁、大中華區總裁潘曉明先生(Spencer Pan)表示，AMD一直致力於將優異的Radeon顯卡帶給發燒友和遊戲市場，用不斷精進的圖形能力令用户收穫極致體驗，用一款又一款的優秀產品引領行業進入一個全新高性能時代。

對於全新的RX 7000系列顯卡，潘曉明一樣充滿了期待與憧憬，並強調，AMD將一如既往的為廣大玩家和行業帶來優秀的產品，滿足時代的需求。

AMD Radeon技術事業部工程研發高級副總裁王啟尚表示，AMD的願景是為全世界數十億的遊戲玩家能夠提供更卓越的遊戲體驗，包括鋭龍處理器、Radeon顯卡、雲遊戲服務，以及PS5、Xbox Series X/S、Valve Steam Deck新一代的遊戲機，還有最新的特斯拉電動汽車，把遊戲體驗帶進汽車市場。

OK，接下來進入RDNA3的奇妙世界。

衆所周知，如今的高端GPU越發複雜、龐大，晶體管數量動輒幾百億，儘管有更先進工藝的加持，但在性能提升的同時，功耗也急劇飆升，不得設計誇張的散熱方案，甚至離不開水冷，導致能效比(每瓦性能)非常差。

AMD RDNA則從誕生開始就是一個極其高能效的GPU架構。初代就比此前的Vega架構在能效提升了多達50％，RDNA2又提升了54％，如今的RDNA3居然再次提升了54％，又一次超越了原定的設計目標！

三代RDNA架構發展下來，能效累計提升幅度已經超過350％，在整個GPU歷史上都堪稱一個奇蹟。

RDNA3架構最大的創新之一，就是將AMD鋭龍、EPYC上大獲成功的chiplet小芯片設計，第一次引入到了GPU之上。

AMD將一顆完整的大芯片按照功能模塊劃分成不同的小芯片，各自使用最合適的製造工藝，再通過帶寬高達5.3TB/s的高性能扇出型封裝互連，組合成一個有機的整體。

RDNA3家族的頂級核心Navi 31，一共包括一個GCD、六個MCD。

其中，GCD也就是Graphics Compute Die，包括計算單元、顯示單元、媒體單元等，採用先進、昂貴的5nm製造工藝，面積約306平方毫米。

MCD也就是Memory Cache Die，包括顯存、Infinity Cache無限緩存，採用成熟的6nm製造工藝，單個面積約37.5平方毫米。

Navi 31核心總面積約531平方毫米，共有577億個晶體管，集成密度約1.1億個晶體管/平方毫米。

相比之下，RX 6900系列所用的Navi 21核心為單芯片設計，臺積電7nm，268億晶體管，面積519平方毫米，集成密度約5160萬晶體管/平方毫米。

換言之，Navi 31在總面積幾乎不變的情況下，晶體管數量翻番，密度也翻了一倍。

作為對比，NVIDIA RTX 4090 AD102核心仍是單芯片，臺積電4N工藝(本質也是5nm)，608平方毫米，763億晶體管，集成密度1.26億個/平方毫米。

MCD部分比較簡單，每顆內部集成一個64-bit GDDR6顯存控制器、16MB Infinity Cache無限緩存，后者頻率為2.3GHz。

六顆組成384-bit、96MB的規格，合計帶寬最高達5.3TB/s，比RDNA2架構提升了足足2.7倍。

其中單純由384-bit 20GHz GDDR6顯存提供的帶寬最高為960GB/s，剩下的超過80％都來自Infinity Cache。

那麼，為什麼還是不使用更高頻率的GDDR6X顯存？

王啟尚指出，RDNA 3架構旨在提高能效，而GDDR6X顯存需要更高的供電以維持更高的帶寬。AMD Infinity Cache這樣的創新技術搭配GDDR6，就可以在更低的功耗下，實現更高的顯存帶寬性能。

GCD部分主要可以分為三大塊兒，分別是統一計算單元、顯示引擎、雙媒體引擎，都是全新設計的。

接下來，我們逐一看下這三大件。

CU計算單元，仍然是RDNA3的基本組成模塊，但這次煥然一新，而且有了新名字，叫做「統一計算單元」。

何謂統一？就是圖形渲染、光線追蹤、人工智能可以共享所有的計算資源，提供更高的單位功耗性能、單位面積性能。

計算單元內部又可以分為幾個不同功能模塊，首先是VGPR(通用寄存器)，負責資源的共享與調度分配，其容量比RDNA2上增加了50％，從而提升了所有功能的性能。

順帶一提，計算單元部分的集成度非常高，單位面積晶體管比上代增加了足足165％。

流失處理器模塊，RDNA3架構邁進了一大步，採用Dual Issue也就是雙路發射設計，能夠向Wave32 SMID單元同時派發兩路不同的指令。

這個指令可以是整數，可以是浮點，可以是AI，看需要而定。

這就讓指令分發效率直接提升了一倍，可以更好地利用計算單元中的所有功能，達成更高的性能、能效，而且混合指令的利用也更加靈活、高效。

RDNA3還極大地強化了AI，每個計算單元內有兩個AI加速器，並加入新的AI指令，提升AI吞吐量，綜合性能提升超過2.7倍，可以輕松滿足當下乃至未來AI加速場景的需求。

光線追蹤也進化為新一代，可實時跟蹤的光線數量增加了多達1.5倍，還有新的光追專用指令集、新的光線盒排序與遍歷算法。

最終，RDNA3每個計算單元的光追性能提升了多達50％，雖然不能説超越對手，但至少大大縮小了差距。

RDNA3架構還設計了新的「時鍾頻率解耦」(Decoupled Clocks)機制，也就是讓着色器、前端的工作頻率彼此獨立，都跑在最合適的頻率上。

其中，前端頻率為2.5GHz，比上代提高了15％，可以更高效地處理工作負載；着色器頻率為2.3GHz，能效更高，可以節省最多25％的功耗。

這一設計也為整體能效再進一步做了很大的貢獻。

總的來説，憑藉一系列改進，RDNA3的計算性能提升了足足2.7倍，浮點計算能力達到61TFlops(每秒61萬億次計算)。

多媒體一直是AMD GPU的強項，各種新技術、新標準總是會優先嚐試。

RDNA3集成了新的Radiance顯示引擎，不但支持HDMI 2.1a，還行業第一家率先支持最新的DisplayPort 2.1視頻輸出標準，包括UHBR 13.5，而現在距離新標準正式發佈還不到一個月！

DP 1.2可提供最高54Gbps的顯示鏈接帶寬，這足以支持8K165Hz、4K480Hz、2K900Hz的超高清高刷顯示輸出，還能以每通道12-bit色深，渲染出驚人的680億種顏色。

支持如此超高分辨率、超高刷新率，一方面可以顯示更豐富、更高質量的視頻內容，另一方面也可以更適應超高幀率遊戲。

RX 7900系列本就是面向未來4K遊戲的，而在當下主流的2K分辨率，很多遊戲都可以跑出超高幀率，比如《守望先鋒2》超過600FPS，《無畏契約》超過800FPS，使用DP2.1可以讓遊戲幀率、顯示器刷新率更加匹配，遊戲體驗更加絲滑。

戴爾、三星、華碩、LG、宏碁等都在開發DP 2.1接口的顯示器，預計將從2013年初開始陸續上市。

最后是新的雙媒體引擎，頻率提升多達80％，首次加入了對AV1格式的支持，可以做到8K60的編碼、解碼。

目前，各家GPU方案都已經完整支持AV1，再加上移動SoC的跟進，硬件平臺已經完全到位。

另外，RDNA3還支持AVC、HEVC(H.265)格式的同步編解碼，效率更高，並引入了AI增強視頻編碼，包括串流預分析、串流預濾波等。

值得一提的是，RDNA3架構還支持全新的SmartAccess Video協同編解碼技術，可在鋭龍處理器、Radeon顯卡之間智能劃分解碼和編碼工作負載，4K分辨率下的多串流編碼中，可提供最高30％的性能提升。

匯總一下RDNA3 Navi 31 GPU的主要亮點：

1、首次小芯片設計，頻率提升15％，能效提升54％。

2、峰值帶寬提升2.7倍，浮點性能高達61TFlops。

3、統一計算單元，每時鍾周期雙指令發射，升級光追單元，加入AI單元。

4、全新顯示、媒體引擎，完整支持DP 2.1輸出、AV1編解碼。

遊戲特性方面，重點説一下AMD FSR。

截止10月底，AMD FSR超分辨率技術已經覆蓋216款遊戲，其中85款已為最新的FSR 2.x。

下一個「小」版本是FSR 2.2，重點進一步改善畫質，比如減少快速移動物體的重影，同樣基於時域放大算法，不需要依靠AI或者專用的AI硬件，《極限競速：地平線5》首發支持。

下一個「大」版本是FSR 3，支持全新的AMD Fluid Motion Frame補幀技術，預計可帶來比FRS 2最多2倍的幀率提升，2023年推出，正面對標NVIDIA DLSS 3。

產品方面首發兩款，再回顧下主要規格：

RX 7900 XTX：

96個計算單元，96MB Infinity Cache緩存，核心遊戲頻率2.3GHz、最高就是頻率2.5GHz，搭配384-bit 24GB GDDR6顯存，等效頻率20GHz，整卡功耗355W。

RX 7900 XT：

84個計算單元也就是精簡1/8，Infinity Cache緩存減少到80MB，核心遊戲、加速頻率分別降至2.0GHz、2.4GHz，顯存位寬降至320-bit，容量20GB，整卡功耗也降至300W。

值得一提的是，AMD(ATI)上一次使用「XTX」為旗艦顯卡命名，還要追溯到2006年的 Radeon X1950 XTX、X1900 XTX，已經過去了16年之久。

AMD表示，選擇讓XTX品牌迴歸，意在向世界宣佈RX 7900 XTX將是AMD中更強大的顯卡。

RX 7900系列公版設計基本延續了RX 6900系列的風格，三風扇，標準2.5插槽厚度，長度從276mm略微延長到287mm，機箱兼容方面不會增加困難。

輔助供電接口仍是兩個標準的PCIe 8針，而沒有使用新的、容易莫名燒燬的PCIe 5.0 12VHPWR 16針接口，確保兼容性和安全性，同時供電能力從330W增加到355W，可以提供更充裕的空間。

性能方面，解禁之前先看看一些官方數據。

RX 7900 XTX 4K遊戲性能相比於RX 6950 XT提升最多達70％，大量遊戲可提升50％。

RX 7900 XT也能帶來最多50％的性能提升。

光追性能也取得了巨大的進步，4K分辨率和超高畫質下，《賽博朋克2077》、《消逝的光芒》、《殺手3》等遊戲可帶來50-80％的性能飛躍，都輕松超過60FPS的平均幀率及格線。

顯卡將於12月13日正式上市，RX 7900 XTX定價僅為7999元，相比RTX 4090便宜了接近40％，預計和RTX 4080基本在同一檔次，但性能顯然會碾壓后者。

RX 7900 XT定價為7399元，勢必會給只有192-bit顯存的RTX 4070 Ti以極大的壓力。

王啟尚也強調，AMD的理念是希望能夠把發燒級的、面相未來的顯卡，用比較親民的價錢，讓更多的遊戲玩家能夠有全新的體驗。

華擎、華碩、技嘉、微星、撼迅、藍寶石、瀚鎧、訊景、盈通等品牌都會在第一時間發佈各自的RX 7900系列顯卡，並同步上市。

備貨方面，AMD表示整個團隊都在夜以繼日地準備供貨，預計應該是充足的，但不排除玩家熱烈追捧，初期供需緊張。

AMD RDNA3架構深入揭祕：一大分七小、AI/光追飛躍！

推薦文章

一周財經日曆 |下周重磅事件搶先看：美聯儲利率決議、科技巨頭財報密集來襲

美股機會日報 | 9月CPI低於預期！三大股指期貨直線拉昇；英特爾盤前大漲超5%

一周IPO | 八馬茶業、滴普科技預計下周二上市；傳賽力斯最快下周一招股

華盛早報 | 中美將於今起進行經貿磋商；盤后漲超7%！英特爾Q3營收增長2.8%

營收創新高、利潤暴跌29%！馬斯克的AI豪賭能撐起特斯拉的未來嗎？

財報前瞻 | iPhone17熱銷「帶飛」蘋果股價！大行績前集體齊聲看漲，Q4季報重點關注什麼？

甲骨文兩日跌超10%，「超預期宏偉目標」不再「吃香」？

小馬智行、文遠知行回港上市，迎Robotaxi 的deepseek時刻？