mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-11-13 00:07:09

RDNA

Radeon DNA에서 넘어옴

||<tablewidth=100%><tablebordercolor=#000><bgcolor=#fff,#000><color=#000,#fff><nopad>
||<tablealign=center><tablebordercolor=#fff,#000><tablebgcolor=#fff,#000> 파일:AMD Radeon 로고.svg 파일:AMD Radeon 로고 화이트.svg ||<(>
AMD Radeon Graphics
둘러보기 ||
||
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
GPU 마이크로아키텍처
TeraScale GCN RDNA UDNA
CDNA
<rowcolor=white> 그래픽 카드 제품군 가속기 제품군
RADEON RX RADEON PRO INSTINCT
드라이버 및 소프트웨어
Radeon Software ROCm GPUOpen
기술
Video Core Next · CrossFire · Eyefinity · FreeSync · Fluid Motion · FidelityFX }}}
}}}}}}

||<-2><tablewidth=100%><tablebordercolor=#000000><bgcolor=#000000><color=#ffffff><height=70>
||<-2><tablealign=center><tablebordercolor=#000000><tablebgcolor=#000000> 파일:AMD Radeon 로고 화이트.svg ||<(> {{{#!wiki style="letter-spacing:-0.5px" RDNA 아키텍처 기반 제품군 ||
||
{{{#!wiki style="margin: -16px -11px;" <colbgcolor=#ed1c24><colcolor=#ffffff> RDNA 1
(GCN ISA)
RX 5000 시리즈
RDNA 2
(RDNA 2 ISA)
RX 6000 시리즈
RDNA 3
(RDNA 3 ISA)
RX 7000 시리즈
RDNA 4
(RDNA 4 ISA)
RX 8000 시리즈 }}}
◀ 이전
GCN 아키텍처 기반 제품군
다음 ▶
-

파일:AMD_RDNA_logo.png
AMD RDNA μArchitecture

1. 개요2. 세대별 RDNA
2.1. RDNA 1 (Navi 1X, gfx1010)2.2. RDNA 2 (Navi 2X, gfx1030)2.3. RDNA 3 (Navi 3X, gfx1100)
2.3.1. RDNA 3.5 (Strix, gfx1150)
2.4. RDNA 4 (Navi 4X, gfx????)2.5. RDNA 5 (가칭)
3. 사건 사고
3.1. Verilog 코드 유출 사고3.2. 9세대 콘솔 게임기 관련
4. 관련 문서

[clearfix]

1. 개요

AMD가 개발한 GCN 마이크로아키텍처 시리즈의 후속 GPU 마이크로아키텍처 시리즈로, 고성능 게이밍을 목표로 하는 아키텍처라고 한다.

9세대 거치형 콘솔 게임기인 엑스박스 시리즈 X 플레이스테이션 5에도 채택된 GPU 아키텍처이기도 하며, TeraScale 1 아키텍처 기반의 R600 세대를 마지막으로 제품명에서 사라졌던 XT 및 XTX 접미 문자가 무려 12년만에 다시 돌아온 아키텍처 시리즈이기도 하다.

RDNA의 R은 Radeon의 머리글자. 2019년에 처음 발표될 당시에는 특정 리뷰 사이트에만 언급되었을 뿐 AMD 공식 어디에도 명시된 곳이 없었으나, 2020년 3월 5일에 발표된 Financial Analyst Day 2020에서 처음 명시되었다. ( 보도자료) 이와 동시에 CDNA 마이크로아키텍처의 존재가 공식으로 알려졌다.

2. 세대별 RDNA

2.1. RDNA 1 (Navi 1X, gfx1010)

Introducing RDNA Architecture

2019년 6월, 컴퓨텍스 타이베이에서 Vega의 후속으로 발표된 최초의 RDNA 마이크로아키텍처. 기존 GCN과 다른 새로운 구조의 마이크로아키텍처를 사용했고 베가 대비 클럭당 1.25배, 전력당 1.5배의 성능을 달성했다고 발표했다. 또한 RDNA는 게이밍에 최적화된 마이크로아키텍처로, ISA는 여전히 GCN ISA를 사용한다고 한다. 출처 GCN ISA를 사용하는 마지막 마이크로아키텍처일 것이라는 루머가 있다. 출처1, 출처2

GCN 마이크로아키텍처는 원래 연산 성능을 위주로 개발됐기에[3] 파이프라인이 굉장히 길어서 레이턴시가 늘어지는 등 게이밍 GPU로서는 확실한 약점이 있었는데, RDNA에서는 그래픽스 파이프라인 스테이지를 짧게 하여 좀 더 게이밍에 적합하게 변경했다.

게이밍 성능 효율을 중시한 만큼, 동급 게이밍 성능 대비 순수 FP32 연산 성능이 크게 너프될 수밖에 없는 구조라고 볼 수 있다. 라데온 RX 5700 XT에 사용된 Navi 10이 하이엔드 타겟의 GPU가 아님을 감안하더라도, 이전 세대 라데온 VII에 사용된 Vega 20보다 37.5%나 적은 체급이기 때문. 체급만 따지면 7년 전 1세대 GCN 시절 HD 7970에 사용된 Tahiti 풀칩(컴퓨트 유닛 32개)과 HD 7870에 사용된 Pitcairn 풀칩(컴퓨트 유닛 20개)의 격차와 맞먹는다. 반대로 생각해보면, 같은 렌더 백엔드 스펙(렌더링 성능)일 때 컴퓨트 유닛의 개수를 늘림으로써 연산 성능이 증가될 때마다 게이밍 성능의 효율 저하가 덜 해진다는 뜻이기도 하다. 즉, 컴퓨트 유닛 개수에 따른 게이밍 성능 스케일링이 뚜렷해졌다는 것.

3DMARK 벤치마크 스타일도 Fire Strike 점수가 낮고 Time Spy 점수가 잘 나오는 식으로 NVIDIA의 맥스웰 이후 마이크로아키텍처와 비슷하게 변했다. GPU 채굴로 두 회사가 홍역을 한 번 치른 후에 NVIDIA에서는 레이 트레이싱으로, AMD에서는 새로운 아키텍처 도입으로 컴퓨팅에는 구세대에 비해 별로 나아진 게 없고 게이밍에 도움이 되는 쪽으로 선회한 듯이다.

게이밍 분야가 아닌 연산 특화 분야에서 존속돼야 할 Instinct 제품군은 2020년부터 CDNA 마이크로아키텍처로 갈아타게 되면서, 게이밍과 완전히 분리된 마이크로아키텍처로 나아가게 됐다.

2.2. RDNA 2 (Navi 2X, gfx1030)

AMD RDNA™ 2 Architecture

【정식 발표 전 정보 펼치기 · 접기】
2020년 3월 5일, AMD 파이낸셜 데이에서 공식 발표된 RDNA의 후속 마이크로아키텍처. 하드웨어 레이 트레이싱을 지원하며, 전성비가 기존 RDNA 대비 50% 향상될 것이라고 한다.

2020년 8월 17일, HOT CHIPS 32의 엑스박스 시리즈 X 아키텍처 설명회를 통해 RDNA 2 아키텍처의 구조가 드러났는데, RDNA2의 비효율적인 하드웨어 레이 트레이싱 설계에 대해 의문이 제기되고 있다. RDNA2에는 CU 하나당 레이 트레이싱을 전담하는 기능성 텍스처 프로세서가 하나씩 들어가 레이 트레이싱 작업을 수행하는데, 텍스처 명령과 레이 명령을 동시에 수행할 수가 없다. 클럭당 1 레이 명령을 내리거나, 4 텍스처 명령을 내릴 수 있다. 텍스처 유닛과 레이 가속이 같은 자원을 공유하고 있기에 레이 트레이싱 성능이 결과적으로 최대값보다 낮게 나올 수 밖에 없다. AMD가 엔비디아의 레이 트레이싱 성능을 따라잡았을지에 대한 전망에 의심을 들게 만드는 부분. 또한 상황에 따라 값이 천차만별로 바뀌는 레이-삼각형 값이라는 애매한 지표를 공개해, 텍스처 프로세서의 수량으로 순수한 레이 연산능력인 기가레이를 산출하지 못해, RDNA2 아키텍처의 정확한 레이 연산능력을 특정 지을 수 없게 됐다.

한편 엑스박스 발표회를 통해 드러난 정보에 따르면 CU당 스칼라 및 벡터 처리량은 RDNA1과 동일한 것으로 나타난다. RDNA1과 같이 컴퓨팅용과 그래픽용 각각 하나씩 듀얼레인 명령어 프로세서를 구성했다. 14CU는 하나의 캐시메모리를 공유해 캐시 구조가 RDNA 1과 똑같다. 하지만 듀얼 컴퓨트 유닛이 로컬 데이터 공유를 가능케 해 짝지어진 컴퓨트 유닛들끼리는 마치 하나의 캐시 메모리를 공유하는것과 같은 만듦새를 취하게 한다. 셰이더 어레이 구성이 10CU에서 14CU가 돼 양치기를 통한 성능 향상이 쉬워졌다.

2020년 9월 10일, 10월 28일(현지시간)에 RDNA 2에 대한 소식이 발표될 예정이다. #

2020년 9월 17일, 동 클럭/스펙 당 성능은 불확실하지만 Xbox One X 대비 25%라고 주장하는 것으로 보아 현행 RDNA1과 큰 차이가 없을 가능성이 높다. RDNA2는 GCN4세대 대비 +25%인 셈인데, 문제는 이미 RDNA 1세대부터가 GCN 5세대 대비 +25% 가량을 성사했기 때문. 아이러니하게도 VEGA 아키텍처, 즉 GCN 5세대로 가면서 4세대 폴라리스보다 성능상으로 퇴화(...)를 해버린 희대의 촌극이 일어난 덕분에, 저 내용대로라면 RDNA2는 RDNA1보다는 조금 더 좋아지는 게 맞기는 하다.

}}} ||
Introducing AMD Infinity Cache
CPU의 L3 캐시 메모리에 대응되는 메모리 계층이 추가됐다. 발표 전 루머로 알려졌을 때는 아무도 믿지 않았을만큼 레이 엑셀러레이터보다 더 주목 받은 신규 요소로, 5세대 GCN인 Vega 마이크로아키텍처부터 구축된 인피니티 패브릭 인터커넥트에 연동되어 있다. Navi 21 기준으로 64-bit 폭의 8 MB 슬라이스가 16개로 구성되어 총 128 MB가 탑재됐다. 최상위 GPU인 Navi 21조차 GDDR6 SGRAM이 256-bit 버스 폭으로 연결되어 있기 때문에 이에 따른 낮은 메모리 대역폭을 보강하기 위해 탑재됐으며, 이를 통해 인피니티 캐시 적중률은 게임에 따라, 해상도 환경에 따라 다르지만 720p HD 환경에서는 약 80%, 4K UHD 환경에서는 약 60% [4] 정도라고 한다. 평균 레이턴시도 같은 256-bit 버스 폭인 라데온 RX 5700 XT 대비 약 34% 단축됐다.
L2 ↔ 인피니티 캐시 메모리 대역폭은 64 바이트/클럭 사이클인 슬라이스가 16개로 구성되므로 클럭 사이클당 총 1024 바이트가 되며, 인피니티 패브릭 인터커넥트가 별도의 클럭 도메인으로 동작하는데 기본 클럭은 1400 MHz, 최대 클럭은 1940 MHz이다. 따라서, 유효 메모리 대역폭은 캐시 적중률이 겨우 35%만 돼도 (1.940 GHz × 1024 바이트 × 0.35) + (16 Gbps × 256-bit ÷ 8 × 0.65) = 1028.096 GB/s가 되어 사실상 1 TB/s급 이상을 구현할 수 있다. 참고로 1 TB/s는 16 Gbps인 GDDR6 SGRAM을 512-bit 버스 폭으로 구성했을 때의 메모리 대역폭이다. 나중에 일부 하위 라인들의 인피니티 패브릭 클럭 도메인이 밝혀지고, 공식 홈페이지에 RX 6500 XT의 '유효 메모리 대역폭' (Effective Memory Bandwidth) 항목이 추가되면서 적중률까지 가늠할 수 있게 됐다.
* RADEON RX 6900 XT, 6800 XT의 유효 메모리 대역폭
* 인피니티 캐시 메모리 클럭 : 1.94 GHz
* 인피니티 캐시 메모리 버스 폭 : 8192-bit
* 인피니티 캐시 메모리 대역폭 : 1986.56 GB/s
* GDDR6 SGRAM 대역폭 : 512 GB/s
* HD 기준 (1986.56 × 적중률 0.8) + (512 × 부적중률 0.2) = 1691.648 [GB/s]
* FHD 기준 (1986.56 × 적중률 0.76) + (512 × 부적중률 0.24) = 1632.6656 [GB/s]
* QHD 기준 (1986.56 × 적중률 0.74) + (512 × 부적중률 0.26) = 1603.1744 [GB/s]
* 4K UHD 기준 (1986.56 × 적중률 0.62) + (512 × 부적중률 0.38) = 1426.2272 [GB/s]
* RADEON RX 6800의 유효 메모리 대역폭
* 인피니티 캐시 메모리 클럭 : 1.55 GHz
* 인피니티 캐시 메모리 버스 폭 : 8192-bit
* 인피니티 캐시 메모리 대역폭 : 1587.2 GB/s
* GDDR6 SGRAM 대역폭 : 512 GB/s
* HD 기준 (1587.2 × 적중률 0.8) + (512 × 부적중률 0.2) = 1372.16 [GB/s]
* FHD 기준 (1587.2 × 적중률 0.76) + (512 × 부적중률 0.24) = 1329.152 [GB/s]
* QHD 기준 (1587.2 × 적중률 0.74) + (512 × 부적중률 0.26) = 1307.648 [GB/s]
* 4K UHD 기준 (1587.2 × 적중률 0.62) + (512 × 부적중률 0.38) = 1178.624 [GB/s]
* RADEON RX 6700 XT의 유효 메모리 대역폭
* 인피니티 캐시 메모리 클럭 : 1.94 GHz
* 인피니티 캐시 메모리 버스 폭 : 6144-bit
* 인피니티 캐시 메모리 대역폭 : 1489.92 GB/s
* GDDR6 SGRAM 대역폭 : 384 GB/s
* HD 기준 (1489.92 × 적중률 0.78) + (384 × 부적중률 0.22) = 1246.6176 [GB/s]
* FHD 기준 (1489.92 × 적중률 0.72) + (384 × 부적중률 0.28) = 1180.2624 [GB/s]
* QHD 기준 (1489.92 × 적중률 0.69) + (384 × 부적중률 0.31) = 1147.0848 [GB/s]
* 4K UHD 기준 (1489.92 × 적중률 0.53) + (384 × 부적중률 0.47) = 970.1376 [GB/s]
* RADEON RX 6600 XT의 유효 메모리 대역폭
* 인피니티 캐시 메모리 클럭 : 1.8 GHz
* 인피니티 캐시 메모리 버스 폭 : 4096-bit
* 인피니티 캐시 메모리 대역폭 : 921.6 GB/s
* GDDR6 SGRAM 대역폭 : 256 GB/s
* HD 기준 (921.6 × 적중률 0.55) + (256 × 부적중률 0.45) = 622.08 [GB/s]
* FHD 기준 (921.6 × 적중률 0.44) + (256 × 부적중률 0.56) = 548.864 [GB/s]
* QHD 기준 (921.6 × 적중률 0.38) + (256 × 부적중률 0.62) = 508.928 [GB/s]
* 4K UHD 기준 (921.6 × 적중률 0.27) + (256 × 부적중률 0.73) = 435.712 [GB/s]
* RADEON RX 6600의 유효 메모리 대역폭
* 인피니티 캐시 메모리 클럭 : 1.8 GHz
* 인피니티 캐시 메모리 버스 폭 : 4096-bit
* 인피니티 캐시 메모리 대역폭 : 921.6 GB/s
* GDDR6 SGRAM 대역폭 : 224 GB/s
* HD 기준 (921.6 × 적중률 0.55) + (224 × 부적중률 0.45) = 607.68 [GB/s]
* FHD 기준 (921.6 × 적중률 0.44) + (224 × 부적중률 0.56) = 530.944 [GB/s]
* QHD 기준 (921.6 × 적중률 0.38) + (224 × 부적중률 0.62) = 489.088 [GB/s]
* 4K UHD 기준 (921.6 × 적중률 0.27) + (224 × 부적중률 0.73) = 412.352 [GB/s]
* RADEON RX 6500 XT의 유효 메모리 대역폭 : 232 GB/s
* 인피니티 캐시 메모리 클럭 : 1.8 GHz
* 인피니티 캐시 메모리 버스 폭 : 2048-bit
* 인피니티 캐시 메모리 대역폭 : 460.8 GB/s
* GDDR6 SGRAM 대역폭 : 144 GB/s
* HD 기준 (460.8 × 적중률 0.37) + (144 × 부적중률 0.63) = 261.216 [GB/s]
* FHD 기준 (460.8 × 적중률 0.28) + (144 × 부적중률 0.72) = 232.704 [GB/s]
* QHD 기준 (460.8 × 적중률 0.23) + (144 × 부적중률 0.77) = 216.864 [GB/s]
* 4K UHD 기준 (460.8 × 적중률 0.19) + (144 × 부적중률 0.81) = 204.192 [GB/s]
* RADEON RX 6400의 유효 메모리 대역폭 : 221 GB/s
* 인피니티 캐시 메모리 클럭 : 1.8 GHz
* 인피니티 캐시 메모리 버스 폭 : 2048-bit
* 인피니티 캐시 메모리 대역폭 : 460.8 GB/s
* GDDR6 SGRAM 대역폭 : 128 GB/s
* HD 기준 (460.8 × 적중률 0.37) + (128 × 부적중률 0.63) = 251.136 [GB/s]
* FHD 기준 (460.8 × 적중률 0.28) + (128 × 부적중률 0.72) = 221.184 [GB/s]
* QHD 기준 (460.8 × 적중률 0.23) + (128 × 부적중률 0.77) = 204.544 [GB/s]
* 4K UHD 기준 (460.8 × 적중률 0.19) + (128 × 부적중률 0.81) = 191.232 [GB/s]
Navi 21에 탑재된 128 MB의 인피니티 캐시 메모리는 GPU 전체에서 약 20%의 면적 비중을 차지하고 있는데, 이렇게까지 설계된 것은 GPU에 차지하는 면적 비중을 감안하더라도 유효 대역폭과 소비 전력 두 가지를 모두 잡기 위해 설계됐다고 한다. GPU 공정 미세화를 거쳐도 GPU 내부 GDDR6 SGRAM 컨트롤러와 물리 계층(PHY)이 좀처럼 줄어들지 않아 면적이 HBM 계열의 컨트롤러와 물리 계층보다 더 크고, 소비 전력도 HBM 계열보다 딱히 우위에 있지 않기 때문에, 전통적인 방식대로 GDDR6 SGRAM을 512-bit 버스 폭으로 무식하게 확장됐다면 전성비 우위를 가지기 어려웠을 것이고, 설령 그렇게 구성해도 GPU 전체의 면적에 대한 이득도 별로 없었을 것이다. 그 반면에 SRAM인 인피니티 캐시 메모리는 아예 없었을 때보다는 GPU 면적이 더 크지만 공정 미세화되면 면적이 감소되므로, 장기적인 관점에서는 같은 GPU 전체 면적 대비 뛰어난 유효 메모리 대역폭을 기대할 수 있다.
}}} ||
Introducing AMD Smart Access Memory
메모리 레지스터 사이즈를 변경해서 CPU가 VRAM에 더 빠르게 접근하게 해주는 기능으로 과거 바이오스가 그 한계로 그래픽 메모리의 4Gbit(=256MB) 까지만 접근이 가능했으나 해당 기능으로 CPU가 그래픽 카드 메모리를 모두 접근가능해진다. Resizable Base Address Register의 브랜드 네임이기도 하며, 경쟁사도 2021년 2월 하순에 출시된 지포스 RTX 3060부터 Resizable BAR 기능이 도입되는 계기가 됐다.
NVIDIA의 Resizable BAR는 평균 3%의 성능 향상을 보이며 AMD의 Smart Access Memory 또한 크지않은 평균 5%의 성능 향상을 보이는데 이는 지원 게임 한정 이라는 함정 카드가 존재한다. 지원되지 않는 게임이라면 오히려 성능 감소가 되기도 하는 양날의 검인 옵션, 그러나 2020년부터 16비트 CSM 즉 바이오스 지원이 중단되고 64비트 UEFI로 넘어가기 때문에 미래에는 기본지원이 될 예정이기 때문에 최신 게임을 할수록 해당 기능을 활성화 해야한다.
Adrenalin 21.9.1 드라이버 이후 RDNA 1의 지원이 추가됐다.

2020년 10월 28일에 정식 발표되고 11월 18일에 출시된 2번째 RDNA 마이크로아키텍처. 이전 RDNA와 비교해서 확장된 구조, 전성비 50% 향상, 클럭 증가가 주된 특징으로, 가장 눈에 띄는 추가 기능은 레이 트레이싱 가속을 지원하는 RA(Ray Accelerator)와 인피니티 캐시 메모리라는 새로운 캐시 메모리 계층이다. 그 외에 기타 추가 기능도 있지만 기본적인 특징은 이전 세대와 동일.

인피니티 캐시 메모리는 ZEN 계열 마이크로아키텍처의 L3 캐시 메모리를 기반으로 설계됐다. AMD의 설명에 따르면 인피니티 캐시는 DRAM 레이턴시를 감소시키며 매우 높은 메모리 대역폭을 제공하고 전력 소모량 감소 효과도 있다. (256-bit GDDR6 SGRAM 단독 사용과 비교했을 때 인피니티 캐시가 결합된 GDDR6 SGRAM 사용은 0.9배의 전력 소모로 2.17배의 대역폭을 제공받는 효과) 하이엔드 라인업 RDNA 2 기반 GPU인 Navi 21에는 128 MB 용량의 인피니티 캐시가 탑재된다.

실리콘 최적화를 통해 동일한 7nm 공정임에도 전성비를 RDNA 1 대비 최소 50% 향상시켰으며, 클럭을 30% 향상시켰다. IPC 향상에 관해선 별다른 언급이 없었으나, 54% 전성비 기여도에서 클럭당 성능이 16~21%로 보여진 점, 앞선 개선점들을 전부 종합하면 지난 세대 Navi 10이 탑재된 RX 5700 XT 대비 RDNA 2 기반의 Navi 21이 탑재된 그래픽카드 성능이 평균 약 2배에 이른다.

또한, 기능적으로는 DirectX 레이 트레이싱, 메쉬 셰이더, DirectStorage API, Variable Rate Shading, 샘플러 피드백을 지원한다. AMD 스마트 액세스 메모리 기술이 공개되면서 라이젠 5000 시리즈 CPU는 RX 6000 시리즈 그래픽 카드의 GPU 메모리에 완전 접근이 가능해졌다. 즉 CPU가 좋은 자원을 끌어다 쓸 수 있도록 해준다는 것. 레이지 모드가 추가되면서 전력 제한을 어느 정도 완화하면서 부스트 클럭을 보증 가능한 범위 내에서 더 높일 수 있게 됐다.

2.3. RDNA 3 (Navi 3X, gfx1100)

Introducing AMD Radeon™ RX 7900 XTX

【정식 발표 전 정보 펼치기 · 접기】
2020년 3월 5일 AMD Financial Analyst day 2020의 GPU 로드맵에서 처음 언급됐으며, ZEN 2에서 처음 사용된 칩렛 방식을 그래픽 칩 최초로 적용할 예정이라고 밝혔다. 유출된 정보에 의하면 머신러닝용 코어가 따로 탑재될 수도 있다. 먼저 발표된 CDNA 마이크로아키텍처부터 컴퓨트 유닛마다 매트릭스 코어가 탑재된 전례가 있기 때문.

2022년 6월 10일, Financial Analyst Day 2022의 GPU 로드맵에서 RDNA 3의 관한 정보가 일부 공개됐는데, 2022년 후반에 출시될 예정임을 재확인됐고, RDNA 2 대비 ' >50% 증가'된 전성비를 목표로 하는 마이크로아키텍처라고 한다. 이를 실현하기 위한 주요 특징들은 다음과 같다.
  • 5 nm 공정 노드 : 2021년까지만 해도 'Advanced Node'라고 막연하게 표현돼서 CDNA 2에 채택된 6 nm인 TSMC N6일 것이라는 여론이 강세였다. 물론, 5 nm일 것이라는 소문은 지속적으로 나왔지만, Apple이 TSMC N5의 최대 발주처로 거듭나면서 우선 순위에 밀린 AMD의 N5 커패시티 확보 전망이 좋지 않았기 때문. 다행히, 공식 로드맵에서 5 nm로 명시되어 경쟁사와 전성비 경쟁에 크게 불리하지 않을 것으로 보인다.
  • 진보된 칩렛 패키징 : 2019년에 출원된 GPU CHIPLETS USING HIGH BANDWIDTH CROSSLINKS ACTIVE BRIDGE CHIPLET WITH INTEGRATED CACHE 특허를 통해 ZEN과 같은 MCM 구조로 유력했었다. 2021년 11월에 발표된 CDNA 2가 칩렛 구조로 밝혀지면서 더욱 확실시됐고, 이윽고 사실로 밝혀진 것. 단, 같이 공개된 CDNA 3가 '3D 칩렛 패키징' 구조라고 강조돼서 진보된 칩렛 패키징과 같은 구조를 가리키는 것인지, 그리고 ZEN 2와 같은 칩렛 구조인지, ZEN 및 CDNA 2와 같은 칩렛 구조인지 구체적인 정보가 아직 없다.
  • 재설계된 컴퓨트 유닛 : 워크 그룹 프로세서 내부의 컴퓨트 유닛 구조가 변경될 것이라는 소문은 지속적으로 등장했으나, 아직까지는 구체적으로 어떤 구조인지는 불명.
  • 최적화된 그래픽스 파이프라인 : 최적화가 구체적으로 어떤 방식을 가리키는 것인지 자세한 정보가 아직 없다.
  • 차세대 인피니티 캐시 메모리 : 같이 공개된 CDNA 3도 차세대 인피니티 캐시 메모리가 도입될 것이라고 발표됐기 때문에, RDNA 3도 이와 같은 기술일 가능성이 있다. 이미 라이젠 7 5800X3D가 면적을 키우지 않고도 캐시 메모리 용량을 크게 늘릴 수 있으면서, 캐시 메모리 용량과 게이밍 성능의 상관관계가 전세계 리뷰어들의 테스트를 통해 증명됐기 때문에, RDNA 3의 인피니티 캐시 메모리도 3D V-Cache 형태로 용량을 늘리려는 것이 아니냐는 추측이 나오고 있다.


2022년 12월 13일에 출시된 3번째 RDNA GPU 마이크로아키텍처. 2020년 3월 공식 로드맵을 통해 처음 알려졌고, 2022년 6월 Financial Analyst Day, 11월 3일 together we advance_gaming 프리젠테이션, 11월 14일[11] 공식 세부 발표 자료를 통해 자세한 정보가 연달아 추가 공개됐다.

2.3.1. RDNA 3.5 (Strix, gfx1150)


【정식 발표 전 정보 펼치기 · 접기】
* 퀘이사존: AMD RDNA 3.5 "GFX 11.5" GPU 드라이버 준비 중, Ryzen 8000 CPU 및 APU 지원 예정
APU Strix Point에 탑재될것으로 추측되는 아키텍처. 호크포인트의 내장 그래픽이 피닉스의 내장 그래픽보다 개선된 성능을 보여주며 # 진짜로 라이젠 8000 시리즈에 탑재된 것으로 추측되기도 했으나 24년 전반기까지 출시된 ZEN 4 제품군에는 해당하지 않는 것으로 보인다.


2024년 3월 21일에 중국 베이징에서 개최된 AI PC 서밋의 로드맵 발표 자료를 통해 존재가 공식으로 확인되었고,[12] 6월 2일에 RDNA 3.5라는 이름으로 공식 발표되었으며, 7월 15일에 자세한 정보가 공개되었다. ( ANANDTECH 출처) 해당 GPU 마이크로아키텍처가 적용된 제품은 7월 28일에 출시되었다. ( ANANDTECH 출처)

공식 발표 이전에는 LLVM 컴파일러 소스코드를 통해 RDNA 3.5의 ISA에서 변경된 점을 암시했었다. ( Chips and Cheese 출처)

하지만, 듀얼 이슈 기능의 효용성 문제는 해결되지 못 한 듯 하다. ( Chips and Cheese 출처) 이는 RDNA 4 마이크로아키텍처로 나아가야 해결될 것으로 보인다.

외장 그래픽 출시 여부는 불명이며, 출시한다면 이전보다 더 안정적인 드라이버, 더 많은 스트림 프로세서, FSR 3.0로 게이밍 그래픽 카드 시장에서 좋은 인상을 남길 것으로 예상된다. 그러나 외장 그래픽은 바로 RDNA 4로 넘어간다고 한다. Strix halo에 탑재될 것으로 예상되는 GPU의 경우 콘솔과 동등한 수준인 40 CU라 예상되고 이는 노트북용 RTX 4070과 비슷할 것으로 예측되고 있다. #[13]

2027년까지 RDNA 3.5 아키텍처를 사용할 것이라는 루머가 있다. 만약 2027년까지 사용된다면 Zen 6 아키텍처를 사용할 것으로 예상되는 Sound Wave까지 RDNA 3.5 아키텍처가 사용될 것으로 보인다.

2.4. RDNA 4 (Navi 4X, gfx????)

2022년 6월 10일, Financial Analyst day 2022의 GPU 로드맵에서 처음 언급된 마이크로아키텍처. 2024년 즈음에 출시될 예정인 것 말고는 더 이상의 정보가 아직 알려져 있지 않았으나, 2023년 2월 14일에 실시된 Radeon Technologies Group의 책임자인 David Wang과 유명 리뷰 사이트인 4Gamer 측의 인터뷰를 통해 RDNA 4의 개발 방향성에 대한 힌트가 제공됐다.

하지만, 레이 트레이싱 성능 문제보다 더 시급한 문제는 듀얼 이슈 기능의 효용성 문제라서 이게 해결되지 못 한다면, 경쟁사의 게이밍용 Ampere 마이크로아키텍처부터 도입되었던 FP32 연산 데이터 경로 설계의 변경을 통한 더블 스피드 프로세싱 기능보다 좋지 않은 채로 혹평 받을 수 있다.

하이엔드 라인이 나온다면 경쟁사의 지포스 RTX 4090을 이길 것으로 예상되나 하이엔드 제품 미출시 루머가 떴다. 또한 그래픽 메모리 역시 18 Gbps급 GDDR6 SGRAM을 유지해 메인스트림~엔트리급 제품만 출시하는 대신 가격은 기존 RDNA 3의 반값이며, 클럭이 3.5GHz를 넘어 약간의 성능 향상이 있을 것이라고 한다.

2.5. RDNA 5 (가칭)

RDNA 3의 단순 개량형인 RDNA 4와 달리 처음부터 다시 만든 아키텍처라고 한다. # 메인스트림 라인에만 나오는 RDNA 4와 달리 고급형도 출시할 것이라고 한다.

2024년 9월에 CDNA와 통합된 UDNA가 발표되면서, RDNA 계열 명칭을 그대로 사용할지는 미지수.

3. 사건 사고

3.1. Verilog 코드 유출 사고

2020년 3월 24일 Navi 10의 Verilog 코드가 GitHub에 유출되는 사건이 일어났다. # 다행인 것은 유출된 코드가 핵심 로직에 대한 RTL(쉽게 말해 하드웨어 설계도)이 아닌 시뮬레이션, 검증에 관련된 코드로 보인다는 점이다. 지금은 AMD에서 DMCA takedown을 걸어 저장소가 삭제된 상태이다. # #

코드의 길이는 약 160만줄이고 958개의 소스 코드 파일로 이루어져 있다.

유출자가 자신의 암호화폐 주소를 README.md에 올리고 유출할 것들이 더 많이 있다고 적어두었기 때문에 실수가 아닌 고의적으로 코드를 유출시킨 악질적인 행위임을 알 수 있다.

3월 25일 AMD에서 이번 사건에 대한 입장을 표명했다. #

자신을 러시아인 여성 해커라고 주장한 유출자는 구매자가 나타나지 않는다면 공개하지 않은 나머지 Navi 10 코드와 ARDEN과 Navi 21의 소스코드도 무료로 배포해버리겠다고 협박했다. # 처음 Navi 10의 코드가 유출됐을 때 소스 코드 파일 목록이 같이 포함됐는데 목록에는 RTL이 포함된 것으로 추정되는[15] 약 25000개의 verilog와 system verilog 파일이 있었다. 해커는 이걸 배포해버리겠다고 협박하면서 구매자를 모으는 중이라 볼 수 있다.

그 후 아무런 소식이 없었기 때문에 사건의 결말은 다음 3가지 중 하나로 추측된다.

3.2. 9세대 콘솔 게임기 관련


9세대 게임기인 Xbox Series X 플레이스테이션 5에 탑재된 RDNA 2가 논란이 되고 있다. AMD의 CEO 리사 수가 직접 나서 해당 콘솔들이 RDNA 2라고 확인시켜줬으나 곳곳에서 그렇지 않다는 폭로와 경향적 증거가 나오고 있다.

엑스박스 시리즈 X는 위에 설명되어 있듯 RDNA 1과 동클럭당 성능이 거의 비슷하며, RDNA 2의 특징인 AV1 하드웨어 디코딩도 빠져있다. 프론트 엔드와 컴퓨트 유닛이 RDNA 1 기반이고 RT코어와 랜더링 백엔드만 RDNA 2라는 소문이 돌고 있었는데 이쪽은 빠른 해명으로 해당사실에 대해서 부정한뒤 아키텍처에 대해서 상세히 밝히면서 논란을 어느정도 해소했다[16]
파일:ElxBMcpWMAcFi_e.jpg [17]
플레이스테이션 5는 상황이 더 심각하다. RDNA 2의 주요 하드웨어 피처인 메쉬 셰이더나 샘플링 피드백 스트리밍, 가변 속도 셰이딩 등 온갖 기능들이 대부분 사용이 불가능하고, RDNA 1에 RT 코어만 붙인거라는 폭로가 나오고 있으며 AMD의 R&D 수석 부사장 데이비드 왕은 PS5가 NAVI 1.X라고 인터뷰하기도 했다. # 이후에는 RDNA 1.1이라고 언급하면서 소개한 Hardwaretimes발 기사가 있으나, RDNA 1.1이라고 명시된 표가 AMD 공식 자료가 아니므로 유의할 것.

자세한 상황은 각 콘솔 항목 참조

4. 관련 문서



[1] 만약 VEGA에서 프리미티브 셰이더가 활성화 돼있었다면 지오메트리 처리 성능은 VEGA56이 RX5700XT를 누루게된다. [2] 이전 GCN 계열 마이크로아키텍처에서는 스칼라 데이터 캐시 메모리가 상수 캐시 메모리 역할도 겸했다. [3] GCN 마이크로아키텍처 발표시 "그래픽은 곧 연산, 연산은 곧 그래픽(Graphic is Compute, Compute is Graphic)"이라고 표현했을 정도이다. # [4] 최저 적중률 30% [5] 관건은 이렇게 분리되어 생산된 칩의 연결을 얼마나 잘 하느냐는 것인데, '울트라-패스트 칩렛 인터커넥트'를 통해 대역폭 밀도가 10배 가까이 높아지고 에너지 효율도 3배 넘게 향상됐으므로, 칩의 연결 문제도 어느 정도 해결됐다고 볼 수 있다. [6] 칩렛 구조 자체는 자사의 RYZEN CPU에서 이미 채택해왔기에, 11월 14일에 추가 공개된 AMD 공식 발표 자료에도 RYZEN CPU의 칩렛 구조와 비교하는 슬라이드가 나왔다. [7] 셰이더 엔진 개수가 최다 4 → 6개로 많아진 것만큼 증가되었을 뿐, 동급으로 계산해서 비교하면 사실상 변화가 없다. [8] 인피니티 캐시 메모리와 GPU 외부 DRAM의 메모리 버스 구성이 정비례 관계를 보여주고 있다. [9] 이 덕분에 같은 인피니티 캐시 메모리 클럭이라도 더 빠른 대역폭을 보여준다. [10] 다만 Video Core Next 문서에 서술되듯 1080P에서 수정 불가능한 하드웨어 레벨의 버그가 있다. [11] 경쟁사의 지포스 RTX 4080 출시 전날. [12] 발표 당시 로드맵에서는 'RDNA 3+'로 표기되어 있었다. [13] 이 경우 CPU가 라이젠 쓰레드리퍼 수준으로 거대해질 수 있다. CCD 2개와 2배가 넘는 GPU를 탑재해야 하기 때문. [14] VCN 문서에서 서술되듯 소프트웨어로 어쩔수 없는 버그들이 RDNA 3에 많다. [15] 파일 이름으로 추정함 [16] 또한 이 과정에서 RDNA 2의 레이트레이싱 성능의 부족함등의 RDNA 2의 예상성능을 어느정도 스포해 버렸으며. 이는 RX6000 시리즈의 성능을 예측할때 도움이 됐다. [17] 이 사진은 RDNA 2에서 발표한 DX12U 주요 사항에 대해서 설명해 놓았기 때문에 DXR을 미지원한다고 표기해놨는데 실제로는 PS5도 별도의 API로 레이 트레이싱을 구성하기 때문에 실기에서는 레이 트레이싱을 볼 수 있다.

파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r197
, 번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r197 ( 이전 역사)
문서의 r ( 이전 역사)