mir.pe (일반/어두운 화면)
최근 수정 시각 : 2023-12-13 22:52:01

TeraScale

VLIW5에서 넘어옴
파일:관련 문서 아이콘.svg   관련 문서: AMD/GPU
,
,
,
,
,


||<-2><tablewidth=100%><tablebordercolor=#000000><bgcolor=#000000><color=#ffffff><height=70>
||<-2><tablealign=center><tablebordercolor=#000000><tablebgcolor=#000000> 파일:AMD Radeon 로고 화이트.svg ||<(> {{{#!wiki style="letter-spacing:-0.5px" TeraScale 아키텍처 기반 제품군 ||
||
{{{#!wiki style="margin: -16px -11px;" <colbgcolor=#ed1c24><colcolor=#ffffff> TeraScale 1
(R600 Family ISA)
HD 2000 시리즈 · HD 3000 시리즈
TeraScale 1
(R700 Family ISA)
HD 4000 시리즈
TeraScale 2
(Evergreen Family ISA)
HD 5000 시리즈
HD 6000 시리즈
TeraScale 3
(HD 6900 Series ISA)
}}}
◀ 이전
-
다음 ▶
GCN 아키텍처 기반 제품군


1. 개요2. 배경3. TeraScale의 전신4. 세대별 TeraScale 일람
4.1. TeraScale 1 (gfx3, R600)4.2. TeraScale 1 (gfx3, R700)4.3. TeraScale 2 (gfx4)4.4. TeraScale 3 (gfx5)
5. 관련 문서

1. 개요

AMD/ ATI두 번째 통합 셰이더 마이크로아키텍처. VLIW SIMD 방식을 사용했으며, NVIDIA의 첫 번째 통합 셰이더 모델인 G80 아키텍처부터 DirectX 11을 지원하는 페르미 아키텍처까지 경쟁했다. 인텔에도 Tera-Scale이란 연구 프로그램이 있어 혼동될 수 있으니 주의.

2. 배경

하드웨어 내부적으로는 2007년 R600부터 해당되는게 맞지만, 그 당시에는 그냥 R600 아키텍처로 알려져 있었다. 그러다가 2008년 RV770이 나오고 좀 지난 시점에 지금의 아키텍처 이름으로 발표되었다. HD 4800 시리즈에서 1 TFLOPS의 FP32 연산 성능을 달성한 것에 따온 이름인 듯 하다.

3. TeraScale의 전신

사실 첫 번째 통합 셰이더 구조의 마이크로아키텍처는 2005년 11월 22일에 출시된 7세대 콘솔 게임기인 Xbox 360의 Xenos GPU였다. 비록 그래픽 파이프라인이 DirectX 10 이후 버전이 아닌 9.0c 기반이지만, DirectX 10의 통합 셰이더와 DirectX 11의 정식 기능이 된 하드웨어 테셀레이션 기능이 일부 담겨진 9.0c 확장 버전에 가까운 특이한 구조를 지니고 있다. 하지만 개발 당시 둘 다 DirectX에 정식으로 반영되지 않은 비표준 기능이라서 널리 활용되지 못 했다.

4. 세대별 TeraScale 일람

4.1. TeraScale 1 (gfx3, R600)


2007년 5월에 등장한 초대 TeraScale 마이크로아키텍처로, 라데온 HD 2000 시리즈부터 사용되었다. DirectX 10을 정식으로 지원함에 따라 통합 셰이더 및 지오메트리 셰이더 기능이 본격적으로 활용되기 시작했지만, 경쟁사의 최상위 라인과 경쟁할 수도 없을만큼 실성능이 처참했다. 그것도 모자라 90nm 공정으로 제조되어 6개월 먼저 등장한 경쟁사의 G80과는 다르게 80nm 공정이라는 좀 더 앞선 하프 노드 공정을 채택했음에도 전력 대비 성능 비가 그다지 뛰어난 편은 아니었다. 비효율적인 구조로 인해 GPU 내부적으로도 병목 현상이 심해진 것이 주요 원인으로 꼽혔다.

2007년 11월에 등장한 라데온 HD 3000 시리즈부터는 전 라인 55nm 공정으로 미세화되어 실리콘 다이 사이즈가 크게 줄어들었다. 전력 소모의 주범 중에 하나였던 메모리 버스 구조를 최대 512-bit에서 256-bit로 대폭 하향되어 메모리 대역폭이 40% 넘게 축소되었다. 그 대신 GPU 클럭을 높여 동급 내지는 10% 넘는 게이밍 성능을 보여주었다. 단, 메모리 대역폭이 크게 축소되었기 때문에 고해상도 환경에서는 성능이 하락되는 경우도 있으나 평균적으로는 엎치락뒤치락 수준. 미세화된 공정답게 전성비도 크게 개선되었다.

4.2. TeraScale 1 (gfx3, R700)


2008년 6월에 등장한 라데온 HD 4000 시리즈부터 도입된 마이크로아키텍처로, 이때부터 FP32 연산 성능이 1 TFLOPS를 돌파해서 그런지 마이크로아키텍처 이름을 TeraScale로 명명되었다. 이에 따라 이전 세대도 똑같이 TeraScale로 소급 적용되었기 때문에 이전 세대와 구분할 때 기존 명칭대로 R600, R700으로 구분하는 편이다.

R600의 비효율적인 구조를 뜯어 고쳐서 병목 현상을 완화하는 것이 주안점. 명목상 같은 1세대라도 구조적으로 유의미한 차이가 있어서 "1.5세대"로 봐도 무방할 정도. 최다 SIMD 엔진 개수가 2배 넘게 비대해졌는데 최다 렌더 백엔드 4개, ROP 16개로 이전 세대와 똑같아서 병목 현상이 심할 것처럼 보이지만, 실제로는 많은 개선 사항 덕분에 병목 현상이 그다지 심하지 않고 경쟁사의 최상위 GPU였던 G80과 G92를 능가하는 성능을 보여주었다.

4.3. TeraScale 2 (gfx4)


2009년 9월에 등장한 라데온 HD 5000 시리즈와 2010년 10월부터 등장한 HD 6800 시리즈 이하에 적용된 마이크로아키텍처. 연산 구조는 VLIW5 방식으로 이전과 동일하며, 체급이 커진 것 빼고는 구조적으로 이전 세대와 비슷하다. 얼핏보면 이전 세대 구조의 확장판 느낌. 다른 점이라면 테셀레이터가 DirectX 11에 대응되어서 그동안 비표준으로써 독자 SDK에 의존해야 하다보니 제대로 써먹지 못 했던 것에서 마이크로소프트 표준 기능으로써 제대로 써먹을 수 있게 된 것이 가장 큰 차이점이다. 그 외에도 디스플레이 엔진이 발전되어 2560×1600 해상도의 각각 4배 또는 6배를 지원하며, Eyefinity를 지원하게 되었다. 해당 아키텍처는 HD 6800 시리즈 이하 라인, APU인 온타리오, 자카테, 라노에도 채택되었다.

1개의 메모리 컨트롤러 안에는 32비트 메모리 채널에서 64비트 메모리 채널로 다시 확장되었고, FMA(Fused Multiply-Add), MAD(Multiply-Add), IEEE 754-2008 표준, SAD(Sum of Absolute Differences) 등의 지원이 추가되었다.

4.4. TeraScale 3 (gfx5)


2010년 12월, Northern Islands 제품군 중 라데온 HD 6900 시리즈 한정으로 도입되었다. 기존의 하나의 명령어 포트를 공유하는 5-way VLIW, 즉 4개의 ALU와 1개의 SFU(Special Function Unit)[1]에서 4개의 ALU인 4-way로 변경되었으며, SFU는 3개의 ALU를 사용해 작동하도록 바뀌었다. 이러한 변화로 인하여 동일 면적 대비 10% 더 많은 SIMD 엔진을 탑재할 수 있게 되었으며, DirectX 11과 OpenCL에서의 성능 향상이 존재한다. 그래픽스 엔진에서는 래스터라이저 말고도 테셀레이터를 비롯한 다른 하드웨어 블록들도 2개로 완전히 이원화되었고, 울트라 테셀레이션을 적극적으로 활용한 고사양 게임의 성능이 크게 향상되었다. 해당 아키텍처는 APU인 트리니티, 리치랜드에도 사용되었다.

하위 라인인 HD 6800 시리즈는 HD 5000 시리즈와 동일한 TeraScale 2 기반이지만, 테셀레이터만큼은 진보되었기 때문에 테셀레이션 기능을 적극적으로 활용한 DirectX 11 게임에서 HD 5800 시리즈보다 더 나은 성능을 보여주기도 한다. HD 6700 시리즈 이하 라인들은 이전 세대와 완전히 같은 아키텍처로 재탕되었다.

5. 관련 문서


[1] ALU 역할도 수행할 수 있다.