mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-12-14 12:51:44

퀄컴 Adreno GPU

퀄컴 Adreno에서 넘어옴
1. 개요2. 상세3. 제품 목록
3.1. 1XX
3.1.1. Adreno 1003.1.2. Adreno 1103.1.3. Adreno 1203.1.4. Adreno 130
3.2. 2XX
3.2.1. Adreno 2003.2.2. Adreno 2033.2.3. Adreno 2053.2.4. Adreno 2203.2.5. Adreno 225
3.3. 3XX
3.3.1. Adreno 3023.3.2. Adreno 3043.3.3. Adreno 3053.3.4. Adreno 3063.3.5. Adreno 3083.3.6. Adreno 3203.3.7. Adreno 320 Gen 23.3.8. Adreno 330
3.4. 4XX
3.4.1. Adreno 4053.4.2. Adreno 4183.4.3. Adreno 4203.4.4. Adreno 430
3.5. 5XX
3.5.1. Adreno 5043.5.2. Adreno 5053.5.3. Adreno 5063.5.4. Adreno 5083.5.5. Adreno 5093.5.6. Adreno 5103.5.7. Adreno 5123.5.8. Adreno 5303.5.9. Adreno 540
3.6. 6XX
3.6.1. Adreno 6053.6.2. Adreno 6103.6.3. Adreno 6123.6.4. Adreno 6133.6.5. Adreno 6153.6.6. Adreno 6163.6.7. Adreno 6183.6.8. Adreno 619L3.6.9. Adreno 6193.6.10. Adreno 6203.6.11. Adreno 6303.6.12. Adreno 6403.6.13. Adreno 642L3.6.14. Adreno 6423.6.15. Adreno 6443.6.16. Adreno 6503.6.17. Adreno 6603.6.18. Adreno 6753.6.19. Adreno 6803.6.20. Adreno 6853.6.21. Adreno 6903.6.22. Adreno 695
3.7. 7XX
3.7.1. Adreno 7023.7.2. Adreno 7103.7.3. Adreno 7203.7.4. Adreno 7253.7.5. Adreno 7303.7.6. Adreno 7323.7.7. Adreno 7353.7.8. Adreno 7403.7.9. Adreno 750
3.8. 8XX
3.8.1. Adreno 8103.8.2. Adreno 830
3.9. X 시리즈(PC용)
3.9.1. Adreno X1
4. 참고 링크5. 관련 문서

1. 개요

퀄컴에서 설계하는 GPU 브랜드. 퀄컴의 모바일 AP 브랜드인 퀄컴 스냅드래곤 시리즈 전용으로 사용된다.

2. 상세

전신은 ATI의 모바일 그래픽 사업부다.

원래 퀄컴은 QShader라고 불리는 독자적인 GPU를 개발하고 있었다. 그러다가 ATI로부터 Imageon GPU 아키텍처 라이센스 계약을 맺었고, 이후 공동개발하여 나온 것이 Adreno이다. 그 이후 2009년 1월 ATI로부터 퀄컴이 6,500만 달러에 인수한 것이다.

전통적으로 버텍스 성능은 꽤 괜찮은 편에 비해 픽셀 처리능력은 떨어진다. 때문에 버텍스 위주의 벤치마크가 있다면 역시 점수는 잘 나오겠지만 모바일 게임들을 보면 폴리곤은 적당히 적게 사용하고 그 위에 텍스처를 좀 발라주는 형식인데 이런 게임들은 당연히 픽셀 필레이트가 버텍스보다 비교적 딸리는 Adreno GPU에 별로 맞지 않는 형태. 당연히 버텍스에 중점을 두는 벤치마크는 ARM Mali 그래픽보다 잘 나온다. ARM Mali-400 쿼드코어 기준, 버텍스 프로세서 하나에 픽셀 담당 프로세서가 네 개나 박혀있다. 반면 실 성능이라 볼 수 있는 게임 성능이 딸린다는 것이다.

이는 플레이스테이션 3 CELL-Broadband Engine과 거의 판박이인 특징으로, 모바일 기기의 고성능화에 따라 이러한 하드웨어 사양을 활용할 수 있는 애플리케이션들이 차차 나오겠지만 지금으로서는 비교적 효용성이 낮은 하드웨어 사양을 갖췄는데 거의 비슷한 특성을 지닌 플레이스테이션 3의 CELL-Broadband Engine도 언젠가는 플레이스테이션 3용 부동소수점 프로그램 나올거다라는 말이 차기작이 나올 때까지 반복되었던 것을 떠올리면 희망이 보이지 않는다.

다만, 2012년 말부터 FP32 연산능력이나 텍스처 필레이트 등이 ARM Mali 그래픽보다 더 높은 모습을 보여주고 있다. 최근 AP로 예를 들면, 엑시노스 7 Octa (5433)의 ARM Mali-T760 헥사코어와 스냅드래곤 805 APQ8084의 Adreno 420의 GFX벤치 맨하탄 오프스크린 수치는 각각 17fps, 19fps로 측정되고, 엑시노스 7420의 ARM Mali-T760 옥타코어와 스냅드래곤 810 MSM8994의 Adreno 430은 거의 동급의 성능을 보여준다. 또한 GFX벤치 맨하탄 3.1에서도 ARM Mali-T760 옥타코어보다 약간의 우위를 보여 준다. 하지만 스냅드래곤 810 MSM8994의 경우 제조사들이 알아서 GPU 클럭을 500 MHz 대로 낮추고 있기에 실질적으로는 차이가 나 보인다고 한다. 훨씬 심각한 문제가 있었기 때문에 삼성 엑시노스 7420이 아닌 7410의 Mali-T760과 경쟁해야 하는 성능이 나온다.

GPU 벤치마크 중 로우레벨쪽 GPU 내부 연산 ALU 모듈의 결과만을 보면 거의 항상 타 업체보다 다소 높은 성능을 보여 주는데, 실질적인 하이레벨 결과는 큰 차이가 없다는 점에서 내부적으로 많은 병목 현상이 있는 것이 아니냐는 추측이 있다. ARM Mali 그래픽과 비교하면 최신 API 지원을 잘 안 해주는 편이다. ARM Mali가 최신 API 지원이 가장 빠르고, 최신 API에서 아드레노보다 약간 낮은 GPU 성능을 후속 드라이버 업데이트로 서서히 올려 주는 타입이라면, 아드레노는 그냥 API 지원을 거의 안 해 준다.

3. 제품 목록

3.1. 1XX

3.1.1. Adreno 100

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
? ? MHz ? GPix/s ? GTexel/s ? GFLOPS

3.1.2. Adreno 110

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
? ? MHz ? GPix/s ? GTexel/s ? GFLOPS

3.1.3. Adreno 120

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
? ? MHz ? GPix/s ? GTexel/s ? GFLOPS

3.1.4. Adreno 130

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
? 133 MHz ? GPix/s ? GTexel/s 1.2 GFLOPS
퀄컴 스냅드래곤 시리즈로 모바일 AP 사업이 재편되기 전의 퀄컴의 모바일 AP인 퀄컴 MSM 시리즈에 탑재되었다.

3.2. 2XX

퀄컴 스냅드래곤의 초창기 시절부터 S4까지 함께한 시리즈이다.

전체적인 Adreno 2xx 시리즈의 특징을 살펴보자면 픽셀 성능이 낮은 대신에 통합 셰이더 아키텍처의 특성 상 높은 부동소수점 연산 성능이 버텍스 성능의 향상으로 이어져서 그 당시에는 좋은 소리를 못 들었으나, GL 벤치마크가 GFX 벤치마크로 업데이트 되고 버전이 올라갈수록 점점 버텍스, 높은 연산 성능의 반영비중이 상승하여 타사의 GPU 대비 상대적인 위치가 많이 상승하였다.

3.2.1. Adreno 200

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
8[1] 133~245 MHz 0.133~0.245 GPix/s 0.133~0.245 GTexel/s 2.128~3.92 GFLOPS
퀄컴 스냅드래곤 S1 QSD8x50에 최초로 탑재되었다. 이후, 퀄컴 스냅드래곤 S1 라인업에 속한 모바일 AP에 주력으로 탑재되었다.

3.2.2. Adreno 203

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
16[2] 320 MHz 0.32 GPix/s 0.32 GTexel/s 10.24 GFLOPS
퀄컴 스냅드래곤 S4 Play MSM8x25에 최초로 탑재되었다.

3.2.3. Adreno 205

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
16[3] 266 MHz 0.266 GPix/s 0.266 GTexel/s 8.512 GFLOPS
퀄컴 스냅드래곤 S2 라인업에 최초로 탑재되었다. 사실 이 시기까지는 GPU 성능 비교 자체가 생소한 개념이고 그 당시 사용하던 벤치마크인 쿼드런트나 안투투도 CPU나 다른 요소의 비중이 높아서 별 다른 평가가 존재하지 않는다.

3.2.4. Adreno 220

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
32[4] 266 MHz 0.532 GPix/s 0.532 GTexel/s 17.024 GFLOPS
퀄컴 스냅드래곤 S3 라인업에 최초로 탑재되었다. 위에 표만 봐도 그 당시 타사 AP의 GPU와 비교해 봐도 비정상적으로 높은 FP 성능, 낮은 픽셀 성능이 눈에 띈다. 네이밍에서 두자릿수가 바뀐 만큼 전작 205 대비 성능이 2배 상승했지만 GL 벤치마크 2.1, 2.5 모두 삼성 엑시노스 4210의 Mali-400보다는 물론이고, Apple A5의 SGX543 MP2보다 낮은 실성능을 보여주었다.

3.2.5. Adreno 225

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
32[5] 200~400 MHz 0.4~0.8 GPix/s 0.4~0.8 GTexel/s 12.8~25.6 GFLOPS
퀄컴 스냅드래곤 S4 Plus APQ8060A & MSM8x60A & MSM8960에 최초로 탑재되었다.

GL 벤치마크 2.1상에서는 갤럭시 S2 ARM Mali-400 MP4 266MHz와 비슷한 성능을 보여 준다. 위에서 말했듯이 그 당시의 사용환경을 감안하면 2.1이 실제로 체감되 성능이다. 2.5 결과를 보면 동시기에 나와서 경쟁하던 엑시노스 4412의 Mali-400 MP4 440MHz[6]보다 낮은 성능을 보여 준다. GFX 벤치마크 2.7의 결과를 봐도 결국 엑시노스 4412의 Mali-400을 잡지 못한 걸로 보인다. 사실 이 비교는 5fps 이하의 비교라서 오차범위에 따른 편차때문에 의미가 없다. 이 시기에 Krait 코어를 쿼드코어로 탑재하고 아드레노 320 같은 고성능, 고전력소모 GPU를 모바일 AP에 탑재하면서 본격적인 성능 경쟁이 일어났고 전력소모의 과도한 상승으로 인해 쓰로틀링이 이시기부터 급격히 심해졌다. 당장 예전 Mali-400의 전력소모를 보면 수백 mW 수준이고 엑시노스 5250은 CPU, GPU 전력 소모가 각각 4W에 달해서 휴대폰 탑재는 꿈도 못 꿨지만 지금 통상적으로 사용되는 스마트폰용 모바일 AP는 CPU, GPU 모두 각각 보통 5~6W, Cortex-A53만을 사용하는 저전력 AP부터 까지 범위를 넓게 잡으면 3W에서 15W 이상까지 소모하여서 3~4W대로 쓰로틀링이 걸리는 게 일반적이다.

3.3. 3XX

3.3.1. Adreno 302

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
16[7] 400 MHz ? GPix/s ? GTexel/s 12.8 GFLOPS
퀄컴 스냅드래곤 200 MSM8x10, 퀄컴 스냅드래곤 200 MSM8x12에 탑재된 GPU이다.

3.3.2. Adreno 304

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
24[8] 400 MHz ? GPix/s ? GTexel/s 19.2 GFLOPS
퀄컴 205, MSM8909w, 퀄컴 스냅드래곤 208 MSM8908, 퀄컴 스냅드래곤 210 MSM8909, 퀄컴 스냅드래곤 212 APQ8009AA & MSM8909AA, 퀄컴 스냅드래곤 Wear 2100 MSM8909, 퀄컴 스냅드래곤 Wear 2500 MSM8909, 퀄컴 스냅드래곤 Wear 3100 MSM8909에 탑재된 GPU이다.

3.3.3. Adreno 305

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
24[9] 400 MHz 0.8 GPix/s ? GTexel/s 19.2 GFLOPS
퀄컴 스냅드래곤 S4 Plus MSM8x27에 최초로 탑재되었다. 이후 퀄컴 스냅드래곤 400 MSM8X26/8X30에 주력으로 탑재되었다.

보급형 AP에 들어가는 GPU라서 아드레노 320보다는 부족한 모습을 보여 준다. 페이퍼스펙 상으로는 아드레노 225보다 딸리지만, 실제로 GL 벤치마크 2.5나 GFX 벤치 2.7 결과를 보면 아드레노 225보다 더 높게 나온다. 아드레노 225가 각각 14.5fps, 4.5fps가 나온다면, 305는 무려 17fps, 6.5fps 까지 올라갔다. 이런 류의 효율 상승은 아드레노 510에서도 볼 수 있다. 이쪽은 낮은 FP 성능, 필레이트로 높은 벤치마크 결과를 달성한 케이스. 아마 Adreno 시리즈의 앞자리가 2→3, 4→5로 변하면서 아키텍처 상으로 효율이 상승한 게 아니냐는 의견이 있다.

3.3.4. Adreno 306

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
24[10] 450 MHz 0.9 GPix/s ? GTexel/s 21.6 GFLOPS
퀄컴 스냅드래곤 410 APQ8016/MSM8916에 최초로 탑재되었다. 위의 Adreno 305의 개선 버전으로, 중보급형 AP에 들어가는 GPU라는 것을 감안하면 성능은 상당히 우수하다.

3.3.5. Adreno 308

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP 32 연산 성능
24[11] 598 MHz ? GPix/s ? GTexel/s 28.7 GFLOPS
퀄컴 215 QM215, 퀄컴 스냅드래곤 425 APQ8017 & MSM8917, 퀄컴 스냅드래곤 427 MSM8920에 탑재된 GPU이다.

3.3.6. Adreno 320

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
64[12] 400 MHz 3.2 GPix/s 3.2 GTexel/s 51.2 GFLOPS

3.3.7. Adreno 320 Gen 2[13]

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP 32 연산 성능
96[14] 400~500 MHz 3.2~4.0 GPix/s 2.4~3.0 or 3.2~4.0 GTexel/s 76.8~96.0 GFLOPS
퀄컴 스냅드래곤 S4 Pro MSM8960T & APQ8064에 최초로 탑재되었고, 퀄컴 스냅드래곤 600에서는 ALU 수가 1.5배 올라간 버전이 탑재된 것으로 보인다.

2012년 말부터 사용된 스냅드래곤 S4 Pro로 인해 스냅드래곤이 쓰레기라는 오명을 벗기 시작했고 그 평가에 걸맞게 GPU 성능도 수준급이다. 물론 윗 각주에서 언급한 것처럼 전력소모 상한선이 높아지면서 과도한 쓰로틀링이 걸리기 시작했다. GL벤치마크 2.5의 결과를 보면 2012년 초에 상용화된 엑시노스 4412의 Mali-400을 가볍게 뛰어넘은 모습을 보여주었다.

이후 2013년 초에 동일한 시기에 경쟁한 스냅드래곤 600의 Adreno 320은 엑시노스 5410의 SGX544 MP3보다 높은 성능을 보여 주었고 이 시기부터 동일한 시기[15]에 상용화된 엑시노스 퀄컴 스냅드래곤 대비 높거나[16] 비슷한[17] CPU 성능에 소폭 낮은(보통 1~2fps 정도 차이) GPU 성능을 가지게 되었다.

3.3.8. Adreno 330

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
128[18] 450~578 MHz 3.6~4.624 GPix/s 3.6~4.624 GTexel/s 115.2~150.0 GFLOPS
(2017년 기준)현재까지도 무난하게 사용이 가능한 명품 AP인 퀄컴 스냅드래곤 800, 퀄컴 스냅드래곤 801 시리즈에 사용된 GPU이다. 스냅드래곤 800에는 삼성과 Others사 제품의 GPU 클럭을 각각 550MHz, 450MHz로 세팅해서 차별을 주었고, 스냅드래곤 801에서는 578MHz로 작동된다. 경쟁사인 삼성 엑시노스 5420의 Mali-T628 MP6과 비교하면 Mali-T628은 GFX벤치 3.0 기준 10.6fps, GFX벤치 2.7 기준 25fps의 성능을 보여 주는 데에 비해서 Adreno 330( 퀄컴 스냅드래곤 801 MS8974AC에 탑재된 버전)은 450MHz에서 GFX벤치 2.7 기준 23fps, 578MHz에서는 각각 12fps, 27fps의 성능을 보여 준다. 사실상 동급 성능이라고 볼 수 있다.

엑시노스가 아닌 다른 AP들과 GPU 성능을 비교해 보면, 동일한 시기에 상용화가 되고 GFX벤치에서 각각 13fps, 28fps가 나오는 Apple A7의 PowerVR G6430과 비교해도 전혀 부족한 수준이 아니고, Apple A6X의 GPU 성능은 가볍게 누르고 심지어 2017년에 나왔던 중보급형 AP들이 이 GPU를 뛰어넘지 못했었다.

3.4. 4XX

3.4.1. Adreno 405

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
48[19] 550 MHz ? GPix/s ? GTexel/s 52.8 GFLOPS
퀄컴 스냅드래곤의 400, 600번대 라인업에서 Cortex-A53 옥타코어를 탑재한 대부분의 AP에 들어가는 GPU이다. 보급형 AP에 들어가는 GPU 답게 다른 중국쪽 업체의 AP에 들어가는 GPU 처럼 성능은 별 볼일 없다. 비슷한 급을 찾자면 예전에 스냅드래곤 600에 사용되던 Adreno 320, 역시 비슷한 성능목표를 가진 엑시노스 7580의 Mali-T720 MP2 800MHz와 동급의 성능을 가지고 있다고 한다.

3.4.2. Adreno 418

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
96[20] or 128[21] 600 MHz ? GPix/s ? GTexel/s ?~153.6 GFLOPS
이름에서부터 알 수 있듯이 아드레노 420보다 뭔가 딸린 성능을 보유하고 있다. 화룡의 대체재로 널리 사용된 퀄컴 스냅드래곤 808이 사용한 GPU이다. 플래그십급 스마트폰에서 널리 사용되었지만 성능은 장시간 동안 고사양 프로그램을 돌리지 않는다는 가정 하에 WQHD급 해상도를 문제 없이 구동시킬 수 있는 수준 정도다.

3.4.3. Adreno 420

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
128[22] 500~600 MHz 4~4.8 GPix/s 8~9.6 GTexel/s 128~153.6 GFLOPS
윗 항목의 아드레노 320, 330처럼 플래그십급 AP인 퀄컴 스냅드래곤 805에 탑재된 GPU이다. 엑시노스 5433의 Mali-T760 MP6, Apple A8의 PowerVR GX6450과 경쟁했다. 경쟁 AP들의 GPU 성능을 살펴보면 Mali-T760 MP6이 GFX벤치 3.1 상에서 11fps, 3.0 상에서 17fps, 2.7 상에서 38fps가 나오는 반면에 아드레노 420은 각각 12fps, 18fps , 42fps이 나온다. GX6450은 각각 8.4fps, 19fps, 45fps가 나온다. GFX벤치 3.0과 2.7만 보면 Mali-T760 ≤ Adreno 420 ≤ GX6450이라는 결과가 나온다. 그러나 GFX벤치 3.1의 결과를 보면 GX6450은 뭔가 심하게 낮은 결과가 나온다. 실질적으로 저 세 AP의 GPU 성능은 오차범위내 동급이지만 굳이 따지면 Adreno 420이 가장 좋다.

우수한 GPU 성능 덕에 WQHD에 LTE Cat.6 통신규격을 지원하는 2014년 하반기 플래그십급 스마트폰에 많이 사용되었는데 해상도가 WQHD임에도 불구, FHD + Adreno 330보다 높은 온스크린 성능을 보여주었다.

3.4.4. Adreno 430

ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
192[23] 600~630 MHz 4.8~5.04 GPix/s 9.6~10.08 GTexel/s 230.4~241.9 GFLOPS
퀄컴 스냅드래곤 810에 탑재되어 2015년 스마트폰 시장에서 Mali-T760 MP8 772MHz와 경쟁한 GPU이다. 초창기에는 GFX벤치 3.0에서 측정된 성능이 20fps 초반대여서 26fps으로 측정되는 엑시노스 7420의 Mali-T760 MP8에 비해 낮은 성능을 보여 줬으나, AP 자체의 지속적인 성능 개선으로 600MHz 기준 28fps의 성능을 보여주고 있다. GFX벤치 3.1에서 측정된 성능은 20fps로 16fps로 나오는 Mali-T760 MP8에 비해 우위를 점하고 있다. 다만 GFX벤치 2.7 상에서는 Mali-T760 대비 소폭 열세를 보여주고 있고 GFX벤치 Car Chase offscreen에서도 자세한 이유는 불명이지만 11fps로 측정되는 넥서스 6P를 제외한 나머지 기기의 벤치마크 결과가 6~7fps로 측정되어, 9.1fps로 측정되는 Mali-T760 MP8에 비해 열세인 모습을 보여주고 있다. 그리고 발열논란으로 인해 CPU, GPU 클럭이 낮게 세팅돼서 출시된 기기도 꽤 있는걸 감안해야 한다.

출시 전년에 나온 Apple A8의 GPU보다는 40% 높은 성능을 보여 주었고, 연말에 상용화된 Apple A9의 PowerVR GT7600과 비교하면 25% 낮은 성능을 보여주었다. 성능 자체로만 보면 그 시기에 나올수 있는 적절한 성능인 셈이다.

각종 웹진에서 까이는 스냅드래곤 810에서 그나마 안까이는 요소가 Adreno 430의 GPU 성능인데, 무리하게 성능을 끌어올린 모습이 보여서 그닥 장점으로 보이지는 않는다. 삼성전자 엑시노스 퀄컴 스냅드래곤은 서로 상대방 AP의 GPU 성능에 맞추려고 무리하게 전력소모를 올리는 경향이 있다. 805 vs 5433 때는 엑시노스 5433이 805 수준의 GPU 성능을 얻기 위해 무리하게 GPU 소비전력을 6W 까지 올렸고, 810 vs 7420 때는 7420의 GPU 소비전력이 4W 후반대인데 퀄컴 진영에서 GPU 성능을 잡기위해 소비전력을 7.3W까지 올린 전적이 있다. 밑 항목의 모바일 GPU 전력소모 자료 참고. 물론 삼성 엑시노스 5433(7410)은 발열 등의 면에서 크게 문제가 되지는 않았다. 그러나 스냅드래곤 810이 어떤 꼴이 났는지는 다들 알 것이다.

3.5. 5XX

이름 FP32 ALU 수 동작 클럭 픽셀 필레이트 텍스처 필레이트 FP32 연산 성능
Adreno 504 48[24] 320 MHz ? GPix/s ? GTexel/s 30.7 GFLOPS
Adreno 505 48[25] 450~650 MHz ? GPix/s ? GTexel/s 43.2~62.4 GFLOPS
Adreno 506 48[26] 600~725 MHz ? GPix/s ? GTexel/s 57.6~69.6 GFLOPS
Adreno 508 96[27] 650 MHz ? GPix/s ? GTexel/s 124.8 GFLOPS
Adreno 509 128[28] 430 MHz ? GPix/s ? GTexel/s 110.1 GFLOPS
Adreno 510 128[29] 600~621 MHz ? GPix/s ? GTexel/s 153.6~159.0 GFLOPS
Adreno 512 128[30] 647 MHz ? GPix/s ? GTexel/s 165.6 GFLOPS
Adreno 530 256[31] 510, 624, 653 MHz 6.7(510MHz), 8.1(624MHz) GPix/s 7.7~8.1 GTexel/s 261.1(510MHz), 319.5(624MHz), 334.3(653MHz) GFLOPS
Adreno 540 256[32] 670, 710 MHz 8.0~8.5 GPix/s 10.7~11.4 GTexel/s 343.0(670 Mhz), 363.5(710MHz) GFLOPS
【이론적인 성능 계산식 펼치기 · 접기】
(GPU 클럭) × (SP의 개수) × 2 ÷ 1000 = (FP32 연산 속도) [GFLOPS]
(FP32 연산 속도) ÷ 16 = (FP64 연산 속도) [GFLOPS]
(FP32 연산 속도) = (FP16 연산 속도) [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TFU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

3.5.1. Adreno 504

퀄컴 스냅드래곤 429, 퀄컴 스냅드래곤 Wear 4100, 퀄컴 스냅드래곤 Wear 4100+에 탑재된 GPU이다.

3.5.2. Adreno 505

퀄컴 스냅드래곤 430, 435, 439에 탑재된 GPU이다.

3.5.3. Adreno 506

퀄컴 스냅드래곤 450, 625, 626, 632 에 탑재된 GPU이다.

3.5.4. Adreno 508

퀄컴 스냅드래곤 630에 탑재된 GPU이다.

3.5.5. Adreno 509

퀄컴 스냅드래곤 636에 탑재된 GPU이다.

3.5.6. Adreno 510

ARM Cortex-A72와 Cortex-A53의 조합으로 구성된 퀄컴 스냅드래곤 650, 652, 653에 탑재되는 GPU이다. 스냅드래곤 600번대에 들어가는 GPU 답지 않게 어마어마한 성능을 보여주고 있다. 다만 기존의 600번대와 성능이 큰 차이가 나서 618, 620에서 650번대로 리네이밍된 물건들이다. 초기 벤치마크 결과로는 Adreno 330과 418 사이의 성능을 가질것이라고 추측되었으나, 실제 벤치마크 측정치 상에서는 Adreno 418과 근접하거나 능가하는 성능을 가진다는게 드러났다. 기존의 스냅드래곤 600번대에 탑재되던 Adreno 405가 Adreno 320과 거의 동급의 성능을 가졌었다는 걸 고려하면 성능이 거의 두 단계 차이나는 셈이다.

ALU 수나 내부 구성 등의 자세한 제원은 아직 확실하게 드러난 사항은 없지만, GFX 벤치마크의 로우레벨 테스트로 추측한 제원을 보면 상대적으로 낮은 텍스처 필레이트랑 부동소숫점 연산성능으로 높은 성능을 거둔 것으로 알려져서 성능쪽에서 상당히 효율이 상승한 것으로 보인다.

3.5.7. Adreno 512

퀄컴 스냅드래곤 660에 탑재된 GPU이다.

3.5.8. Adreno 530

퀄컴의 2016년 플래그십급 AP인 퀄컴 스냅드래곤 820, 821에 탑재된 GPU이다. 2016년에 주력으로 쓰일 제품이라서 GPU 성능이 상당히 높게 측정되었다. 탐스하드웨어에 공개된 GFX벤치 결과를 보면 GFX벤치 3.0 상에서 48fps, GFX벤치 3.1 상에서는 30fps를 넘기는 성능을 보여주었고 이 정체불명의 기기 결과를 봐도 각각 48fps, 31fps의 결과를 보여 주는 걸 알 수 있다. Apple A9의 PowerVR GT7600대비 맨해튼 3.0 기준 20% 높고 3.1 기준으로도 약 10% 또는 그 이상으로 매우 높은 성능이다.

갤럭시 S7으로 비교한 결과는 이렇다.

Mali-T880 MP12 650MHz 와 Adreno 530 624MHz의 GFX 4.0 맨하탄 3.1.1 오프기준으로 T880 16.6fps, Adreno 530 16.6fps로 격차가 나지 않는다. Car Chase Offscreen으로는 T880 17.7fps, Adreno 530 19.0fps로 격차가 벌어진다. 문제는 퀄컴 스냅드래곤 820 CPU 성능은 삼성 엑시노스 8890에 비해 밀리고, 그래픽 성능은 Apple A10 Fusion과 모바일 끝판왕인 NVIDIA Tegra X1 에 비해 밀린다.

3.5.9. Adreno 540

퀄컴의 2017년 플래그십급 AP인 퀄컴 스냅드래곤 835(모바일) 퀄컴 첫 PC용 AP인 퀄컴 스냅드래곤 835(PC)에 탑재된 GPU이다. 아난드텍에서 공개한 GFX벤치 결과를 보면 1080p 해상도에서 작동하는 MDP/S 스냅드래곤 835 기준 GFX 4.0 카체이스 온스크린에서 iPhone 7 Plus 및 화웨이 메이트 9보다 성능이 뛰어나며, 최고 성능의 스냅드래곤 820 스마트폰인 픽셀 XL보다 25 % 더 높게 측정되고 오프 스크린 테스트로 이동하면 Adreno 540 GPU가 S820의 Adreno 530보다 25 % 우세한 성능을 보여주는데, 이는 퀄컴의 성능 향상 주장과 정확히 일치한다.

3.6. 6XX

【이론적인 성능 계산식 펼치기 · 접기】
( Adreno ALU 수 = SP수[33] × SP당 ALU수)
(GPU 클럭) × SP수 × SP당 ALU수 × 2 ÷ 1000 = (FP32 연산 속도) [GFLOPS]
(FP32 연산 속도) ÷ 16 = (FP64 연산 속도)[34] [GFLOPS]
(FP32 연산 속도) × 2 = (FP16 연산 속도)[35] [GFLOPS]
(GPU 클럭) × (ROP의 개수) ÷ 1000 = (픽셀 필레이트) [GPixels/s]
(GPU 클럭) × (TFU의 개수) ÷ 1000 = (텍스처 필레이트) [GTexel/s]
(메모리 버스) ÷ 8 × (메모리 실효클럭) ÷ 1000 = (메모리 대역폭) [GB/s]

3.6.1. Adreno 605

Adreno 605
탑재 목록 -
FP32 ALU 수 -
동작 클럭 -
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 -
{{{#!folding [ API 지원 목록 ] - }}}

3.6.2. Adreno 610

Adreno 610
탑재 목록 SM4250-AA SM6115 SM6125 SM6225 SM6225-AD
FP32 ALU 수 128
(1코어, 코어당 128)
동작 클럭 600 MHz 950 MHz 1114.8 MHz 1260 MHz
픽셀 필레이트 - - - -
텍스처 필레이트 - - - -
FP32 연산성능 153.6 GFLOPS 243.2 GFLOPS 285.4 GFLOPS 322.6 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 662, 퀄컴 스냅드래곤 665, 퀄컴 스냅드래곤 680, 퀄컴 스냅드래곤 685, 퀄컴 스냅드래곤 460에 탑재된 GPU이다

3.6.3. Adreno 612

Adreno 612
탑재 목록 SM6150 SM6150-AC
FP32 ALU 수 128
(1코어, 코어당 128)
동작 클럭 845 MHz 895 MHz
픽셀 필레이트 - -
텍스처 필레이트 - -
FP32 연산성능 216.3 GFLOPS 229.1 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.0 }}}
퀄컴 스냅드래곤 675, 퀄컴 스냅드래곤 678에 탑재된 GPU이다

3.6.4. Adreno 613

Adreno 613
탑재 목록 SM4450
FP32 ALU 수 -
(1코어)
동작 클럭 955 Mhz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 -
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 4 Gen 2에 탑재된 GPU이다

3.6.5. Adreno 615

Adreno 615
탑재 목록 SDM670
FP32 ALU 수 256
(1코어, 코어당 256)
동작 클럭 430 MHz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 220.2 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.0 }}}
퀄컴 스냅드래곤 670에 탑재된 GPU이다

3.6.6. Adreno 616

Adreno 616
탑재 목록 SDM710 SDM712
FP32 ALU 수 256
(1코어, 코어당 256)
동작 클럭 504 MHz 610 MHz
픽셀 필레이트 - -
텍스처 필레이트 - -
FP32 연산성능 258.0 GFLOPS 312.3 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.0 }}}
퀄컴 스냅드래곤 710, 퀄컴 스냅드래곤 712에 탑재된 GPU이다

3.6.7. Adreno 618

Adreno 618
탑재 목록 SM7150-AA SM7150-AB SM7150-AC SM7125 SC7180 SC7280
FP32 ALU 수 256
(1코어, 코어당 256)
동작 클럭 610 MHz 700 MHz 800 MHz 750 MHz 825 MHz 825 MHz
픽셀 필레이트 - - - - - -
텍스처 필레이트 - - - - - -
FP32 연산성능 312.3 GFLOPS 358.4 GFLOPS 409.6 GFLOPS 384 GLOPS 422.4 GLOPS 422.4 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 720G, 퀄컴 스냅드래곤 730, 퀄컴 스냅드래곤 730G, 퀄컴 스냅드래곤 732G, 퀄컴 스냅드래곤 7c, 퀄컴 스냅드래곤 7c Gen 2에 탑재된 GPU이다

3.6.8. Adreno 619L

Adreno 619L
탑재 목록 SM6350
FP32 ALU 수 256
(1코어, 코어당 256)
동작 클럭 565 MHz[36]
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 289.3 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 690에 탑재된 GPU이다. Adreno 619와 Adreno 619L의 세부적인 차이는 알수없지만 클럭값이 더 낮은 Adreno 619L을 보면 퀄컴에서 L이 부여된 제품은 기존보다 더 낮은 등급의 제품으로 추측된다.[37]

3.6.9. Adreno 619

Adreno 619
탑재 목록 SM4350 SM4350-AC SM4375 SM6375 SM7225
FP32 ALU 수 256
(1코어, 코어당 256)
동작 클럭 650 MHz 840 Mhz 800 MHz[38]
픽셀 필레이트 - - -
텍스처 필레이트 - - -
FP32 연산성능 332.8 GFLOPS 430.1 GFLOPS 409.6 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 750G, 퀄컴 스냅드래곤 695, 퀄컴 스냅드래곤 480, 퀄컴 스냅드래곤 480+, 퀄컴 스냅드래곤 4 Gen 1에 탑재된 GPU이다.

3.6.10. Adreno 620

Adreno 620
탑재 목록 SM7250-AA SM7250-AB SM7250-AC
FP32 ALU 수 384
(1코어, 코어당 384)
동작 클럭 540 MHz 625 MHz 750 MHz
픽셀 필레이트 - 6.7 GPix/s 8.1 GPix/s
텍스처 필레이트 - - -
FP32 연산성능 414.7 GFLOPS 480 GFLOPS 576 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 765, 퀄컴 스냅드래곤 765G, 퀄컴 스냅드래곤 768G 에 탑재된 GPU이다. 퀄컴의 2016년 플래그십 칩셋인 퀄컴 스냅드래곤 스냅드래곤 821과 대등하거나 소폭 높은 GPU 성능을 보여준다.

3.6.11. Adreno 630

Adreno 630
탑재 목록 SDM845 SDM850
FP16 ALU 수 -
(2코어)
FP32 ALU 수 512
(2코어, 코어당 256)
동작 클럭 710 MHz
픽셀 필레이트 11.4 GPix/s
텍스처 필레이트 17.0 GTexel
FP16 연산성능 -
FP32 연산성능 727.0 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.0 }}}
퀄컴의 2018년 플래그십급 AP인 퀄컴 스냅드래곤 845 퀄컴 스냅드래곤 850에 탑재된 GPU이다. 전작인 Adreno 540 대비 FP32 유닛이 2배로 늘어났고, FP16 유닛 수는 변화가 없다. TMU 유닛 수는 16에서 24로 늘어났으며, ROP 유닛 수는 12에서 16으로 늘어났다. S9의 GFX벤치 결과를 보면 4.0 오프기준 맨해튼 3.1 테스트에서 835칩의 A540과 비교하면 Adreno 540 43.2fps, Adreno 630 60.9fps로 전작보다 41% 향상된 성능을 보여준다. 카 체이스에서는 Adreno 540 25.6fps, Adreno 630 35.4fps의 결과로 전작대비 38.3% 향상된 성능, 맨해튼 테스트에서 Adreno 540 63.9fps, Adreno 630 83.1fps로 30% 향상된 GPU 성능을 보여주는데 이는 퀄컴이 발표한 전작대비 그래픽 성능 30% 향상은 맨해튼 결과 기준으로 보인다. 맨해튼 3.1, 카 체이스는 오히려 그보다 더 올라간 성능을 보여준다.

그리고 커널상 스냅드래곤 845 GPU 클럭은 v1 기준 최대 600MHz, v2 or v2.1 기준 최대 710MHz로 실제 출시된 v2의 10LPP와 비교하면 v1의 10LPE보다 클럭이 18% 향상되었는데[39] 사양이 증가한 덕인지, 공정 대비 클럭을 더 올린덕인지 모르겠지만 쓰로틀링 특성이 기존보다 악화된 모습을 보인다. 835는 최대 3%의 성능하락을 보여주는데 845는 최대 17%의 성능하락을 보여준다.[40] 835 -> 845 v1 이면 같은 10LPE 공정이고 GPU 클럭은 653MHz -> 600MHz로 -8% 하락하였는데 사양 증가때문에 클럭이 8% 낮아져야 전력이 비슷해진다고 가정하고, 여기에 10LPP 공정의 성능향상기준을 반영하면 660MHz인데 710MHz는 여러모로 많이 올린 클럭으로 보인다. 아난드텍 자료에서는 835 대비 전성비가 맨해튼 3.1 기준으로 +17%, 티렉스 기준 +9% 향상된 모습을 보이는데 10LPE -> 10LPP에서 전력효율이 +15% 향상되었으니 아키텍처에 의한 전력효율 개선은 거의 없다고 볼수있다. 다만 엑시노스 9810에 탑제된 Mali-G72 MP18 572MHz와 비교하면 전력소모량은 비슷하지만 성능은 훨씬 앞선 모습을 보여준다.

3.6.12. Adreno 640

Adreno 640
탑재 목록 SM8150-AA SM8150-AB SM8150-AC SM8150-AC
FP16 ALU 수 -
(2코어)
FP32 ALU 수 768
(2코어, 코어당 384)
동작 클럭 585 MHz 675 MHz
픽셀 필레이트 9.4 GPix/s 10.8 GPix/s
텍스처 필레이트 28.1 GTexel 32.4 GTexel
FP16 연산성능 - -
FP32 연산성능 898.6 GFLOPS 1036.8 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 855, 퀄컴 스냅드래곤 855+, 퀄컴 스냅드래곤 860에 탑재된 GPU이다. 전작인 Adreno 630 대비 FP16 유닛 수와 FP32 유닛 수가 50% 증가하였고, TMU 유닛 수가 2배[41] 증가하였다. ROP 유닛 수[42]는 전작 대비 변동이 없다.

3.6.13. Adreno 642L

Adreno 642L
탑재 목록 SM7325 SM7325-AE SM7325-AF
FP32 ALU 수 -
(2코어)
동작 클럭 550 MHz 608 MHz 700 Mhz
픽셀 필레이트 - - -
텍스처 필레이트 - - -
FP32 연산성능 - - -
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 778G, 퀄컴 스냅드래곤 778G+, 퀄컴 스냅드래곤 782G에 탑재된 GPU이다.

3.6.14. Adreno 642

Adreno 642
탑재 목록 SM7350-AB
FP32 ALU 수 -
(3코어)
동작 클럭 490 MHz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 -
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 780G에 탑재된 GPU이다.

3.6.15. Adreno 644

Adreno 644
탑재 목록 SM7450-AB
FP32 ALU 수 768
(3코어, 코어당 256)
동작 클럭 443 MHz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 680.4 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 7 Gen 1에 탑재된 GPU이다.

3.6.16. Adreno 650

Adreno 650
탑재 목록 SM8250 SM8250-AB SM8250-AC
FP16 ALU 수 -
(3코어)
FP32 ALU 수 768
(3코어, 코어당 256)
동작 클럭 587 MHz 670 MHz
픽셀 필레이트 14.1 GPix/s 16.1 GPix/s
텍스처 필레이트 28.2 GTexel 32.2 GTexel
FP16 연산성능 - -
FP32 연산성능 901.6 GFLOPS 1029.1 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 865, 퀄컴 스냅드래곤 865+, 퀄컴 스냅드래곤 870에 탑재된 GPU이다. 전작인 Adreno 640 대비 FP32 유닛 수와 TMU 유닛 수[43]는 변동이 없지만, FP16 유닛 수가 50% 증가하였고, ROP 수가 50%[44] 증가하였다.

3.6.17. Adreno 660

Adreno 660
탑재 목록 SM8350 SM8350-AC SM8350[45]
FP16 ALU 수 -
(3코어)
FP32 ALU 수 768
(3코어, 코어당 256)
동작 클럭 840 MHz 900 Mhz
픽셀 필레이트 20.2 GPix/s 21.6 GPix/s
텍스처 필레이트 40.3 GTexel 43.2 GTexel
FP16 연산성능 - -
FP32 연산성능 1290.2 GFLOPS 1382.4 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 888, 퀄컴 스냅드래곤 888+, 퀄컴 스냅드래곤 G3x Gen 1에 탑재된 GPU이다. 전작과 비교하면 동일한 ALU를 탑제하고 동작 클럭이 비약적으로 향상되었는데 기존 아드레노 650과 같은 구조에 전력 제한을 더 높게 잡아 세팅한 버전으로 추측된다.

실제로 XDA 포럼의 어느 한 유저가 실험 결과, Adreno 650을 940 MHz로 오버클럭시 Adreno 660 840 MHz보다 안투투, 3DMark, GFX벤치 등 모든 부분에서 더 높은 전력 효율과 우세한 성능을 보여주었다.

오버클럭한 Adreno 650 (N7P)은 평균 7.2W의 전력을 소모 하는 반면 오버클럭되지 않은 Adreno 660(SF5E)이 평균 8.5~11W의 높은 전력을 소모하는 결과를 보면 삼성 SF5E 공정은 고전력 환경에서는 TSMC의 N7P에 비해 전력소모가 기하급수적으로 증가한다는 것을 알 수 있다.

3.6.18. Adreno 675

Adreno 675
탑재 목록 SC8180
FP32 ALU 수 -
동작 클럭 590 MHz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 -
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 8c에 탑재된 GPU이다.

3.6.19. Adreno 680

Adreno 680
탑재 목록 SC8180X
FP32 ALU 수 1536
(4코어, 코어당 384)
동작 클럭 585 MHz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 1797.1 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 8cx에 탑재된 GPU이다.

3.6.20. Adreno 685

Adreno 685
탑재 목록 서피스 프로 X
FP32 ALU 수 1536
(4코어, 코어당 384)
동작 클럭 590 MHz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 1812.5 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
서피스 프로 X용으로 커스텀된 칩셋 Microsoft SQ1에 탑재된 GPU이다.

3.6.21. Adreno 690

Adreno 690
탑재 목록 SC8180XP 서피스 프로 X(2020)
FP32 ALU 수 1536
(6코어, 코어당 256)
동작 클럭 660 MHz 680 MHz
픽셀 필레이트 - GPix/s - GPix/s
텍스처 필레이트 - -
FP32 연산성능 2027.5 GFLOPS 2089.0 GFLOPS
{{{#!folding [ API 지원 목록 ] DirectX 12 }}}
퀄컴 스냅드래곤 8cx Gen 2 서피스 프로 X(2020)용으로 커스텀된 칩셋 Microsoft SQ2에 탑재된 GPU이다.

3.6.22. Adreno 695

Adreno 695
탑재 목록 서피스 프로 9( SC8280)
FP32 ALU 수 2048
(8코어, 코어당 256)
동작 클럭 900 MHz
픽셀 필레이트 - GPix/s
텍스처 필레이트 -
FP32 연산성능 3686.4 GFLOPS
{{{#!folding [ API 지원 목록 ] DirectX 12 }}}
퀄컴 스냅드래곤 8cx Gen 3 서피스 프로 9용으로 커스텀된 Microsoft SQ3에 탑재된 GPU이다.

3.7. 7XX

3.7.1. Adreno 702

Adreno 702
탑재 목록 SW5100
FP32 ALU 수 -
(1코어)
동작 클럭 1000 MHz
픽셀 필레이트 - GPix/s
텍스처 필레이트 -
FP32 연산성능 - GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.1 }}}
퀄컴 스냅드래곤 Wear W5 Gen 1, 퀄컴 스냅드래곤 Wear W5+ Gen 1에 탑재된 GPU이다.

3.7.2. Adreno 710

Adreno 710
탑재 목록 SM6450 SM7435-AB
FP32 ALU 수 256
(1코어, 코어당 256)
동작 클럭 676 Mhz 940 Mhz
픽셀 필레이트 - GPix/s - GPix/s
텍스처 필레이트 - -
FP32 연산성능 - -
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3[46] }}}
퀄컴 스냅드래곤 7s Gen 2, 퀄컴 스냅드래곤 6 Gen 1에 탑재된 GPU이다.

3.7.3. Adreno 720

Adreno 720
탑재 목록 SM7550-AB
FP32 ALU 수 -
(2코어)
동작 클럭 975 MHz
픽셀 필레이트 - GPix/s
텍스처 필레이트 -
FP32 연산성능 - GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3 }}}
스냅드래곤 7 Gen 3에 탑재된 GPU이다.

3.7.4. Adreno 725

Adreno 725
탑재 목록 SM7475-AB
FP32 ALU 수 1024
(4코어, 코어당 256)
동작 클럭 580 MHz
픽셀 필레이트 21.55 GPix/s
텍스처 필레이트 -
FP32 연산성능 1187.9 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
스냅드래곤 7+ Gen 2에 탑재된 GPU이다.

3.7.5. Adreno 730

Adreno 730
탑재 목록 SM8450 SM8475
FP32 ALU 수 1024
(4코어, 코어당 256)
동작 클럭 818 MHz 900 MHz
픽셀 필레이트 22.0 GPix/s 24.0 GPix/s
텍스처 필레이트 - -
FP32 연산성능 1675.3 GFLOPS 1843.2 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.1 }}}
퀄컴 스냅드래곤 8 Gen 1, 퀄컴 스냅드래곤 8+ Gen 1에 탑재된 GPU이다.

3.7.6. Adreno 732

Adreno 732
탑재 목록 SM7675-AB
FP32 ALU 수 768
(3코어, 코어당 256)
동작 클럭 950 MHz
픽셀 필레이트 -
텍스처 필레이트 -
FP32 연산성능 1459.2 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3 }}}
퀄컴 스냅드래곤 7+ Gen 3에 탑재된 GPU이다.

3.7.7. Adreno 735

Adreno 735
탑재 목록 SM8635
FP32 ALU 수 768
(3코어, 코어당 256)
동작 클럭 1100 MHz
픽셀 필레이트 - GPix/s
텍스처 필레이트 -
FP32 연산성능 1689.6 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3 }}}
퀄컴 스냅드래곤 8s Gen 3에 탑재된 GPU이다.

3.7.8. Adreno 740

Adreno 740
탑재 목록 SM8550-AB SM8550-AC
FP32 ALU 수 1536
(6코어, 코어당 256)
동작 클럭 680 MHz 719 MHz
픽셀 필레이트 - GPix/s - GPix/s
텍스처 필레이트 - -
FP32 연산성능 2089.0 GFLOPS 2208.8 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3 }}}
퀄컴 스냅드래곤 8 Gen 2에 탑재된 GPU이다.

3.7.9. Adreno 750

Adreno 750
탑재 목록 SM8650-AB SM8650-AC
FP32 ALU 수 1536
(6코어, 코어당 256)
동작 클럭 903 MHz 1000 MHz
픽셀 필레이트 - GPix/s - GPix/s
텍스처 필레이트 - -
FP32 연산성능 2774.0 GFLOPS 3072.0 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3 }}}
퀄컴 스냅드래곤 8 Gen 3에 탑재된 GPU이다. 퀄컴의 발표에 따르면, GPU 성능은 전작에 비해 25% 향상되었다고 한다.

3.8. 8XX

3.8.1. Adreno 810

Adreno 810
탑재 목록 SM7635
FP32 ALU 수 -
(-코어, 코어당 -)
동작 클럭 - MHz
픽셀 필레이트 - GPix/s
텍스처 필레이트 -
FP32 연산성능 - GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3 }}}
스냅드래곤 7s Gen 3에 탑재된 GPU로 2024년 8월 20일 공개되었다.

3.8.2. Adreno 830

Adreno 830
탑재 목록 SM8750-AB
FP32 ALU 수 1536
(12코어, 코어당 128)
동작 클럭 1100 MHz
픽셀 필레이트 - GPix/s
텍스처 필레이트 -
FP32 연산성능 3379.2 GFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 12, Vulkan 1.3 }}}
스냅드래곤 8 Elite에 탑재된 GPU로 2024년 10월 22일 공개되었다. 이때부터 전통적으로 사용되던 타일 기반 렌더링[47] 대신 삼성의 RDNA 기반 Xclipse GPU처럼 즉시 모드 렌더링을 채택했다.

3.9. X 시리즈(PC용)

3.9.1. Adreno X1

Adreno X1
탑재 목록 X1-45 (Adreno 726) X1-85 (Adreno 741)
FP32 ALU 수 : TMU : ROP 768:48:24 1536:96:48
동작 클럭 1107/1367 MHz 1250/1500 MHz
픽셀 필레이트 60 GPix/s 72 GPix/s
텍스처 필레이트 120 GTex/s 144 GTex/s
FP32 연산성능 1.7/2.1 TFLOPS 3.8/4.6 TFLOPS
{{{#!folding [ API 지원 목록 ] OpenGL ES 3.2, OpenCL 2.0, DirectX 11/12, Vulkan 1.3 }}}
세부 스펙 출처 - #1, #2, #3

Adreno X1은 Snapdragon X 시리즈(PC용)에 탑재되는 GPU이다. 혹은 긱벤치 6에서 표기되는 이름으로 Adreno 741이라고도 불린다. 스냅드래곤 X Plus 8코어 버전에 탑재되는 이름은 Adreno 726이라고도 불린다.

구조적인 측면에서는 프론트엔드, SP, 백엔드 구성으로 나눌 수 있다. SP의 구조는 6개의 셰이더 프로세서 블록(SP)으로 나뉜다. 그리고 각 블록은 각 256개의 FP32 ALU를 탑재하고 있다. 1개의 SP 블록 내에는 2개의 uSPTP가 탑재되어 있는데 특이한 점이라면 각 uSPTP의 내에 128개의 FP32 유닛과 256개의 FP16 유닛이 별도로 탑재가 된다는 것이다. 보통은 FP32 유닛 하나가 FP16을 2번 처리할 수 있는 SIMD로 작동하지만, Adreno X는 FP16과 FP32가 공통의 자원을 공유하지 않고 아예 별도의 연산 유닛으로 나뉘어져 있다. 백엔드에는 6개의 ROP가 탑재되어 있는데, 각 유닛은 1 사이클당 8개의 픽셀을 처리하여 결론적으로는 48개의 픽셀이 1번의 사이클에 처리된다.

캐시, VRAM 측면에서는 2개의 SP가 하나의 128KB 캐시(L1 캐시)를 공유하며, 그 위에는 GPU용으로 모든 SP들이 공유하는 1MB L2 캐시가 존재한다. 마지막으로 3MB 크기의 GMEM이 탑재되는데, 이 GMEM은 2.3TB/s의 빠른 속도로 작동하며 ROP가 메모리 대역폭에 묶여서 병목 현상이 생기는 것을 방지한다. 다만 이는 전형적인 SRAM 캐시이며, 용량이 그리 크지 않다는 점이 단점이다.

API 측면에서는 DX11과 DX12, 그리고 Vulkan을 지원한다. 그러나 DX9는 지원하지 않는다. 이 API의 게임은 현실적으로 대부분 15년 넘게 된 게임들이 대다수이며, 인텔 또한 Arc 시리즈에서 D3D9on12를 사용하여 DX9 명령을 DX12로 변환하지만 실질적으로 DX9를 지원하는건 아닌 상황이다.

4. 참고 링크

모바일 GPU 전력소모 데이터(Anandtech)

5. 관련 문서



파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r982
, 번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r982 ( 이전 역사)
문서의 r ( 이전 역사)


[1] 1코어, 코어당 8 [2] 1코어, 코어당 16 [3] 1코어, 코어당 16 [4] 2코어, 코어당 16 [5] 2코어, 코어당 16 [6] 이후에 업데이트를 통해 533MHz로 클럭이 상승함. [7] 1코어, 코어당 16 [8] 1코어, 코어당 24 [9] 1코어, 코어당 24 [10] 1코어, 코어당 24 [11] 1코어, 코어당 24 [12] 4코어, 코어당 16 [13] 가칭 Adreno 320 (96ALU)라고도 부른다. [14] 4코어, 코어당 24 [15] 2013년 상반기 → 5410 vs 600, 2013년 하반기 → 542x vs 80x, 2014년 하반기 → 5433 vs 805, 2015년 → 7420 vs 810 [16] 5410(1600MHz 결과 참고) vs 600(1728MHz 결과 참고), 5433(1300MHz 결과 참고) vs 805(2649MHz 결과 참고), 7420 vs 810 [17] 5420(1900MHz 결과 참고, 싱글 950에 멀티 2900~3000점대) vs 800(2265MHz 결과 참고, 싱글 970에 멀티 2900~3000점대), 5422(1300 MHz 결과 참고, 그래프 상의 1900MHz는 갤럭시 탭 S 10.5의 점수이다. 싱글 970~980점에 멀티 2900~ 3300점대) vs 801(2457MHz 결과 참고, 싱글 최대 1023점에 멀티 최대 3176점) [18] 4코어, 코어당 32 [19] 1코어, 코어당 48 [20] 2코어, 코어당 48 [21] 2코어, 코어당 64 [22] 4코어, 코어당 32 [23] 4코어, 코어당 48 [24] 1코어, 코어당 48 [25] 1코어, 코어당 48 [26] 1코어, 코어당 48 [27] 1코어, 코어당 96 [28] 2코어, 코어당 64 [29] 2코어, 코어당 64 [30] 2코어, 코어당 64 [31] 4코어, 코어당 64 [32] 4코어, 코어당 64 [33] CUDA의 SM에 해당 [34] 다만 실제 adreno GPU는 FP64 배정밀도 연산을 지원하지 않음 [35] FP32 ALU에 Vector Type을 사용하여 2개 FP16 데이터를 동시 연산가능 [36] 출처 [37] L의 약자는 Low로 추정된다. [38] 출처 [39] 10LPE -> 10LPP에서의 공정 성능 향상치라면 10% 정도 였어야한다. [40] 이는 클럭으로치면 596MHz 정도로 수렴한다. [41] 24->48 [42] 16 [43] 48 [44] 16->24 [45] 스냅드래곤 G3x Gen 1 게이밍 플랫폼, 스냅드래곤 888+에서 gpu 클럭을 올린 모델이다. [46] 6 Gen 1은 Vulkan 1.1까지만 지원한다. [47] ARM Mali GPU가 대표적이다.