mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-11-03 18:23:09

손실 압축 포맷

손실압축에서 넘어옴
''' 이론 컴퓨터 과학
{{{#!wiki style="display: inline-block; font-family:Times New Roman, serif;font-style:italic"'''
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -1px -11px"
<colbgcolor=#a36> 이론
기본 대상 수학기초론{ 수리논리학( 논리 연산) · 계산 가능성 이론 · 범주론 · 집합론} · 이산수학( 그래프 이론) · 수치해석학 · 확률론 통계학 · 선형대수학
다루는 대상과 주요 토픽
계산 가능성 이론 재귀함수 · 튜링 머신 · 람다대수 · 처치-튜링 명제 · 바쁜 비버
오토마타 이론 FSM · 푸시다운 · 튜링 머신( 폰노이만 구조) · 정규 표현식 · 콘웨이의 생명 게임 · 형식언어
계산 복잡도 이론 점근 표기법 · 튜링 기계^ 고전, 양자, 비결정론적, 병렬 임의접근 기계^ · 알고리즘 · 자료구조 · 알고리즘 패러다임( 그리디 알고리즘, 동적 계획법)
정보이론 데이터 압축( 무손실 압축 포맷 · 손실 압축 포맷) · 채널 코딩(채널 용량) · 알고리즘 정보 이론(AIT) · 양자정보과학
프로그래밍 언어이론 프로그래밍 언어( 함수형 언어 · 객체 지향 프로그래밍 · 증명보조기) · 메타 프로그래밍 · 유형 이론 · 프로그래밍 언어 의미론 · 파싱 · 컴파일러 이론
주요 알고리즘 및 자료구조
기초 정렬 알고리즘 · 순서도 · 탐색 알고리즘
추상적 자료형 및 구현 배열^ 벡터^ · 리스트^ 연결 리스트^ · 셋(set)^ 레드-블랙 트리, B-트리^ · 우선순위 큐^, 피보나치 힙^
수학적 최적화 조합 최적화 외판원 순회 문제 · 담금질 기법 · 유전 알고리즘 · 기계학습
볼록 최적화 내부점 방법 · 경사하강법
선형계획법 심플렉스법
계산 수론 및 암호학 밀러-라빈 소수판별법 · Pollard-rho 알고리즘 · 쇼어 알고리즘 · LLL 알고리즘 · 해시( MD5 · 암호화폐 · 사전 공격( 레인보우 테이블) · SHA) · 양자 암호
대칭키 암호화 방식 블록 암호 알고리즘( AES · ARIA · LEA · Camellia) · 스트림 암호 알고리즘(RC4)
공개키 암호화 방식 공개키 암호 알고리즘( 타원 곡선 암호 · RSA) · 신원 기반 암호 알고리즘(SM9)
계산기하학 볼록 껍질 · 들로네 삼각분할 및 보로노이 도형^Fortune의 line-sweeping 알고리즘^ · 범위 탐색^vp-tree, R-tree^ · k-NN
그래프 이론 탐색^ BFS, DFS, 다익스트라 알고리즘, A* 알고리즘^ · 에드몬드-카프 · 크루스칼 알고리즘 · 위상 정렬 · 네트워크 이론
정리
정지 문제 대각선 논법 · 암달의 법칙 · P-NP 문제미해결 · 콜라츠 추측미해결
틀:이산수학 · 틀:수학기초론 · 틀:컴퓨터공학 }}}}}}}}}


1. 개요2. 특징3. 종류
3.1. 시각 정보
3.1.1. 동영상3.1.2. 정지 영상3.1.3. 크로마 서브샘플링3.1.4. 시각적 무손실 압축
3.2. 오디오
4. 기타5. 같이보기

1. 개요

사진, 음악, 동영상 등 주로 멀티미디어 데이터에서 인간이 지각하기 힘든 범위의 데이터를 버리고 압축하는 방법을 사용하는 포맷. 압축을 하는 과정에서 원본 데이터가 손실되기 때문에 무손실 압축 포맷과 비교된다.

2. 특징

손실 압축은 무손실 압축과는 다르게 인간의 인지와 관련이 있다. 손실 압축은 인간의 두뇌나 감각 기관이 인지되기 어려운 정보를 제거함으로써 실현된다. 때문에 손실 압축 기술은 인지심리학 선형대수학, 컴퓨터 공학을 통해 만들어졌다. 또한 아날로그 손실 압축 기법도 있다. 예를 들면 NTSC, PAL, SECAM은 인간의 시각이 색각보다 밝기에 더 민감하다는 특성을 이용하여[1] 색상(크로마) 신호의 해상도를 줄여 대역폭을 확보했다.

흔히 멀티미디어 데이터로 불리는 영상(정지 영상, 동영상 모두)과 음향 데이터의 저장에 있어 가장 넓게 활용되는 기법이다. 멀티미디어 데이터의 경우 연속적인 데이터를 양자화( 샘플링) 하는 과정에서 화질이나 음질을 높이면 데이터 크기가 지나치게 커진다. 이렇게 되면 네트워크의 제한된 대역폭으로 전송하기 어려울 뿐만 아니라, 저장에 필요한 장치의 용량이 커져야 하므로 비용이 증가하게 된다. 따라서 데이터 크기를 줄일 수 밖에 없는데, 손실을 최소화 하기 위하여 인간이 인지하기 어려운 부분을 잘라내는 것이 손실 압축 포맷의 지향점이다.

예컨대 소리의 경우 일반인이 인지하기 힘든 고주파, 저주파 영역이 삭제되며, 동영상의 경우 인간이 인지하는 색각 정보와 패턴[2]을 토대로 인지하기 힘든 영역을 삭제한다. 이 과정을 거치면 용량이 20%도 채 안 된다. 이 덕에 데이터 보관 및 전송에 있어 경제적으로 아주 효율적이다. 저장 장치나 네트워크[3] 비용을 덜 들이면서 고화질, 고음질 데이터를 보관 및 전송하는게 가능해지기에, 현재도 폭넓게 사용되고 있다.

위에도 적어놓았듯이, 손실 압축은 인지심리학에 기반한 기술이므로, 일반 데이터, 예를 들면 텍스트나 프로그램 코드 같은 경우는 적용할 수 없다. 가령 텍스트 문서에 적힌 내용을 손실 압축하기 위해서는 의미를 추려서 압축해야 하나, 그림이나 소리와 달리 글은 사소한 변화로도 인간의 인지적 변화가 크게 나타나기 때문에 적용하기 어렵다. 문서를 그림과 같은 방식으로 손실 압축할 경우 아예 의미가 없어진다. #
2010년 버전. 2019년 버전.
같은 영상을 여러번 유튜브에 반복해서 올린 결과물. 횟수가 커질수록 미세한 손실이 계속 쌓이고 쌓여 눈에 띄게 증가한다. 이를 학술적으로는 Generation Loss, 또 이를 통해 생긴 시각 또는 청각적으로 손실되어 튀게 보이는 부분을 아티팩트(artifact/artefact) 등으로 쓰지만, 일반적으로는 화질/음질이 깨진다라고 표현한다. 최근에는 이를 디지털 풍화라 부르기도 한다.

멀티미디어가 발달하면서 취급하는 데이터의 용량이 무지막지하게 커지게 되는데, 그것을 효율적으로 사용할 수 있도록 원본에서 안 쓰는 부분[4]을 잘라내서 상당한 용량 절감 효과를 보여준다. 20000Hz 이상을 들을 수 있는 사람은 사실상 없다고 봐도 되기 때문이다. 물론 비손실 압축 포맷에 비해서 단점은 있다. 압축률이 높기 때문에 디코딩에 필요한 프로세싱 자원이 비손실 압축 포맷에 비해 좀 더 많이 든다.

물론 인지하기 힘들다고 해서 인지하지 못하는 것은 아니기 때문에 사진 같은 경우 확대해서 살펴보거나 소리의 경우 코너 케이스[5]에 해당하는 부분만 반복청취 하면 의외로 쉽게 알아차릴 수 있다. 일반적인 상황에서는 크게 의미가 없어서 그렇지.

손실압축을 한 뒤 용량을 더 줄이기 위해 무손실 압축 기법도 같이 이용하는 것이 일반적이다. 그리고 대역폭에 여유가 있으면 손실하지 않고 무손실 압축만 유지하는 것도 가능하다. 그래서 손실압축 음악파일이라도 특정한 조건 아래에서는 인간이 잘 듣지 못하는 20kHz까지도 온전하게 저장하는 것이 가능하다.

3. 종류

3.1. 시각 정보

3.1.1. 동영상

손실 압축은 동영상에서 가장 폭넓게 활용된다. 만약 1080p FHD 60fps 기준으로 음성 없이도 압축을 전혀 하지 않는 경우, 1초에 영상으로만 474MB(전송 기준 약 4Gbps)가 요구된다. 따라서 거의 대부분의 동영상 포맷은 영상 및 음성에 손실 압축을 적용한 포맷을 아주 많이 사용하게 된다. 특이하게 압축 기법을 부호화/복호화의 의미를 가진 코덱(codec)이라 부른다. 이 동영상 코덱들 중에서 근래에 상당히 범용화된 것이 H.264으로 압축 효율성이 뛰어나고 기존의 MPEG 계열 비디오 코덱의 깍두기 현상을 어느정도 해결한 코덱이기 때문. 단, 압축된 영상을 재생하기 위해서는 압축을 풀어나가야 하므로, 처리장치(CPU, 근년엔 GPU도 지원)의 성능이 좋아야 한다. 반대로, CPU 성능의 향상으로 보다 더 효율적인 압축 코덱들이 많이 대중화[6]되었다.

화질보다 속도를 중요시하는(그리고 전송량으로 인한 회선 비용도 더해서) 오디오 스트리밍이나 VOD 같은 서비스는 손실 압축 포맷으로 최대한 용량을 줄이는 것과, 동시에 어느정도 볼만한 화질을 모두 챙겨야 하기에 손실 압축 기술이 이 업계의 핵심이다. 2000년대 중반 CD 플레이어 수준의 영상 품질만 해도 서비스하는 곳이 많지 않았던 시대에 유튜브가 초창기 어도비 플래시 플레이어 기반으로 상당히 성능이 좋은 압축 방식을 사용하며 회선 사용량을 엄청나게 줄이고[7], 더해 편의성을 제공하면서 크게 성공할 수 있었다. 현재도 주요 VOD 관련 업계에서 압축 기법 연구를 투자하고 있는 경우가 많다.

동영상 분야나 디지털 지상파 TV 방송(제작, 송출 모두) 분야에서는 이를 비압축 포맷으로 썼다간 비트레이트 수치가 어머어마해지므로 부하를 막기 위해 어쩔 수 없이 손실 압축 포맷을 사용한다. 방송국에서 사용되는 비디오서버나 TV 방송용 영상조차 비디오부는 손실 압축되어 있다.[8]

🎞️ 비디오 코덱 및 포맷
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1.5px -13px"
<colbgcolor=#555>
<colbgcolor=#555> MPEG-1 · MPEG-2 Part 2(H.262) · MPEG-4 Part.2 ( DivX · Xvid) · H.261 · H.262 · H.263 · H.264 · H.265 · H.266
기타 DV · WMV · Theora · VP8 · VP9 · AV1 · Apple ProRes · Bink · GoPro CineForm · Motion JPEG
컨테이너(확장자) ASF · AVI · BIK · FLV · MKV · MOV · MP4 · MPEG · OGG(OGV) · SKM · TS · WebM · WMV
관련 틀: 그래픽 · 오디오 · 비디오
}}}}}}}}} ||


용량 대비 화질 효율은 일반적으로 MPEG-2 Theora < WMV 9 Xvid (DivX, H.263) < VP8 < H.264 < VP9 < HEVC(H.265) < AV1 < VVC(H.266) 순이다.

화질의 경우 압축 코덱의 발전이 있기 전에는 주로 깍두기 현상과 같이 동화상에서 관측되는 아티팩트들이 많았지만, 현대적 코덱들은 이러한 매크로블록 아티팩트 대신 고주파 요소가 뭉개지는 편으로 변화하고 있는 편이다.

3.1.2. 정지 영상

흔히 말하는 그림[9]. 동영상과의 차이점은 정지 영상은 단일 프레임이라는 점 밖에 없고, 과거에는 해상도가 큰 비압축 그림도 당시 저장장치 용량[10]을 감안하면 지나치게 컸기에 동영상과 비슷하게 JPEG 등 손실 압축을 많이 썼다.

디지털 풍화로 불리는 밈이 이 JPEG의 아티팩트로 인해 생기는 현상이며, 가장 대표격으로 꼽히는 것은 빨간색 정보의 소실이다. 그림판으로 빨간 선을 그은 다음 JPG로 저장하면 빨간색이 탁해지는 현상이 이것으로, 크로마 서브샘플링을 사용해 색차 신호의 해상도가 줄어들면서 생기는 현상이다.

손실 압축 포맷으로는 다음과 같은 것들이 있다.
용량 대비 화질 효율은 JPEG 2000 < JPEG < WebP < HEIF BPG < AVIF 순이다.

한편, 처리 성능 및 저장장치 용량의 발달이 비약적으로 이루어지면서 굳이 JPG같은 손실 압축 포맷을 쓰지 않고 PNG와 같은 비손실 압축 포맷을 쓰려는 경향이 점차 늘어나고 있었는데, 8K 고화질 고용량 영상/사진이 보급되기 시작하면서 HEIF 이후의 포맷들이 출현하고 있는 중이다. 다만 무손실쪽에서는 FLIF라는 것도 출현하고 있다.

일반적인 정지 영상 저장용으로는 사용되지 않지만, 3D 그래픽의 텍스처는 전용 텍스처 압축 포맷을 갖추고 있는데, 이것들도 특성상 모두 손실 압축 방식이다.

🖼️ 그래픽 포맷
{{{#!wiki style="margin:0 -10px -5px; min-width:300px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
<colbgcolor=#555> 비트맵 <colbgcolor=#555> 손실 압축 JPEG AVIF▶Lα · BPG▶α · FLIF▶α · HEIF · WebP▶α · RAW · DDS▶Lα · PSD▶Lα
무손실
압축
APNG▶α · DNG · EXRα · GIF · PCX · PNGα · RGBEα · TGAα · TIFF
무손실 무압축 BMPα
벡터 AI · CDR · SVG
▶: 애니메이션 기능 지원 / L: 다중 레이어 지원 / α: 알파값 지원
관련 틀: 그래픽 · 오디오 · 비디오
}}}}}}}}}

3.1.3. 크로마 서브샘플링

파일:20221018173930_lmmdrypu.jpg

색상에 민감하지 않은 포유류의 시각을 이용한 손실압축 방법이다. 해당 문서 참조

3.1.4. 시각적 무손실 압축

시각적 무손실[16] 압축이란 원본과 압축된 이미지/영상의 차이를 사람의 눈으로 감지하지 못하는 손실 압축을 뜻한다. ISO/IEC 29170-2에서 정의된 표준에 따르면 아래의 시험 환경에서 75%이상의 사람들이 원본과 압축된 이미지을 구분하지 못해야 한다.
파일:ISO29170_1.jpg
파일:ISO29170_2.jpg
모니터와 30PPD[17]의 거리에서 한쪽에는 원본, 반대쪽에는 원본과 압축된 이미지를 빠르게 번갈아 가며 보여주면서 피험자가 어느 쪽이 압축된 이미지인지 선택하도록 했을 때 0.75점 이하가 나와야 한다. 실험에서 1점이 나오면 원본과 압축된 이미지를 확실히 구분할 수 있는 것이고 0.5점이 나오면 구분하지 못하는 것으로 본다.[18]

이름이 이렇게 거창해도 결국은 수학적으로 손실이 있기 때문에 황금눈을 가진 사람들은 원본과 압축된 이미지를 구분할 수도 있으며 보통의 사람들이 일반적인 환경과 대부분의 콘텐츠에서 구분하지 못한다고 무손실 압축인 것처럼 마케팅 하는 것을 좋지 않게 보는 사람들도 있다. 쉽게 말해 MP3 320 kbps를 절대다수의 사람들이 원본과 구분 못 한다고 무손실 압축이라 광고하는 꼴이다. 그러나 Display Stream Compression 같은 시각적 무손실 압축은 크로마 서브샘플링 같이 아예 원본 색상 정보를 날려버리는 손실 압축 포맷에 비해서는 최소한 오리지널 영상 소스는 유지할 수 있는 방식이라 조금 더 발전된 손실 압축이라 할 수 있다.

시각적 무손실 압축 포맷으로는 다음과 같은 것들이 있다.

3.2. 오디오

오디오 포맷의 경우 데이터 형태가 1차원 연속 데이터라 영상에 비해서도 단순하고, 인간이 인지하기 어려운 부분을 쉽게 추려낼 수 있어 손실 압축 포맷을 폭넓게 활용하는 분야다. 원본이 되는 음파는 아날로그 시대부터 신호 처리 등의 연구를 통해 제한된 주파수 대역폭만 사용 가능했던 라디오 등 여러 관련 연구가 일찍부터 진행되었다. MP3만 하더라도 1997년 등장했고, 이미 이 시기의 개인용 컴퓨터에서도 지연 없이 재생 가능한 수준까지 도달했다. 반대로, 저장장치의 용량이 커지고 대역폭이 충분해짐에 따라 최근에는 무손실 압축 오디오 포맷의 상용 사용도 일부 늘어나는 추세이며, 음반 등 제작 분야 안에서는 무손실 압축 음원만을 쓰는 경우도 많아졌다.

오디오의 아티팩트는 무손실 WAV 파일을 주로 MP3 128Kbps 이하로 저장하는 등 비트레이트를 확 줄였을 때 많이 나타나게 된다. CD 등 저장 매체의 의존도가 줄고, 라디오 등 대역폭이 제한된 환경을 마주할 기회가 줄어든 현재는 일부 음원 추출 사이트[19]에서 비트레이트가 제한된 파일을 받았을 때 주로 들어볼 수 있다.

🎵 오디오 코덱
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1.5px -13px"
<colbgcolor=#555> 손실
압축
<colbgcolor=#555><colcolor=#fff>일반 MP1 · MP2 · MP3 · mp3PRO · AAC · Musepack · WMA · Vorbis · Opus · USAC
음성 특화 AMR-NB · AMR-WB · AMR-WB+ · WMA Voice · Speex · Opus · Codec 2 · EVS · Lyra
다중채널 특화 AC-3 · SDDS · DTS · AC-4
블루투스 SBC · aptX · AAC · LDAC · SSC( Samsung Seamless Codec · Samsung Scalable Codec) · LC3
무손실 압축 FLAC · ALAC · APE · TAK · WMA Lossless · TTA · WavPack
무손실 무압축 PCM ( WAV · AIFF)
관련 문서: MIDI · DSD
관련 틀: 그래픽 · 오디오 · 비디오
}}}}}}}}} ||

4. 기타

The Distortion of Sound라는 다큐멘터리에서는 여러 음악가들이 나와서 손실 압축 포맷은 영 좋지 않다고 까고 있는데, 정작 까기만 하고서는 무손실 포맷에 대한 얘기를 하지 않고, 음원을 압축하면 좋지 않다고 비교 청취를 하는 부분에서 압축된 부분은 MP3 64kbps 급으로 뭉턱 잘라먹은 예제를 들어버리고, 압축되지 않았다고 한 부분도 유튜브에서 재생했으니 이미 MP3 256 kpbs 수준으로 압축되었다는 사실을 시청자들에게 알리지 않는 등 굉장히 기만적인 내용으로 진실을 호도하고 있다. 무엇보다도 음질을 논한다는 음악가들 중에는 스티브 아오키, 린킨 파크, 스눕 독, 그리고 믹싱 작업이 잘못되었기로 악명 높은 메탈리카의 Death Magnetic을 믹싱한 Andrew Scheps 등 믹싱 과정에서 음량을 왕창 올리고 음질을 다 깎아먹느라 음질에 대해 얘기할 자격이 없는 인물들이 대거 등장한 탓에 신빙성을 잃어버리고 있다. 다행히도 먼저 녹음부터 제대로 하라고 비판하는 댓글이 종종 보이기는 한다.

5. 같이보기



[1] 영장류를 포함한 포유류 동물이 다 이렇다. [2] 음질의 주파수 영역대와 비슷한 개념이다. [3] 아날로그 신호 또한 대역폭의 한계가 있다. [4] 그 중 음악 파일의 경우는 사람의 귀에 들리지 않는 비가청 주파수를 말한다. [5] 음악의 하이햇이나 신스에 페이저 효과가 적용된 것과 같은 [6] 전술한 H.264만 보더라도 CPU 성능이 충분히 향상된 2000년대 후반부터 본격적으로 쓰이기 시작했다. [7] 물론 구글 인수 전까지는 절대적인 전송량이 너무 많이 필요해서 적자 신세였다고 한다. 네트워크 대역 문제와 스토리지 문제가 돈이 빵빵한 구글 덕분에 해결되었는지 요즘은 8K UHD 같은 고화질 서비스도 한다. 하지만 예전에 올라온 동영상은 고화질 영상이 드물다. 특히 2000년대 영상 대부분이 720p조차 지원하지 않는다. [8] 최대한 화질 손상을 막으며 안정적인 작업을 진행하기 위해 ProRes 등 시각적 무손실의 매개코덱이 많이 사용되고 있다. [9] 다만 오늘날에는 움짤 등으로 대표되는 무음원의 짧은 동영상이 보편화되어 있어, 그림 포맷이 정지 영상 뿐 아니라 WebP나 GIF처럼 동영상을 지원하는 경우도 있다. [10] 예를 들어 3.5인치 플로피 디스켓 1.4MB 기준으로 트루컬러 640x480 그림 한 장을 비압축으로 저장하면 끝이다. [손실선택가능] 규격 내에서 손실/무손실 중 택일할 수 있다. [손실선택가능] [손실선택가능] [손실선택가능] [손실선택가능] [16] Visually Lossless [17] Pixel Per Degree. 30PPD는 모니터와 눈 사이 거리가 FHD 24인치 모니터는 42cm, 4K 32인치 모니터는 18cm다. [18] 둘 중 하나를 임의로 찍으면 0.5점이 나올 것이다. [19] 사이트 자체에는 문제가 없을 수 있으나, 운영비 등을 광고로 충당하고 비용을 아끼고자 음질을 신경 쓸 리가 없다. 당연하지만 유료 음원을 추출하는 행위는 저작권 침해 등의 문제가 될 수 있다.

분류