mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-11-18 04:10:30

MP3


🎵 오디오 코덱
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1.5px -13px"
<colbgcolor=#555> 손실
압축
<colbgcolor=#555><colcolor=#fff>일반 MP1 · MP2 · MP3 · mp3PRO · AAC · Musepack · WMA · Vorbis · Opus · USAC
음성 특화 AMR-NB · AMR-WB · AMR-WB+ · WMA Voice · Speex · Opus · Codec 2 · EVS · Lyra
다중채널 특화 AC-3 · SDDS · DTS · AC-4
블루투스 SBC · aptX · AAC · LDAC · SSC( Samsung Seamless Codec · Samsung Scalable Codec) · LC3
무손실 압축 FLAC · ALAC · APE · TAK · WMA Lossless · TTA · WavPack
무손실 무압축 PCM ( WAV · AIFF)
관련 문서: MIDI · DSD
관련 틀: 그래픽 · 오디오 · 비디오
}}}}}}}}} ||
1. 개요2. 역사3. 특징4. 사양5. 인코더6. 고음질 논쟁7. 파생 코덱8. 여담9. 동음이의어
9.1. MP3 플레이어를 줄여 부르는 말9.2. 베넬리 B76 자동권총의 다른 이름9.3. 마리오 파티 3 (Mario Party 3)

1. 개요

파일:MP3 로고.svg

MPEG-1 / MPEG-2 / MPEG-2.5 Part.3

독일의 프라운호퍼 연구소에서 주도적으로 개발한 오디오 코덱이다.

2. 역사

1993년에 발표한 MPEG-1의 오디오 규격에 맞게 개발되고 MPEG-2와 MPEG-2.5로 확장된 손실 압축 포맷으로서, 압축이 전혀 되어 있지 않은 PCM 음원보다 용량을 1/10 가량으로 줄일 수 있기 때문에[1] 1997년에 일반인들에게 처음 공개되어 등장했던 당시에는 말 그대로 '센세이션' 이었다. 비교적 적은 용량에 CD와 가까운 음질로 들을 수 있었으니... 한국에서는 이 MP3 형태의 음악을 1997년 말에 휴대용 기기로 재생할 수 있는 기술을 잽싸게 개발하고, 그것 또한 빠르게 대중화가 되었다. 해외에서는 1999년 6월에 P2P 기반으로 서비스했던 냅스터를 통해 MP3 파일 공유가 본격적으로 대중화하고 있었다.

하지만 이 때문에 음악 파일의 불법 공유가 늘어나게 되는 부작용 또한 생겼다. MP3를 공유하는 대표적인 P2P 2000년에 처음 서비스했던 소리바다가 있었지만 불법 공유를 방조했다는 이유로 소송을 당해, 배상금을 지불하고 유료 서비스로 전환했다.

MP3 포맷에 대해서는 독일의 프라운호퍼(Fraunhofer) 연구소에서 특허를 가지고 있었다. 따라서 (개인적 사용이 아닌) 상업적인 사용에서는 하드웨어나 상용 소프트웨어를 개발할 때 MP3 포맷을 지원하려면 프라운호퍼 연구소에 로열티를 지불해야 했었다. 그 대안으로 대다수의 응용 소프트웨어(특히 게임)에서는 로열티가 필요없는 Vorbis(ogg)나 Opus를 사용하기도 했었다. 2017년 4월 23일, 미국과 유럽에서 대부분의 특허가 만료되었다. 연합뉴스

3. 특징

처음에는 32/44.1/48 kHz에 고정 비트레이트(CBR - Constant Bit Rate)로만 인코딩할 수 있었지만, 이후에는 8~24 kHz 샘플링 레이트가 추가되고 가변 비트레이트(VBR - Variable Bit Rate)와 평균 비트레이트(ABR - Average Bit Rate)로 인코딩해서 구간마다 비트레이트가 변하게 되어[2] 좀 더 효율적으로 용량 관리를 할 수 있게 되었다. 다만 이 때문에 옛날에 나온 MP3 플레이어에서는 VBR/ABR을 지원하지 않아서 재생이 되지 않는 경우가 있었으며, 재생 시간을 단순히 (파일 용량÷비트레이트) 식으로 계산하는 경우에는 VBR/ABR 파일에서 재생 시간이 잘못 표시되는 경우가 많았다.

MP3는 손실 압축 포맷이다. 즉 CD에서 리핑한 노래를 MP3로 변환을 한 뒤 다시 WAV로 변환해도 MP3로 변환했을 때의 손실된 부분은 이미 되돌릴 수 없다. 같은 이유로 192 kbps짜리 MP3를 320 kbps로 변환해 봐야 음질이 좋아질 일은 절대 없다. 오히려 한 번 더 손실이 일어난다. 원본 소스를 처음에 320 kbps로 인코딩해야 손실 부분이 적다. 즉 추가적인 손실을 막기 위해서는 번거롭더라도 일단 CD나 LP에서 곧바로 WAV나 FLAC으로 추출을 하고, 그 다음에 WAV 파일을 MP3로 별도 복사 변환해야 한다.

MP3 파일은 다른 음원 파일과 마찬가지로 스피커 헤드폰, 앰프 같은 장비의 영향을 받으며[3] 심지어 음원 자체의 영향을 받기도 한다. 어떤 음원은 MP3 128 kbps와 무손실 음원을 변별할 수 없는 경우도 있다. 압축하기 어려운 음원을 꼽자면, 대역폭을 적나라하게 보여주는 전자 음악, 전체적인 음의 경향이 복잡한 끝판왕 박수, 복잡함에 더해 정말 음이 많기까지도 한 헤비메탈이 있다. 굳이 구분해보고 싶다면 이퀄라이저를 적용해보면 티가 좀 나기는 한다.

사실 점수를 매기는 방식인 다른 블라인드 테스트에서는 고난도 음원까지 고려해보면 256 kbps는 가야 무손실과 비등하다라는 결론이 나기도 했으며, 320 kbps에서는 내로라 하는 음향 전문가들조차도 구분하기 힘들 정도로 차이가 적어진다. 즉, 256 kbps 이상의 음원이라면 일반인들은 음질의 차이를 거의 구분하지 못한다. 다만 320 kbps는 그만큼 압축을 적게 하기 때문에 용량이 큰 편이다. TWICE Alcohol-Free의 경우 128 kbps는 3.32 MB, 192 kbps는 4.83 MB, 320 kbps는 8.03 MB가 나온다. 5분 34초짜리 음원은 192 kbps가 7.64 MB인 반면 320 kbps로 하면 12.74 MB가 나온다.

물론 MP3 코덱 자체는 현재 기준으로는 기술 자체가 어느정도 낡았기에 당연히 압축 효율성은 그 이후에 나온 WMA, Vorbis, AAC, Opus 등에 비해 떨어진다. 더구나 AAC는 MP3의 압축효율성을 높이기 위해 개선된 직계자손뻘인 코덱. 그런데도 MP3 포맷이 이미 오래전부터 널리 퍼져 많이 쓰이고 있는 보편화된 포맷이고, 우수한 성능을 가진 LAME 인코더의 힘으로 2021년 현재에도 사장되기는 커녕 잘만 쓰이고 있다. 몇몇 공모전에서는 MP3 포맷이 강제된다. 물론 어디까지나 음악이나 음성(어학용) 부분에서 그렇지 유튜브 같은 영상 분야에서는 MP4 + H.264 + AAC가 보편화된 2010년대부터는 거의 사용하지 않는다.

음악 파일 기준으로 2009~2011년 출시된 삼성 TV와 2008~2013년 출시된 LG TV에서 유일하게 지원하는 오디오 포맷이다. 물론 USB 포트에 꽂은 경우만 해당된다. 그 이전 출시된 TV에는 USB 포트가 없거나, 펌웨어 업데이트 목적으로만 사용되었다.

64kbps 이하 저음질의 경우 이 코덱 이외에는 거의 언급되지 않는다. 가령 음질은 HE-AAC/Opus 24 kbps와 MP3 64 kbps가 서로 비슷하지만 전자는 언급되지 않는데 MP3 이외의 오디오 코덱을 알면서 막귀인 경우가 드물고, 저장장치의 평균 용량이 늘어나고 인터넷 속도가 빨라지는 등의 이유로 저 비트레이트에 대한 관심이 줄어든 것이 원인이다.

샘플링 레이트(kHz)가 높은데 비트 레이트(kbps)가 낮은 경우 소리가 뭉개지며, 반대의 경우 높은 비트 레이트에 비해 고음이 들리지 않는다. 채널 및 비트 레이트별 권장 샘플링 레이트는 대체로 다음과 같다.
비트 레이트
(kbps)
샘플링 레이트
(kHz)
스테레오 모노
8 8
16 8 11.025[4]
24 11.025 12
32 12 16
40~48 16 22.05
56~64 22.05 24
80~96 24 32 / 44.1
112~160 32 / 44.1 44.1 / 48
192~320 44.1[5] / 48

태그 방식으로 ID3를 사용한다. ID3v1은 파일의 끝부분에 태그 정보를 저장하며, 고정된 필드 길이를 이용하기 때문에(TITLE 32바이트 등) 일정 길이 이상을 저장하지 못하며, 파일 전송이 완료되어야만 태그정보를 볼 수 있는 문제점이 존재한다. ID3v2는 파일의 첫부분에 태그 정보를 저장하며, 가변 필드길이, 사용자 필드, 바이너리 필드, 유니코드 등을 지원하며 태그길이나 언어 제약이 없고, 앨범아트 등도 MP3 파일 내부에 저장할 수 있다. ID3v2 규약상 파싱하지 못하는 프레임은 무시하고 건너뛰어야 하는데, 이를 제대로 지키지 않은 일부 플레이어에서는 이를 제로샘플로 디코드하는 문제가 있다.

MP1(MPEG-1 Audio Layer I)과 MP2(MPEG-1 Audio Layer II)도 있다. MP1은 1991년 MP2와 함께 규격이 발표되었으나, 너무 일찍 나온데다 구조도 너무 단순한 나머지 활성화되지 못했고 MP2와 MP3에 자리를 내 주어야 했다. MP2는 나온 지 오래되었음에도 불구하고 2010년대 중반까지 aptX와 함께 라디오 방송 장비용으로 쓰였다(이후 WAV AAC, FLAC 등으로 서서히 대체되었다).

AVI, MKV, MPEG, MP4 컨테이너에서 지원하고 있다.

웹 브라우저에서의 호환성은 다음과 같다. # HTML5 기준이므로 ActiveX NPAPI를 이용한 경우[6]는 반영되지 않았다.
사파리 4 이상 2009년 6월 8일[macOS]
2010년 9월 8일[iOS]
파이어폭스 3.5 이상 2009년 6월 30일
크롬 4 이상 2010년 1월 25일
안드로이드 내장 브라우저 2.3 이상 2011년 2월 22일
인터넷 익스플로러 9 이상 2011년 3월 14일
오페라 15 이상 2013년 7월 2일
엣지 12 이상 2015년 7월 29일

4. 사양

5. 인코더

MP3의 음질을 크게 결정하는 것이 비트레이트임에는 분명하나 인코더의 종류와 설정에 따른 영향도 지대한 것으로 알려져 있다. 판정의 편의를 위해 명백하게 음질열화가 일어나는 수준(64~96 kbps 정도)으로 인코딩 해 보면 비교적 간편하게 차이를 느낄 수 있다.

흔히들 사용하는 LAME은 꽤 좋은 인코더다. 원래 프라운호퍼 같은 다른 MP3 인코더에서는 압축 효율성이 비교적 나쁘다. # 황금귀들이 320 kbps로 인코딩하면 v3.94 이후의 LAME이 20 kHz에서 자른다고 불평할 때[10] 다른 인코더는 16 kHz에서 자르는 모습을 보여준다. LAME이 없었더라면 MP3는 빠르게 AAC나 Vorbis로 대체되었을지도 모른다. 반대로 음질이 중요하지 않은 어학용 MP3의 경우 프라운호퍼 등 저효율 인코더를 사용한 경우가 꽤 있다.

6. 고음질 논쟁

320 kbps만 돼도 가청 주파수 영역 전체를 포함하고 있기 때문에 전문가들도 256 kbps 이상부터는 잘 구분하지 못한다. 실제 실험에서 참가한 전문가 중 어릴 적 사고로 특정 영역대의 고음만 구별할 수 있게 된 사람만이 정확하게 구분해 냈다고 한다. Sonneriefr.com

비트레이트에 따른 고주파 손실 그래프
파일:attachment/testwav.jpg 파일:attachment/test2_16_o.jpg
PCM 원본
파일:attachment/test320.jpg 파일:attachment/test2_16_320.jpg
MP3 320 kbps
파일:attachment/test128.jpg 파일:attachment/test2_16.jpg
MP3 128 kbps
320 kbps MP3의 경우 20,000 Hz 이상의 대역이 손실된다. 사람의 가청 주파수가 20~20,000 Hz라는 걸 감안하면 들리지도 않는 가청 주파수 밖의 고주파음만을 없앨 뿐이다. 게다가 20,000 Hz라는 것도 청신경이 완전한 어린이나 듣는 것이 일반적이고, 본래 사람은 성장하면서 빠른 속도로 고주파 청취능력을 상실한다. 초등학생, 중학생, 고등학생, 청년, 중년의 가청 한계 주파수가 모두 다르다. 괜히 틴 버즈가 있는게 아니다. 일반적으로 각각 20,000 Hz, 19,000 Hz, 18,000 Hz, 17,000 Hz, 16,000 Hz까지 들을 수 있다. 거기에 더해 음질까지 신경쓰면서 음악감상을 하는 사람들 귀라면 이미 수많은 음악을 들으며 청세포를 손상시켰을 테니 일반적인 경우보다 더 하향시켜 생각해야 한다. 요리를 다양하게 먹을 수록 발달하는 미각 후각과는 달리 청각은 음악을 많이, 자주 들을수록 손상된다. 그 이유는 소리를 듣는 원리가 굉장히 소모적이기 때문이다. 특히 미각의 주체인 미뢰는 재생력도 굉장하지만, 청각은 세포가 소모되면서 들리는 원리인 동시에 그 세포가 다시 생기는 일이 거의 없다시피하다. FLAC와 비교해서 차이를 느끼는 게 더 이상하다. 유의미한 차이가 느껴진다면 그건 MP3 디코더와 FLAC 인/디코더의 성능차이일 가능성이 높다.

이런 이유에서 멜론, 벅스, 지니뮤직 등 음원 다운로드 사이트에서 오직 음질 때문에 MP3 대신 FLAC을 찾는 건 그리 합리적이지 않다. FLAC과 같은 무손실 압축 음원의 의의는 대개 음원의 신뢰성 확보 및 재인코딩[11]으로 인한 열화 방지에 있다.

간혹 음악 관련 커뮤니티에 무손실이 더 듣기 좋다는 주장이 종종 보이는데, 초고역대는 믹싱할 때 프로듀서나 엔지니어도 신경 안 쓰고 대부분 잘라내거나 그냥 방치해두는 영역이다. 비유하면 화가가 캔버스에 그림을 열심히 그려놨는데 캔버스 밖 영역을 보면서 그림이 이렇다 저렇다 분석하는 꼴이다. 설사 정말 예민하고 특별한 고막을 가져서 320 kbps와 무손실을 구분한다고 하더라도 그 구분이 '음악이 더 좋게 들린다' 를 의미하지 않으므로 무의미하다고 할 수 있다. 종종 등장하는 무손실 vs 손실 abx 블라인드 테스트를 통과하는 사람들도 반복청음을 통해서 얻은 기교에 가까운 기술로 분간을 할 따름이지, 무손실이 명백히 우월하다고 말하진 않는다. 초고역대 주파수를 활용해서 고주파 영역의 지분이 큰 악기의 잔향 등으로 구분해 내는데, "10번쯤 들어보니 무손실 음원의 하이햇 잔향이 미묘하게 오래 남는다" 같은 구분은 실제 음감에선 매우 무의미한 영역이다. 오히려 초고역대를 많이 들으면 귀에 쉽게 피로감이 와서 음악이 더 안 좋게 들릴 수 있다. 또 '귀로는 안 들려도 몸으로 느낀다'라고 주장하는 사람들도 종종 보이는데, 세상 그 어떤 믹싱 엔지니어도 파동이 우리 몸에 주는 물리적 영향까지 고려해가면서 믹싱을 하지 않는다.

결론적으로 일반인은 올바르게 직출된 256 kbps부터는 인체의 한계로 원본과 구분이 불가능하다. foobar2000에서 플라시보 퇴치에 큰 도움을 주는 ABX 테스트 컴포넌트가 있으니 한번 테스트해보자.

반면 MP2, WMA, AAC, Vorbis, Opus 등 다른 코덱에는 이런 논쟁이 거의 없으며 실용성을 중시하는 커뮤니티와 황금귀에 우호적인 커뮤니티 양쪽으로부터 무시받는다. 전자는 앞에서 설명했듯이 구별이 불가능하다는 이유로, 후자는 무손실 코덱에 관심이 많고 MP3를 제외한 타 손실 압축 포맷에 무지한 편이기 때문이다. 일례로 MP2와 Opus는 각각 고비트레이트(256 kbps 이상)와 저비트레이트(64~128 kbps 전후)에서 유리하나, 384 kbps에서 이 둘을 비교하는 경우는 거의 없다.[12]

7. 파생 코덱

일반 MP3와 하위 호환이 가능하며, 2010년대 들어 사장되었다.

파일:CC-white.svg 이 문단의 내용 중 전체 또는 일부는
문서의 r189
, 1번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문단의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r189 ( 이전 역사)
문서의 r ( 이전 역사)

8. 여담



[1] 128kbps 기준. 참고로 PCM의 비트레이트는 44.1kHz, 16bit, Stereo(스테레오) 기준 1411.2kbps이다. 그러나 기본적으로 128kbps는 극고음역에서 인지할 수 있는 차이가 있기 때문에 별로 권장하지는 않는다. [2] 소리가 많이 나오는 부분에서는 높은 비트레이트로, 소리가 거의 없을 때엔 낮은 비트레이트로 바뀌는 식이다. [3] 평범한 일반인들이 192 kbps만 돼도 320 kbps와 구분을 잘 못하는 이유가 음질에 집착하는 수준이 아니다보니 재생장비를 비싸게 투자하지 않는 것도 있다. [4] 어도비 애니메이트의 기본 설정이다. [5] 대부분의 MP3 음원에서 사용하는 음질이다. [6] 주로 <embed><object> 태그를 사용하여 웹 페이지에 Windows Media Player를 첨부하는 식으로 사용되었다. [macOS] [iOS] [9] 별도의 옵션을 지정하지 않은 경우 [10] v3.99부터는 VBR 0에 한해 20 kHz 이상을 보존한다. 비트레이트는 CBR 320 kbps보다 낮게 할당하지만 v3.100 기준으로 실제 음질은 VBR V0쪽이 더 좋다고 한다. # 이에 대해서는 LAME이 v3.99부터 VBR에 Bit reservoir를 적극적으로 활용해서 그런 것이라는 분석이 있다. # # [11] 압축 포맷이나 비트레이트를 전환해야 할 경우가 있을 수 있다. 이때 무손실 압축 음원을 소장하고 있었다면 불필요한 손실 없이 어떤 포맷/비트레이트로든 재인코딩이 가능하다. 또한 볼륨, 피치를 조절한다거나 긴 음악을 자른다거나 하는 경우 추가적인 손실을 피하려면 어차피 무손실 압축으로 전환해야 하므로 처음부터 무손실 음원을 소장하는 것이 합리적이다. [12] 굳이 따지자면 대역폭은 MP2 20.3 kHz, Opus 20 kHz로 MP2가 좀 더 넓고, 디코딩 속도도 MP2가 2~3배 더 빠르긴 하다. 그러나 대역폭은 가청주파수 밖의 범위라 의미 없으며 대역폭/스펙트럼 만으로는 정확한 음질 비교가 어렵다. 디코딩 속도 역시 MP2든 Opus든 충분히 빠르기에 무의미하다. [13] 즉 사용 가능한 모든 MP3 지원 기기에서 아무런 손도 안 대고 이 파일을 재생해 볼 수 있다! 물론 음질은 전용 기기가 아니므로 320kbps로 나오고 실제 음질도 그렇다. [14] 플러그인을 지원해주는 플레이어 자체가 얼마 없을 정도로 심각하다. [15] OZ DRM File의 약자로 추정. Open Document Format과 헷갈리기 쉽지만 확장자는 *.ods(스프레드시트)/*.odp(프레젠테이션)/*.odt(워드프로세서)로 다르다. 이것말고 *.mp3.roz도 있다. Windows Media Player 전용 플러그인을 설치하면 재생할 수 있다. [16] KTF용으로 출시된 애니콜 피처폰은 dosirak 외에 Anycall PC Manager Plus로도 전송이 가능했는데, 여기서는 *.smp라는 또다른 확장자를 사용한다.

파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r256
, 번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r256 ( 이전 역사)
문서의 r21 ( 이전 역사)

9. 동음이의어

9.1. MP3 플레이어를 줄여 부르는 말

MP3P로도 많이 불린다. 1의 매체를 재생하기 위한 소형 기기를 일컫는 말.

9.2. 베넬리 B76 자동권총의 다른 이름

특히 .32 스미스&웨슨 탄환을 쓰는 형태는 MP3S라고 불린다.


파일:CC-white.svg 이 문서의 2010년 10월 이전 저작자는 r199~r213의 수정 코멘트에서 확인할 수 있습니다.


9.3. 마리오 파티 3 (Mario Party 3)

파일:상세 내용 아이콘.svg   자세한 내용은 마리오 파티 3 문서
번 문단을
부분을
참고하십시오.