mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-08-09 13:30:35

EPUB


1. 개요2. 특징3. 일반적인 HTML/CSS와의 관계4. 활용5. 지원 기기, 소프트웨어

1. 개요

EPUB(electronic publication)은 국제 디지털 출판 포럼(IDPF, International Digital Publishing Forum)에서 제정한 개방형 자유 전자서적 표준이다. 보통 epub, 또는 ePub 으로 표기하곤 한다. 공식 표기는 EPUB이다.

2017년 1월 30일 부터 IDPF는 W3C로 통합되었다. 이후 W3C의 워킹 그룹인 Publishing@W3C에서 EPUB 표준을 관리하고 있다. IDPF는 운영을 종료하였고, 더 이상 활동하지 않는다.

2. 특징

HTML CSS의 일부분을 차용한 오픈된 파일포맷 표준으로, 기본적으로 인터넷 연결이 끊어진 상태에서 PDA 또는 노트북 등에서 전자책 열람이 자유롭도록 제정된 전자책 포맷이다. HTML의 일부분이므로 HTML 문서와 같이 다운로드 받는 중간에도 열람이 가능하며, 특히 다양한 크기와 해상도의 화면에 맞춰 내용물의 표시를 조정하는 Reflow 기능이 중점적인 특징이다. 기본적으로는 HTML 로 이뤄진 문서가 ZIP 으로 압축된 모양새이다.

사실 epub는 이전부터 있던 전자책 표준을 승계하여 2007년부터 나온 새로운 표준이다. 기존에 있던 전자책 표준은 txt에 가까운 원시적인 형태였기 때문이다. 기본적으로 텍스트 위주로 고안됐지만 비트맵, CSS, SVG 1.1, 도판이나 수식 등의 일반적인 책에 들어가는 부분도 표시할 수 있다. 다만, 서양에서 만든 규격이라 2.0.1 버전까진 세로쓰기, 일부 한문 및 일어의 표현등 다국어 기능에 제한이 있고 CSS도 완전히 표준에 따른 형태가 아니기 때문에 여러 리더기에서 모두 동일하게 표시되진 않는다는 문제점을 안고 있다. 3.0 버전에선 다국어 기능에 대한 개선은 이뤄졌으나 아직 CSS3을 약간 개조한 부분이 문제가 되고 있는 듯하다.

DRM은 표준에 없으나 Adobe DRM이 업계표준이다. 구글 플레이에서 판매하는 책들이나 미국 도서관에서 빌릴 수 있는 전자책은 이것으로 되어 있다. 하지만 뚫린지 오래된 듯... 이런 이유와 비싼 라이센스 비용 때문에 국내에서는 자체 DRM을 사용한다.

많이 복잡해졌지만 PDF보단 HTML에 가깝게 기능이 전자책 구현에 필요한 것만 단촐하게 들어가 있기 때문에 로딩이 매우 빠르고 부하가 적다. 덕택에 이전의 이북 포맷으로 만들어진 파일은 90년대부터 초창기 eBook 단말기에서도 지원되었을 정도다.(그 당시에도 DOC 파일까지도 지원하는 ebook 단말기는 있었지만 기술적 한계로 txt>epub>>>>>doc로 읽고 넘기는 속도가 구현되었었다.)

3. 일반적인 HTML/CSS와의 관계

웹에서 쓰는 HTML, CSS와 구문 및 사용방법이 완전히 똑같다. 애초에 HTML과 CSS를 별다른 변형 없이 필요한 기능만 그대로 가지고 왔기 때문이다. 이 때문에 웹 기반으로는 epub 뷰어를 만들기도 쉽다. 애초에 epub는 zip 파일 안에 HTML, CSS와 전자책에 쓰는 각종 이미지 및 미디어를 내장하고 있기 때문에, zip 파일만 풀어낸다면 웹 브라우저에 그냥 뿌리는 것이 가능하기 때문이다. 실제로 zip 파일을 풀어서 나온 html 파일을 웹 브라우저에서 열면 웹과 비슷한 화면이 뜨는 것을 볼 수 있다.

물론 그 반대는 어렵다. 애초에 HTML과 CSS에서 전자책에 필요한 기능만 가져온 것이 epub이기 때문이다. 일종의 하위 호환격.

epub 2 버전의 기반은 XHTML 1.1과 CSS 2.1인데, XHTML 1.1은 너무 엄격해서 웹에서는 잘 쓰지 않는 규약이다. 새로 나온 epub 3 버전은 요즘의 트렌드에 맞게 HTML5와 CSS3을 기반으로 하고 있다.

4. 활용

서양에선 절대적이다. 서양에선 최근엔 웬만한 책들도 전자책으로 나오면서 아예 epub 포맷으로 판매되곤 한다. 그리고 그게 크랙되어 웹에 뿌려진다. 단, 2007년도 이전에 나온 텍스트 위주의 구형 표준으로 만들어진 파일이 절대 다수다. 그리고 최근 들어 모바일 단말기와 노트북의 사양이 빵빵해지고 전송속도도 빨라지면서 매우 무거운 PDF 로도 쌩쌩 돌릴 수 있게 되자 기존 DOC 워드 파일과 친숙한 PDF 쪽이 슬슬 인기를 끌고 있다.

한국에선 그냥 TXT, 텍본, 또는 스캔본이 더 일반적이었는데, 이것은 꼬일대로 꼬인 국내 전자책 시장의 문제다. 서양같이 누군가 발벗고 통일된 표준을 만들기는 커녕 각각의 북마켓마다 자기 전용의 규격, 그것도 epub에 비해 한참 허접하고 txt보다 약간 나은 수준의 떨어지는 책들을 만들어 팔고 있는 상태였다. 그러나 2010년대 이후로 전자책 시장은 대부분 epub와 pdf 규격으로 표준화 되어 있다.

2019년 시점에서는 대부분의 예스24, 리디, 알라딘 등 메이저 전자책 상점에서 epub 포맷의 도서를 팔고 있다. 출판사에서도 epub형태의 작업 플로우가 어느정도 정착된 듯, 전자책 상점에서 파는 세 가지 종류의 포맷 중 (다른 두 가지는 PDF와, 만화 이미지 파일을 단순 압축한 ZIP 파일이다) 가장 흔하게 찾아볼 수 있다. 다만 각 유통사별로 DRM이 적용되어 있기 때문에 도서 자체는 표준 epub으로 제작되어 있지만 각 서점사의 전용 뷰어를 사용해야만 열람할 수 있다.

5. 지원 기기, 소프트웨어

EPUB을 읽을 수 있는 소프트웨어는 제법 많이 있으나 EPUB3를 제대로 열 수 있는 것은 별로 없다. 수식이나 동영상 등이 들어가면 경이롭게 느려지거나 안열리는 비참한 모습을 볼 수 있다.

분류