1. Private Use Area
유니코드 문자 집합의 문자 평면 | |||||||||||
{{{#!wiki style="word-break: keep-all; margin:0 -10px -5px; min-height:calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px" |
<rowcolor=#FFF> 기본 | 보조 | |||||||||
<rowcolor=#FFF> Plane 0 0000~FFFF |
Plane 1 10000~1FFFF |
Plane 2 20000~2FFFF |
Plane 3 30000~3FFFF |
Planes 4-13 40000~DFFFF |
Plane 14 E0000~EFFFF |
Planes 15-16 F0000~10FFFF |
|||||
기본 다국어 평면 BMP |
보조 다국어 평면 SMP |
보조 표의문자 평면 SIP |
3차 표의문자 평면 TIP |
(사용 안 함) |
보조 특수 목적 평면 SSP |
사용자 자유 영역 PUA |
|||||
0XXX | 8XXX | 10XXX | 18XXX | 20XXX | 28XXX | 30XXX |
|
문자 없음 | E0XXX | 15: PUA-A | |
1XXX | 9XXX | 11XXX | 19XXX | 21XXX | 29XXX | 31XXX |
|
F0000-FFFFF | |||
2XXX | AXXX | 12XXX | 1AXXX | 22XXX | 2AXXX |
|
|
||||
3XXX | BXXX | 13XXX | 1BXXX | 23XXX | 2BXXX |
|
|
16: PUA-B | |||
4XXX | CXXX | 14XXX | 1CXXX | 24XXX | 2CXXX |
|
|
100000-10FFFF | |||
5XXX | DXXX | 15XXX | 1DXXX | 25XXX | 2DXXX |
|
|
||||
6XXX | EXXX | 16XXX | 1EXXX | 26XXX | 2EXXX |
|
|
||||
7XXX | FXXX | 17XXX | 1FXXX | 27XXX | 2FXXX |
|
|
U+E000 ~ U+F8FF, U+F0000 ~ U+10FFFF[1]
유니코드에서 사용자 정의 영역을 부르는 말. 이 영역에는 특정한 문자가 할당되어 있지 않기 때문에 글꼴 제작자의 의도에 따라 원하는 문자를 배당해서 쓸 수 있다. 때문에 글꼴 간의 호환성이 보장되지 않는다. 예를 들어 같은 U+F0000이어도 글꼴에 따라 다른 문자가 나오는 것이다.
사용자 정의 가능한 문자 수는 기본 평면의 6,400자(U+E000 ~ U+F8FF)와 확장 평면인 15번 평면과 16번 평면의 131,068자(U+F0000 ~ U+FFFFD, U+100000 ~ U+10FFFD)를 합쳐 모두 137,468자이다. 각 영역의 마지막 2자리(U+xxFFFE, U+xxFFFF)는 비문자(Noncharacter) 영역으로 지정되어 문자가 배당되지 않는데, 사용자 정의 평면에도 이 규칙은 예외없이 적용되므로 4자리를 비워야 해서 그렇다.
1.1. 널리 알려진 비표준 예시
대표적으로 아래아한글에서는 이 영역에 키캡 문자, 한글과컴퓨터 로고 등을 배당해놓았다. 아래아한글에서는 2007 버전까지 옛한글과 구결을 처리하기 위해 한양 PUA라는 방식을 사용하였다. 여기서 한양은 폰트 개발사인 한양정보통신을 의미한다. 옛한글 글자들을 유니코드의 사용자 정의 영역에 넣어놓았기 때문에 붙여진 이름이다. 하지만 이것은 표준 방식이 아니었고, 이 때문에 2010 버전에서는 유니코드와 호환되는 첫가끝(초성-중성-종성) 방식으로 옛한글 처리 방식을 바꾸었다. 하지만 과거에 한양 PUA로 작성된 문서를 읽어 들일 수 있게 여전히 한양 PUA를 아래아한글에서 존치 중이다.유니코드 콘소시엄에서 별도의 문자로 인정 안 해주는 구결의 경우 지금도 한양 PUA에 들어간 것을 쓸 수밖에 없다. 유니코드 표준에 실린 구결이 너무나도 적기 때문이다.
클링온 문자 등 역사적 가치나 실질적 사용이 없어 유니코드 표준으로 등재가 거부당하는 인공 문자들을 이 공간에 매핑해서 쓰기도 한다. 대표적인 프로젝트로 PUA 영역에 각종 인공 문자를 배당하기 위한 ConScript Unicode Registry라는 프로젝트가 존재한다.
애플의 기기에서만 보이는 애플 로고 문자는 애플이 이 영역의 끝자락인 U+F8FF에 독자적으로 할당해 놓은 문자이다.
쿠키런 글꼴에서는 이 영역에 각종 쿠키런 모양 딩벳이 포함되어 있다. 원래 상업용 무료 글꼴이지만, 이 딩벳만은 비상업적 목적에 한정하여 사용할 수 있다.
이외에도 유니코드에 배당되지 않은 중세 라틴 문자를 표현하기 위한 MUFI(Medieval Unicode Font Initiative)와 같은 프로젝트가 존재한다.
일부 북한제 폰트에서는 김일성, 김정일, 김정은 전용 글리프를 이 영역에 배당해 놓기도 한다. (U+F11A~U+F122) 김씨 3대의 이름이 보통 글씨보다 굵게 표현된다. PDF로 구현한 북한 폰트의 '김정은' 샘플
2. Pick Up Artist
자세한 내용은 픽업 아티스트 문서 참고하십시오.3. PUA (Potentially Unwanted Application)
사용자가 원하지 않는 사이에 설치되는 프로그램.자세한 내용은 애드웨어 문서 참고하십시오.
[1]
왜 하필 10FFFF까지냐면 UTF-16의 한계점이기 때문.