mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-04-17 15:10:23

닮은꼴 문자

1. 개요2. 유형3. 쓰임4. 양상5. 불편함6. 전산 코드 분리7. 목록
7.1. 특수 문자
7.1.1. 숫자
7.2. 동아시아 문자
7.2.1. 한글
7.2.1.1. 개별 자모7.2.1.2. 음절자
7.2.2. 가나7.2.3. 한자7.2.4. 주음부호
7.3. 서구 문자
7.3.1. 라틴 문자
7.3.1.1. 관련 문서
7.3.2. 키릴 문자7.3.3. 그리스 문자
7.4. 기타
8. 여담9. 관련 문서

1. 개요

서로 닮은 문자들을 모아둔 문서.

2. 유형

거짓짝의 문자 버전이라고 할 수 있으나 어원과 의미가 깊게 관여하는 단어와는 달리 문자에서는 (대체로) 문자 각각에 의미가 들어있지는 않기 때문에 양상이 보다 더 단순하다.

3. 쓰임

외계어 야민정음은 비슷한 글자를 이용한 언어유희의 예이다. 온라인 게임에서 아이디로 자신을 찾지 못하도록 닮은꼴 문자들을 적절히 조합해 아이디를 만들기도 한다.
파일:썬키스트 레몬에이드 2006.jpg 파일:Moonlight Likeness Character.jpg
2000년대 후반 썬키스트의 레몬에이드의 포장. 여러 나라의 문자들을 Lemonade처럼 보이게 배열했다. M을 관계대수 기호 ‘⋈’로, H를 키릴 문자 ‘И’로 바꾼 예.
폰트 디자인을 할 때 이 닮은꼴 문자를 써서 해당 언어의 느낌을 내기도 한다. 예컨대 키릴 문자 Я와 라틴 문자 R은 매우 닮았는데 이를 이용해서 R 대신 Я를 써서 러시아 같은 느낌을 준다. 토이저러스 (ToysЯus)가 그런 예. 이런 걸 '가짜 키릴 문자'(Faux Cyrillic)[7]라고 한다. 영문 위키백과

간혹 문자 모양이 닮아서 아예 철자가 바뀌기도 한다. 네덜란드어 아프리칸스어에서는 ij의 이중문자가 자주 쓰이는데, 이를 필기체로 합쳐서 쓰면 y와 매우 닮았기 때문에 아예 y로 쓰기도 한다. 영어에서 [ð] 음을 나타내기 위해서 과거에 Þ라는 글자를 썼는데(이후 th라는 이중문자로 전환), 이를 오늘날까지 쓰려는 경우 Þ와 모양이 비슷한 y로 쓰기도 한다. Ye olde

특정 문자 체계가 유니코드에 실려있지 않은 열악한 상황에 처해있는 경우 전산 입력이 무척 어렵기 때문에 울며 겨자 먹기로 닮은꼴 문자를 선택해서 쓰는 경우가 있다. 구결의 경우 아직까지 유니코드로 입력하는 것이 불가능해서 이따금 비슷한 모양의 가타카나 주음부호를 사용해 입력하곤 한다.[8] 유니코드에 없어서 위키에 예로도 못 싣는다 과거 인터넷 환경에서는 국가별로 인코딩이 달라서 해당 국가 특유의 문자는 제대로 표시되지 않는 일이 많았기에 일본어 장음 대신 대시( -)를 쓴다거나 하는 잘못된 표기가 사용되기도 했다.

특수 기호의 경우 전산 코드에 등록이야 돼있지만 키보드에는 없고 따로 입력창에 들어가야 하는 불편함이 있기 때문에 자판에 있는 비슷한 글자로 입력하는 경우가 잦다. × X로 입력하는 경우가 많은 게 그 때문. 과거 127자 아스키 코드만이 있었던, 아니 더 오래 전 한정된 수의 글쇠만 있었던 기계식 타자기 시절에는 이들 문자들은 그냥 같이 쓰라고 했다. 컴퓨터 환경에서야 본래 다른 문자가 똑같이 써져있으면 검색이나 처리에 어려움이 있지만 인쇄된 매체에서는 사람 눈에만 얼추 비슷하게 보이면 괜찮기 때문이다. 그래서 빈티지 타자기에서는 소문자 I이나 대문자 O 1 0을 대체했다. 아예 전혀 상관 없는 두 글자를 합자해서 입력하기도 했을 정도니까.

사용자 사칭에도 악용되곤 한다. 그래서 일부 사이트는 지나치게 비슷한 이름으로는 가입조차 막는다. 이런 것에 신경을 쓰지 않으면 사칭이 난무할 수 있다. 대문자 I와 소문자 l이 이런 용도로 악명이 높다.

4. 양상

다른 문자체계와 혼동될 수도 있으며, 같은 문자체계의 다른 문자와 혼동될 수도 있다. 특히 일본어의 경우 라틴 문자, 숫자, 한자, 히라가나, 가타카나 등 여러 문자 체계를 섞어서 쓰는 혼합문자체계이기 때문에 千을 숫자 4로 봤다, 가타카나 チ로 봤다 등등의 사연들이 많이 등장한다.

같은 문자 체계 내의 다른 문자와 헷갈리는 경우 문자 해독을 크게 저해한다. 한글의 경우는 이 문제가 더 크다고 볼 수 있다. 종성에 들어가는 ㄹ과 ㅌ, 중성의 ㅗ, ㅜ 등은 무척 닮아서 홋카이도를 훗카이도로 쓰는 일 등이 벌어진다. 휠윈드 같은 것은 리다이렉트 처리까지 되어있을 정도. 라틴 문자에서도 rn이 같은 라틴 문자인 m과 모양이 비슷해져서 커닝에 신경을 많이 써야 한다.

글자를 잘못 알아보는 경우는 주로 손글씨에서 더 많이 일어난다. 인쇄체로는 그래도 어느 정도 느낌이 달라지도록 분간을 하는데 손글씨에서는 그렇지 않고, 분간하더라도 그 기준이 사람마다 다르기 때문이다. 예를 들어 히라가나 가타카나는 가타카나가 더 직선적이라는 특징으로 구분하는 경우가 많은데, 손글씨로는 똑부러진 직선으로 필기하지 않기 때문에 혼동되기 쉽다. 예를 들어 히라가나 し와 가타카나 レ 등. 인도인을 오른쪽으로 역시 기자가 쓴 손글씨를 편집자가 못 알아봐서 생겨난 어처구니 없는 사례이다.[9] 출판 작업이 디지털화되기 이전에는 작가들이 손으로 쓴 것을 출판사 측에서 읽고 활자로 조판했기 때문에 글자를 비슷한 걸로 잘못 보고 잘못 인쇄하는 일이 심심치 않게 일어났다.

로마 숫자의 경우에도 유니코드에 일단 Ⅳ 같은 것이 개별 코드로 부여되어 있지만 입력하기 더 쉬운 라틴 문자로 대체하는 경우가 많다. 이 경우에는 원래 같은 문자를 용도만 달리 해서 쓴 것이니 '닮았다'라고 하기에는 좀 뭐하다. 일단 유니코드에서 코드를 분리해놓았으니 이 예로 보겠다. 그리스 문자 역시 그리스 숫자로 쓰이는 예가 있다.

같은 글자인데 전산 코드를 다르게 부여해서 의도치 않게 닮은꼴 문자를 생성하는 경우가 있다. 완성형/중복 한자가 그 예.

5. 불편함

번역할 때 닮은 글자로 잘못 보고 오역을 하는 경우도 있다. 블랙 라군에서는 鷲峰라는 성씨에서 鷲(독수리 취, わし)를 鷹(매 응, たか)로 보고 わしみね가 아닌 たかみね로 잘못 읽기도 하였다. 이는 단어의 거짓짝이 오역을 일으키는 것과 비슷하다.

작품 제목 같은 데에 특수 문자가 들어가는 경우 닮은꼴 문자로 달리 입력한 경우가 워낙 많아서 일괄로 검색하기가 어렵다. 나무위키 같은 데에서는 그래서 헌터×헌터 같은 제목은 헌터X헌터로도 들어갈 수 있도록 리다이렉트를 제공하는 편이다.

전산 처리에서 비슷해보이지만 다르게 처리해야 하기 때문에 프로그래머들의 주적이다. 컴파일 에러가 발생했을 때 한참을 찾아도 오류 원인을 모르겠는데 알고 보니 글자 하나가 닮은꼴 문자로 잘못 입력되어있는 경우도 종종 생긴다.[10] 다행히도 이런 것은 vi 같은 걸로 날코딩할 때나 생기던 문제로, 지금 쓰는 통합 개발 환경에서는 몇 번 라인에 구문 오류 발생으로 금방 찾아낼 수 있다.

6. 전산 코드 분리

이러한 닮은꼴 문자에 대해서 전산적으로 처리를 할 때에, '비슷하니까 그냥 하나의 코드로 사용하자'라는 입장을 취할 수도 있고, '분리해야 할 필요가 있다'라는 입장을 취할 수도 있다. 유니코드에서는 이러한 때에 대한 기준을 마련해두었다. # 문서에서는 Å를 A + 고리와 코드를 분리하는 것에 대한 예를 들고 있다.

7. 목록

7.1. 특수 문자

아래의 네 글자는 이음표 용으로 쓰이는 보조 글자가 아니라 그 자체가 개별 음을 가진 문자이다. 개별 글자인 만큼 위의 것들보다는 의도적으로 길게 쓰는 경우가 많다.
* 一(U+4E00): 한자 한 일(一)이다. 한자는 원래 유니코드 개별 이름이 없다.
* ⼀(U+2F00, Kangxi Radical One): 一의 강희자전 부수 버전.
* ㅡ(U+3161, Hangul Letter Eu): 한글 '으'이다.

7.1.1. 숫자

7.2. 동아시아 문자

7.2.1. 한글

한글 자모는 동그라미와 직선으로 구성된 간단한 모양이기 때문에 여기저기 다른 문자와 비슷한 경우가 많다. 와 같은 모양은 쓰지 않는 문자 체계가 오히려 더 드물 것이다. 초중종성이 합쳐진 음절자의 경우 결합 방식이 한자와 비슷하기 때문에 한자와 유사한 경우가 많다.

한글 모음은 아래 종성이 있는 경우 서로 혼동되는 경우가 있다.
7.2.1.1. 개별 자모
7.2.1.2. 음절자

7.2.2. 가나

7.2.3. 한자

총획순으로 정리한다. 한자끼리 비슷한 경우는 닮은꼴 한자 참조.

7.2.4. 주음부호

주음 부호는 한자에서 유래한 것이 많으나 한글이나 로마자와 비슷하게 생긴 문자들이 많다. 제자 원리가 똑같은 가타카나와도 겹친다.

7.3. 서구 문자

7.3.1. 라틴 문자

7.3.1.1. 관련 문서

7.3.2. 키릴 문자

7.3.3. 그리스 문자

7.4. 기타

8. 여담

‘닮은꼴 문자’라는 말은 본래 웹에서 일반적으로 쓰이는 말인지 확인되지는 않았다. 이 위키에 있는 닮은꼴 유명인, 닮은꼴 캐릭터 등의 표제어에서 착안하여 만들어낸 말이다.

9. 관련 문서




파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r2029
, 5번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r2029 ( 이전 역사)
문서의 r ( 이전 역사)


[1] 두 글자의 음이 비슷하다는 것은 세종대왕의 판단인데, 어떤 면에서 비슷한지는 이견이 있다. 참조. [2] U+0041, Latin Capital Letter A [3] U+0410, Cyrillic Capital Letter A [4] U+0391, Greek Capital Letter Alpha [5] U+13AA, Cherokee Letter Go [6] 그런 이유로 훈민정음에서는 "脣音ㅁ,象口形"으로 'ㅁ'과 '口'가 동시에 등장한다. 애당초부터 'ㅁ'의 모양이 한자 '口' 자형의 영향을 받았을 가능성도 높다. [7] pseudo-Cyrillic이라고도 한다. 키릴 문자를 쓰는 언어 중 제일 유명한 언어가 러시아어이다 보니 faux/pseudo-Russian(가짜 러시아어)라고도 한다. [8] 그러나 당연하게도 가타카나/ 주음부호와 닮지 않은 구결 문자도 있기 때문에 논문 본문에 등장하는 예문은 대부분 이미지로 집어넣거나 PUA에서 구결을 표기하는 폰트를 사용한다. 논문 제목에서는 그럴 수가 없기 때문에 다른 닮은 문자를 넣거나 한글 독음으로 대체하거나 하는 고육지책을 쓴다. 옛한글 독음도 잘 깨지는 건 매한가지이지만 그래도 구결보단 낫다 [9] "ハンドル"( 핸들)을 "インド人"(인도인)으로 잘못 본 오류이다. ハ와 イ / ル와 人은 어지간해서 혼동되지 않는데 원고를 쓴 사람이 상당히 악필이었던 모양. [10] 코딩할 때는 언어에 따라 마침표처럼 ;( 세미콜론, U+003B)을 자주 넣는데, 이걸 ; (그리스 물음표, U+037E)로 바꿔놓았다는 장난 글이 올라온 적이 있다. [11] 삼성 키보드나 iOS 키보드의 경우 Bullet과 아래아만 있고, 가운뎃점은 없다. 다만 Gboard에서는 기호 자판에서 입력할 수 있다. [12] 그래서 숫자 0을 쓸 때, 0에다 /를 그어 구분하기도 한다. 프로그래머들은 반드시 해당 조건을 만족하는 글꼴만 사용한다. 0, 1을 고친 것으로 보이지 않게 하려고 /이 아닌 역슬래시 모양 ⧵⧵으로 긋기도 한다. [13] 다만 일부 유럽 국가에서는 20세기 초중반까지만해도 쓰였던걸로 추정되었다. 예시: 1930년대 나치 독일의 호르스트 베셀 엽서. [14] 인명 사이사이에・을 넣는 것과 사실상 같은 용도. 다만 창작물(특히 판타지/ 라이트 노벨) 쪽에서 외국인 인명 표기를 할 때 이러한 구별자로 중간점보다 더블 하이픈을 삽입하는 사례가 종종 있다. [15] 일부 폰트, 특히 모바일 환경에서는 굵게 표시된다. [16] 키보드로 입력이 어려운 것이 원인으로 추정. ♭와는 달리 한글 자음+한자키로는 입력이 불가능하다. 해시의 경우 세로획이 기울어져있는 반면 샤프의 경우 가로획이 기울어져 있다. 대신 ㅁ+한자 키를 누르면 전각 해시태그가 나타난다. [17] #(해시)의 경우 서양에서 쓰이던 무게 또는 숫자를 표기하는 기호에서 유래했으며, ♯(샤프)의 경우 각지게 쓴 소문자 b에서 유래한 것이다. [18] 핫슈타구 스키난다 [19] 단, 최근에 나온 TJ미디어 기기에서는 ♯로 올바르게 표기하고 있다. [20] '다시 듣기(또는 전 단계 복귀)를 원하시면 우물 정(井)자를 눌러 주십시오.' [21] 예 : 3≪1000 [22] 일명 플마 (플러스 마이너스의 줄임말) [23] 弗의 빈도가 크게 줄어든 것은 전한의 8대 황제 '유불릉'(劉弗陵)(BC 87-74)의 피휘 때문이라는 설이 있다. 참조. [24] USD를 뜻하는 용법은 한국과 일본에서만 통용되며(중국에서는 美元이라고 쓴다), 불소는 한중일 모두 통용된다. 한편 플루오린을 나타내는 전용 한자(氟)마저 弗자를 바탕으로 만들어졌다. [25] 이를 이용한 개그로, 마음의 소리에서 실수로 '캠코더71만원'을 '캠코더기만원'으로 바꿔서 팔려 한 내용도 있다. [26] 실제로 어느 일본인 갸루에게 보여줬더니 갸루어로 보인다고 했다. [27] 얼핏보면 으뜸 원(元)자와 비슷하다. [28] 해당 공익광고의 내용은 대다수 한국인조차 같은 글자를 티읕 보다 '이'를 먼저 떠올리는 상황을 지적하며 한글사랑을 외치는 것. 그런데 한글은 모아쓰기 문자라서 낱자로 떼어 놓는 것에 익숙하지 않기 때문이지 로마자에 더 익숙한 사대주의는 아니라는 반론도 있다. [29] 뒷 진술(statement)이 앞 전제(premise)에 의해 연역적으로 유도됨을 뜻하는 기호이다. 즉 [math(A\to B\vdash\neg B\to A)]를 의미한다. 주로 turnstile이라 읽는 편. [30] 이스라엘은 십자가 모양을 혐오해서 덧셈을 + 기호로 쓰지 않는다. [31] 실제로 중학교 수학 과정에서 처음으로 π를 배울 때 낯선 그리스 문자를 쓰는 것이 익숙하지 않은 학생들이 모양이 비슷한 ㅠ로 쓰는 경우가 드물지 않다. [32] 일본어에서는 전각 1칸에 한 단어를 뭉쳐놓은 모양이 꽤 자주 쓰인다. 예를 들어 미터(メートル)→ [33] 돼지머리 계 [다름] 앞의 문자와 코드번호가 다르다. [35] 한글 ''(시옷)자이다. [다름] [그] 한글 ''자이다. [38] 한글 ''(지읒)자이다. [다름] [40] 일본에서 쓰는 우편 기호이다. [41] 한글 ''(아)자이다. [다름] [43] 1번째 문자와 다르나 위아래 길이가 같다. [44] 이것 역시 1번째 문자와 다르지만 위아래가 바뀌었다. [45] 등호 [46] 한글 ''(기역)자이다. [47] 한글 ''(시옷)자이다. [48] 비슷한 문자가 없다. [그] [다름] [51] 한글 ''자이다. [52] 한글 ''(니은)자이다. [53] 이 문자는 앞의 문자의 조금 큰 버전이다. 유니코드부터 다르다. [54] 한글 ''(미음)자이다. [55] 한글 ''(키읔)자이다. [56] 앞의 문자가 반복될 때 사용하는 문자이다. [57] 'え'는 '옷 의(衣)'자의 초서체에서 따온 것으로, 두 자의 근원은 다르다. 다만 '之'의 초서체에서 따온 히라가나가 'し'이고 획의 일부에서 따온 가타카나가 'シ'이다. [58] 일본에서 노동쟁의를 파업이라는 뜻의 영어 'strike'의 줄임말인 'スト(스토)'라고 한다. 'スト'를 거의 붙여 써서 한글 '자'처럼 보이는 예. 한자 '決行中'까지 한글독음으로 착각하기 좋다. 사진의 다른 부분도 우리가 쉽게 접하는 한자이고 가나문자는 거의 없어서 더욱 더 그렇다. [59] 위의 'ㅁ(로)'를 더해서 가야의 건국왕 김수로왕은 일본어로 'キム・スロ(키무 수로)'라고 쎠진다. 한국인이 읽으면... [60] 물리학에서 속도 벡터로 자주 쓰이는 그 [math(\vec{v})]가 맞다. [61] 'ㅁㅈㅏㄱㅗᅁ묵똣'으로 보이는 경우도 있는 모양이다. [62] 실제로 아사히카세이(旭成)라는 회사의 슬로건이 イヒ!다. [63] 개인 소유의 것이나 개인적인 무엇, 즉 '사사롭다' 할 때 그 '사사'를 뜻한다. 훗날 여기에 '禾(벼 화)'자가 붙어 나온 글자가 바로 이 글자와 훈음이 같은 '私'. [64] 부수로 쓰일 때는 '마늘모'라는 이름이 있다. [65] 가타카나 ム의 경우 '牟(소 우는 소리 모)'의 윗부분의 厶를 딴 것. [66] 정체자는 衛, 衞 [67] 당신이 생각하는 원주율 3.14159265358979....의 그거 맞다. [68] 정체자는 叢. [69] 당신은 무슨 이름 으로 불립니까;당신의 이름은 무엇입니까 [70] 본자는 以. [71] 정체자는 . [72] 정체자는 號. [73] 실제로 역사적 가나 표기법에서 合う의 표기는 あふ이다. [74] 정체자는 異. [75] 실제로 한자를 잘 모르는 어린이들은 장기판의 졸을 '쭈(...)'라고 읽기도 한다. [76] 사실 '팔다'의 명사형은 '팜'이 아니라 '팖'이기 때문에 그다지 적절하진 않다. [77] 바람의 나라에선 사자후가 무협에서 나오는 스턴 스킬이 아니라 한 지역 전체에 말을 전하는 전 직업 공통 지존용 마법이다. 만렙(지존)이 되면 직업에 상관없이 배운다. [78] 이 글자가 쓰이는 대표적인 예로 방광(膀胱)이 있다. [79] 일종의 합자로,㍍(メートル, 미터)처럼 각종 단위 등을 욱여넣은 글자를 말한다. [80] 실제로 이러한 사례가 꽤 많으며, 이러한 특성 때문에 한국어 위키백과 등 여러 사이트에서 이를 이용한 사칭 아이디(또는 계정)가 큰 문제가 되기도 하였다. [81] 아가사 크리스티 오리엔트 특급 살인사건에서도 이 문자를 이용한 트릭이 잠깐 등장한 적 있다. [82] C.C.C.P.를 영어권에서 그냥 라틴 문자 읽기로 씨씨씨피 라고 읽는 경우가 많고 아예 이 발음대로 영어사전에 올라있기도 하다. 여담으로, P는 /r/발음일 뿐만 아니라 С는 /s/발음이다. [83] 그래서 이를 가지고 keming이라고 하기도 한다. [84] 파파고 야민정음 띵작을 번역해보면 rnasterpiece가 나온다... [85] 실제로 중세 이전에는 'V'가 모음 앞에서는 /v/, 자음 앞에서는 /u/ 발음이 났는데, 전자가 'V'라는 본래 자형과 함께 독립해나가고 후자가 'U' 자형을 쓰게 됐다. [86] 단 'ju', 'qu', 'xu', 'yu'와 같이 발음은 'ü'인데, 표기할 때 편의상 'u'로 바꾸는 경우는 그대로 'u'로 쓴다. [87] 사실 한어병음에서 'A~Z'까지의 라틴 문자 사이에서 'V'만 안 쓴다. 'V'를 쓸 법한 [v\]는 현대 중국어에서 모두 [w\]가 되었다. [88] 발음은 'ks', '크스' 발음이다 [89] 이 때문에 국립국어원에서는 ×를 '엑스표'라고 읽은 것을 틀린 것으로 규정하고 있다. [90] 이를 이용해 낚시를 한 것 하나가 LaTeX로, " 라텍스"가 아닌, "레이텍"이나 "라텍"으로 읽어야 한다. 사족으로 "레이테흐"나 "라테흐"로 읽어도 된다. [91] 수도는 아니다. 수도는 파라과이 아순시온이라고 적혀 있다.참고로 나무위키 본사가 파라과이 아순시온에 있다. [92] FrontPage처럼 보인다. [93] 대표적 예시를 들어 보면 Cell, City, Cyber, cigarette 등의 단어에서 C가 /s/로 읽히고 있음을 알 수 있다. [94] 山의 한어병음을 키릴 문자로 옮기면 山ань Шань이 된다. [95] 필기체로 쓰면 K와 닮았는데, 이스라엘의 국영방송인 KAN11(11כאן)의 로고를 보면 이렇게 나와 있다. 위키피디아 영문판 [96] 최초 발견자는 주호민으로 보이지만, 정작 주호민 본인도 다른 곳에서 보았다고 밝혔다. 최초 유포자(?) 정도로 보는 게 맞을 듯. [97] 여담으로 심심이가 이것을 쓴 적이 있다(...). [98] 사실 음절 '옹'이라기보다는 ㅇ 밑에 ㅎ을 둔 형태에 가깝다. [99] 이는 유니코드 문서상의 오류로 멱집합을 나타내는 데 쓰이는 '바이어슈트라스 P'이다. [100] 한국어 '시'의 ㅅ 발음이 이에 해당한다. [101] e도 영어가 아니라 를 좌우대칭 후 각도를 틀어 e처럼 보이게 만든 것이다. [102] 이온맛 쿠키로봇의 짝꿍 펫이다. [103] 아르메니아 문자, 구자라트 문자 등 다른 언어가 마구 섞인 문장이며 Thank you Merry Christmas와 비슷해보인다. 이는 2019년 크리스마스 당시 BEMANI 아티스트 후지모리 소타가 트위터에 쓴 글에서 발견됐다.

분류