mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-12-30 12:22:15

대문자와 소문자

대문자에서 넘어옴

1. 개요2. 용례
2.1. 영어2.2. 독일어2.3. 기타 언어
3. 기원4. 문자 체계
4.1. 대문자·소문자를 사용하는 문자 체계4.2. 다른 문자에서
5. 컴퓨터에서6. 나무위키에서 대문자·소문자에 따라 문서가 달라지는 예
6.1. 전체 대문자
6.1.1. 원소 기호6.1.2. SI 단위
6.2. 특이 배열
7. 작은 대문자(small capitals)8. 기타

1. 개요

대소문자(, letter case)는 로마자, 키릴 문자, 그리스 문자 유럽 계열 언어의 문자에서 사용하는 개념으로, 같은 글자를 큰 것(대문자, Capital Letter)과 작은 것(소문자, Small Letter)으로 쪼개 놓은 것이다. 이렇게 두 종류로 쪼개진 문자 체계를 영어로는 bicameral이라고 한다.[1] 한글이나 한자, 아랍 문자, 데바나가리 문자처럼 대문자와 소문자의 구별이 없이 한 가지 형태만 있는 문자를 단일형 문자(unicase, unicameral)라고 부른다.

대문자와 소문자는 글말( 문어)에선 당연히 구분할 수 있지만, 입말( 구어)에선 발음만으로는 구분이 불가능하다. 대문자와 소문자의 차이만으로 단어와 문장의 뜻 전체도 차이날 수 있으므로 이때는 문맥에 따라 유추하거나 아니면 화자가 사전에 '이 단어에선 대문자를 쓴다'라고 따로 언급해야 한다.

한국에서는 보통 영어를 배우면서 처음 로마자를 접하므로 영어를 배우면서 처음 접하게 된다.

2. 용례

2.1. 영어

영어에서 (일반적으로는) 다음과 같이 쓰인다. 다만, 모든 상황에서 아래의 설명을 100% 따르는 것은 아니므로 주의가 필요하다.

영어에서 대소문자의 용례는 문법의 문제가 아니라 스타일의 문제이며, 특정한 저자, 혹은 특정한 출판사가 어떤 스타일 가이드(style guide / style manual)를 따르느냐에 따라 같은 상황에서도 다른 규칙이 적용될 수 있다. 즉, "문장의 첫 글자는 대문자를 쓴다" 같은 정말 공통적인 사항을 어긴 것이 아니라면, 대소문자를 틀리게 썼다고 섣불리 지적하는 것은 적절하지 않을 수 있다.

2.2. 독일어

2.3. 기타 언어

3. 기원

현재 대문자-소문자 구별이 있는 문자는 본래 대문자만이 존재하고 있었다. 소문자는 상대적으로 나중에 생겼다. 현재 알파벳 체계 중 가장 보편적으로 쓰이고 있는 로마자 역시 처음 쓰기 시작한 로마 제국 시절에는 소문자가 존재하지 않았다.[7]

어느 문자에서나 소문자가 생긴 이유는 필기 편의를 위해서였다. 본래 대문자만 쓰이던 시절인 고대에는 대체로 기록을 점토판 등 딱딱한 재질의 기록 매체에 남겼기 때문에 곡선 등을 그리는 것이 매우 어려웠고, 따라서 문자가 직선 위주로 만들어졌다. 그러나 파피루스, 양피지같이 부드러운 재질의 기록 매체가 생기자 곡선을 그리는 것이 쉬워졌고, 빠르게 필기하기 위해서는 곡선을 많이 써서 획수를 줄일 필요가 있었다. 이렇게 해서 등장한 것이 소문자이다. 즉, 소문자 자체가 대문자에 비하면 필기체라고 할 수 있을 것이다.

로마자의 대문자-소문자 체계는 프랑크 왕국 카롤루스 대제 시대에 처음 체계화되었다. 중세 초기 서로 다른 지역의 문자 형식이 통일되지 않아서 통신이 불편했다. 카롤루스 대제는 프랑크 왕국에 통일성을 부여하고 행정을 효율적으로 운용하기 위해 카롤링거 소문자를 만들고 보급했다. 현대 로마자 소문자는 모두 카롤링거 소문자를 기반으로 한다. 그러나 당시에는 지금과 다르게 가독성 향상을 위해 대소문자를 구분해서 쓰는 일은 없었으며, 그냥 서체 차이 정도에 지나지 않았다.

본격적으로 가독성 향상을 위해 대문자와 소문자를 구분해서 쓰는 용례는 영국, 아일랜드에서 처음으로 등장했다. 라틴어의 후계 언어들( 프랑스어, 스페인어, 포르투갈어, 이탈리아어 등의 로망스어군)이 아닌 게르만어군을 사용하는 사람에게는 라틴어로 된 글을 읽기 위해 가독성을 어떻게든 높여야 할 필요가 있었기 때문이다. 출처

로마자보다 약간 늦은 시기인 9세기와 10세기에 그리스 문자에서도 오늘날 그리스 소문자의 기원이 되는 필기체가 등장했다. 그리고 로마자의 영향을 받아 오늘날처럼 가독성 향상을 위해 구분하여 쓴다. 그리스 문자를 받아들이고 변형한 키릴 문자에서도 대소문자 구분이 생겼다. 로마자와 키릴 문자 모두 그리스 문자를 받아들여 만들어진 문자지만 대문자와 달리 소문자는 각 문자마다 상당한 차이를 보이는데, 대문자는 직접적으로 그리스 문자를 받아들였지만 소문자는 독자적으로 발달했기 때문이다.

대문자와 소문자를 뜻하는 영어 단어인 uppercase, lowercase라는 명칭은 인쇄술 초창기의 활자 보관함에서 유래했다. 대문자는 활자 보관함의 윗부분에 보관하여 uppercase, 소문자는 아랫부분에 보관하여 lowercase라고 불렀다. 이는 인쇄물에서 소문자가 대문자보다 훨씬 많이 쓰이기 때문에 소문자는 꺼내기 쉬운 아랫부분에 보관했고 대문자는 윗부분에 보관했던 것. 즉, 이때의 case는 정말 상자 케이스였던 셈이다.[8]

4. 문자 체계

4.1. 대문자·소문자를 사용하는 문자 체계

그리스 문자 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω
라틴 문자( 영어 기준) A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
아르메니아 문자 Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք Օ Ֆ
ա բ գ դ ե զ է ը թ ժ ի լ խ ծ կ հ ձ ղ ճ մ յ ն շ ո չ պ ջ ռ ս վ տ ր ց ւ փ ք օ ֆ
키릴 문자( 러시아어 기준) А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я

4.2. 다른 문자에서

조지아 문자는 본래 아솜타브룰리(ასომთავრული), 누스후리(ნუსხური) 쌍이 대소문자 쌍과 유사하지만 지금은 이들을 쓰지 않고 필기체에 가까운 므헤드룰리(მხედრული)만 쓴다. 그래도 여타 로마자 계열 문화권처럼 앞 글자를 크게 쓰는 관습은 있는데, 이 경우에는 므헤드룰리의 자형을 정말 말 그대로 크고 굵게 쓴 것으로 형태상의 차이는 거의 없다.

일본어 가나에서는 스테가나라고 가나를 작게 쓰는 용법이 있다. 자세한 것은 문서 참조. 제2차 세계 대전 이후에 확립된 현대의 용법이다. 이 경우 아예 표시하는 음운이 큰 것과 작은 것이 다르기 때문에 유럽의 대-소문자 개념과는 다르다. 오히려 같은 음을 나타내면서 용도에 따라 쓰임을 달리하는 대소문자의 쓰임은 히라가나- 가타카나의 관계와 더 유사하다.

히라가나와 가타카나는 단어 단위로 어떤 단어는 히라가나로만, 어떤 단어는 가타카나로만 쓰는 등으로 갈리고 한 단어의 앞 글자만 대문자로 하지는 않는다는 차이가 있다. 단, 앞서 언급했듯이 강조하고자 하는 단어는 대문자로 적는 용법이 있는데, 가나 문자도 이와 비슷한 용법이 있다. 강조하고 싶은 단어는 가타카나로 적는 식.

한자도 사용 지역에 따라서 간체자나 신자체가 사용되는 차이는 있다. 다만 대소문자처럼 모든 글자에 적용되는 차이는 아니고 일부 글자만이 정체-간체 대응을 보인다. 또한 간체나 신자체를 쓰는 곳에선 그 글자만 쓰지 대소문자처럼 정체-간체를 섞어서 쓰진 않는다.[9]

동아시아 옛 문자 중엔 '-대자', '-소자'가 별개로 존재하는 것들이 좀 있다. 거란대자/소자, 여진대자/소자 등이 그 예이다. 이들 대자와 소자는 운용 방식이 달라[10] 섞어서 쓰는 경우는 잘 보이지 않는다.

아랍 문자는 어두/어중/어미에 따라 자형에 여러 버전이 있다.

한글에는 동일음상에 대응되는 문자 쌍이 전혀 없다. 풀어쓰기 방안 중에는 대소문자 쌍을 마련한 것이 있다.

한자 갖은자는 같은 의미의 글자를 다르게 쓴 것이란 점에서 대문자와 비슷하다. 실제로 일본어, 중국어에서 갖은자를 의미하는 大字(だいじ), 大写(dàxiě)는 대문자를 의미하는 표현 大文字(おおもじ), 大写(dàxiě)와 유사하다. 중국어는 아예 동일한 표현을 쓴다. 다만 문자 발달사적으로 로마자 계열의 대문자는 본래 대문자가 먼저 생겼고 소문자가 필기 편의를 위해 나중에 생긴 것인 반면, 갖은자는 본래 간략한 글자가 먼저 있고 나중에 복잡한 글자를 (위변조 방지를 위해) 간략한 글자 쪽의 의미로도 쓰도록 대응한 것이다.

5. 컴퓨터에서

파일:linuxfiles.png
파일 시스템에 따라서는 파일/디렉터리명에서 대문자와 소문자를 모두 같은 것으로 취급하거나 대문자와 소문자를 다른 것으로 취급하는 경우가 있다. MS-DOS FAT12/16, Windows 9x에서 사용하는 VFAT는 대문자만 지원했으며 파일/디렉터리명으로 소문자를 사용하면 자동으로 대문자로 변환되었다. Windows 95 OSR2와 함께 나오는 FAT32부터 소문자도 지원되지만 대문자와 소문자를 구분하지 않고 있어 대문자와 소문자가 달리하는 새로운 파일/폴더를 생성할 수 없다. 이는 NTFS에서도 이어진다. 그냥 사용자의 편의상 대소문자가 구분되는 척만 하는 것이다.

반면 리눅스 등의 유닉스 계열에서는 대문자와 소문자를 다른 것으로 취급한다. 즉 대문자와 소문자를 구분한다는 점이다. 그러다보니 파일 시스템에서 대문자와 소문자 구분 문제로 윈도우와 충돌하는 경우가 많다. 다만 Windows Subsystem for Linux의 경우 리눅스 환경이기 때문에 당연히 대문자와 소문자가 구분되므로 파일명 충돌이 없다.

프로그래밍 언어에서도 베이직처럼 변수/함수명에 대문자와 소문자를 같은 것으로 간주하는 것이 있는 반면 C 계열처럼 다른 것으로 취급하는 것도 있다. 헷갈리지 않도록 주의할 것. 마크업 언어 가운데 TeX 같이 대소문자를 구분하는 것도 있다.[11]

유니코드에서도 구별된다. 예를 들어 대문자 A는 U+0041인데, 소문자 a는 U+0061이다.

Caps Lock은 대소문자 입력을 반전시키는 역할을 한다. 일반 상태 소문자/ 시프트 누른 상태 대문자 → 일반 상태 대문자/시프트 누른 상태 소문자가 되는 식.

항공권 발매 시스템, 여권 전산이나 택배 운송장 등과 같은 경우는 대문자만 인식하는 시스템도 자주 있다. 가급적이면 물류, 항공 등 분야에서는 그냥 대문자만 된다고 생각할 것.

6. 나무위키에서 대문자·소문자에 따라 문서가 달라지는 예

* '동음이의어 문서'는 동일 이름 공간에서 같은 표제어를 가진 서로 다른 문서입니다.
* 대소문자만 다른 영문 표제어들은 동음이의어 문서에 해당합니다.
* 구분자는 동음이의어 문서의 구분을 위해서만 사용됩니다.
* 동음이의어 문서가 없는 문서는 구분자를 사용할 수 없습니다.
* '우선 노출 문서'는 구분자를 사용하지 않는 동음이의어 문서입니다. 동음이의어 문서 간 우선 노출 문서는 유일하게 반드시 존재해야 합니다.[12]
나무위키:편집지침/표제어 - 5. 동음이의어·다의어 문서 관련 표제어 지침 中 (밑줄은 이 문서에서의 강조) (2023년 9월 4일 확인)
나무위키에서는 대소문자만 다른 영문 표제어들은 서로 동음이의어에 해당한다는 규정이 있다. 이에 따라 대소문자가 다르더라도 동음이의어 구분자를 붙여 구분을 해야 된다. 단, 규정상으로는 그러하나 2023년 9월 기준으로 모든 문서에 일괄적으로 규정을 적용하는 움직임이 아직 없었기 때문에 대소문자만으로 구별되는 예가 지금도 꽤 있다.

6.1. 전체 대문자

전체 대문자 쪽은 두문자어인 경우가 많다.

6.1.1. 원소 기호

원소 기호는 첫 글자만 대문자로 쓰는 것이 원칙이므로 아래의 예는 모두 후자가 원소 기호이다. 화학에서 둘 다 대문자로 쓰여 있는 것은 원소끼리의 조합으로 그 의미가 완전히 다르다. 특히, 아래 예시 중 CO, HF, NO의 경우는 실제 존재하는 화합물 이름이므로 더욱 주의하여야 한다.

6.1.2. SI 단위

SI 단위는 접두어를 두어 배수를 표현하는데 대문자와 소문자가 모두 사용되며, 그 의미는 완전히 다르다. 이를테면 백만 배를 뜻하는 메가는 대문자 M으로 쓰며 천분의 일을 뜻하는 밀리는 소문자 m으로 쓴다. 따라서 10mW와 10MW는 전혀 다른 의미이다.[14] 크기 차이가 많이 나다 보니 보통 단독으로 쓸 때는 틀리는 일이 많지 않지만 단위 앞에 쓸 때는 잘못 쓰는 예가 많아서 주의를 요한다. 특히 kWh, MWh, kHz, MHz 같은 것이 많이 틀린다. (킬로의 k를 대문자로 같이 쓰던가, 심하면 전부 대문자/소문자로 쓰는 실수) 한편 컴퓨터 분야에서는 용량의 k를 K로 쓸 때가 많다.

심지어 단위 자체도 대소문자에 따라 다른 의미를 띠는데, 가령 소문자 s는 시간의 단위인 지만, 대문자 S는 전기 전도도를 의미하는 지멘스가 된다.
이 외에도 다음 단위가 대소문자 간 혼동을 빚는 사례이다.

6.2. 특이 배열

7. 작은 대문자(small capitals)

간혹 대문자의 자형을 하고 있으면서 글자의 높이는 소문자와 똑같이 하는 경우가 있는데 이를 small capitals(small caps)라고 한다. small caps에서 어두 글자만 본래 대문자의 높이로 쓰면 Petite Caps라고 한다.

한국어 위키백과에서는 작은 대문자로 약간 모순 어법이 느껴지는 표현으로 번역했다. 중국어 위키백과에서도 小型大写字母(소형 대사 자모, "소형 대문자")라고 하여 구조는 비슷하다. 일본어 위키백과에선 번역하지 않고 그냥 スモールキャピタル(스모-루 캬피타루, "스몰 캐피탈")이라고 한다.

영어 위키백과 Small caps 문서 HYUnDAI처럼 섞어서 쓰는 경우도 있다.

본 문단 편집 화면에서 확인할 수 있듯이 HTML에서는 {{{#!html <span style="font-variant: small-caps">(글자)</span>}}} 식으로 작은 대문자 형식을 표시할 수 있다.

언뜻 보기에는 약간 키릴 문자 같은 느낌도 든다. 키릴 문자는 В/в, Д/д 등 소문자가 실제로 크기만 작은 경우가 꽤 있기 때문이다.

8. 기타


[1] 유럽 문자 외에도 일본의 가나 역시 히라가나와 가타카나 두 종류로 쪼개져 있다. 이 단어는 양원제를 뜻하기도 한다. [2] 예: I Want to Hold Your Hand, The Lord of the Rings, League of Legends(LoL) [3] 예: IoT(Internet of Things) [4] 한국에서 궁서체로 쓰면 진지해진다는 것과 비슷한 맥락. [5] 주로 프로그래밍에서 변수나 함수 등의 이름을 지어야 하는 경우. 예를 들면 어떤 수치를 얻어 오는 함수 이름을 getValue()라고 정하는 등. [6] 특히 합병 후 여러 회사 이름을 한 이름으로 합친 경우. 예를 들어 PricewaterhouseCoopers가 있다. [7] 때문에 후대에도 라틴어는 대문자로만 쓸 때가 꽤 있다. 라틴어를 쓴다는 것 자체가 로마 제국의 인상을 남기기 위함이기에 자형도 로마 제국 시절을 따르는 것이다. 가령 유럽의 가문 문장 같은 데 쓰여있는 라틴어 구절은 대체로 대문자이다. 스페인 국장의 PLVS VLTRA도 그 예이다. [8] 카세트 역시 이 의미의 case에 지소형 -ette가 결합한 것으로, 본래 의미는 '작은 상자'이다. [9] 단, 같은 글자라 해도 사람 이름에서는 정자만 쓰기도 하기 때문에 정체-간체가 섞여 나타나기도 한다. [10] 단적으로 거란대자는 표의문자이지만 거란소자는 표음문자이다. [11] 가령 양쪽 화살표를 나타내는 \leftrightarrow는 첫 글자의 대소문자에 따라 렌더링이 다르다([math(\leftrightarrow)] (첫 글자 소문자), [math(\Leftrightarrow)] (첫 글자 대문자)) [12] A(B)와 A(C) 문서는 있지만 A는 없는 경우, ABC와 abc가 같이 존재하는 경우는 허용되지 않습니다. [13] 아메리슘 외에도 쾨펜의 기후 구분에서 열대 몬순 기후를 뜻하기도 한다. A가 열대, m이 몬순의 약자이다. [14] 10억 배 차이. 전자는 소형 전자 기기의 소비 전력 같은 데서 주로 볼 수 있고 후자는 발전소의 발전량, 또는 무선 송신소의 출력 등에 사용된다. 즉 일상적으로 둘 다 볼 수 있다는 의미. [병용단위] 정식 SI 단위가 아니다. [병용단위] 정식 SI 단위가 아니다. [17] 영어 채팅창에서 대문자로 말하는 걸 소리 지르는 것처럼 받아들이는 것도 이 때문이다. [18] 꼭 영어일 필요는 없고 해당 논문의 언어를 따를 수도 있으나 대체로 영어로 의미를 적는다. [19] 앞쪽은 L의 소문자, 뒤쪽은 i의 대문자이다.

분류