최근 수정 시각 : 2022-01-10 19:18:01
1. 개요2. 설명3. 선형대수학의 기본정리4. 증명4.1. 선형성4.1.1. ΨCB는 선형변환4.1.2. ΦCB는 선형변환 4.2. 전단사4.2.1. ΨCB는 전단사4.2.2. ΦCB는 전단사 4.3. 두 대응 간의 역함수 관계4.4. 합성과 곱의 관계 5. 기저의 변환6. 같이 보기
선형대수학의 기본정리란, 두 유한차원 벡터공간 사이에 정의된 선형변환의 집합과 m×n 행렬의 집합에 덧셈과 스칼라배, 그리고 (잘 정의된) 합성을 보존하는 일대일 대응 함수가 존재한다는 것이다. 이 정리에 "기본정리"라는 이름까지 붙은 이유는, 선형변환을 마치 행렬처럼, 행렬을 마치 선형변환처럼 다룰 수 있다는 것을 이 정리가 보장해주기 때문이다.
행렬과
선형사상의 동치성은 선형대수학의 핵심 주제이긴 하지만, 이것을 '선형대수학의 기본정리'라는 이름으로 부르는 것은 의외로 일부 문헌에 한정되어 있다. 위키백과에서도 이 명칭은 길버트 스트랭 교수가 유행시키기는 했지만 수학계 전반에서 인정받는 명칭은 아니라고 서술하고 있다. 이 문서의 서술은 주로 이인석 저 "학부 대수학 강의 1: 선형대수와 군"을 따르고 있지만, 이를 제외한 대부분의 교재에서는 이 동치성에 별도의 이름을 붙이지 않는다. 외서의 경우에는 Strang의 교재처럼 선형대수학의 기본정리를
차원 정리에 연결하는 경우가 훨씬 빈번하다. 나무위키 내의 다른 선형대수학 문서들도 비슷하게 "선형대수와 군"으로부터 많은 영향을 받았기 때문에 이 '선형대수학의 기본정리'라는 이름이 많이 쓰이긴 하지만, 범용적인 명칭은 아니므로 주의하자. 이 문서의 표기법도 "선형대수와 군"을 따르기 때문에 다른 곳에선 얼마든지 대체될 수 있다.
이 정리의 아이디어를 이해하기 위해서 우선 가장 간단한 경우를 살펴보자. 즉,
체 F가 주어져 있을 때, Fn 에서 Fm로 가는 선형 변환 L을 생각하자. 이 선형 변환이 대응될 행렬을 A라 했을 때, 모든 벡터에 대해 L(v)=Av가 성립해야 한다. 그런데 v의 좌표를 (v1,⋯,vn)t라고 하면 Av=[A]1v1+⋯+[A]nvn (단, [A]i들은 A의 i번째 열이다)가 성립한다. 이 때 Fn의 표준 기저를 E={e1,⋯,en}라고 하면, L(ei)=Aei는 i번째 열 [A]i와 같을 수밖에 없다. 즉, L에 대응되는 행렬 A는 사실 i번째 열이 L(ei)인 행렬이다!
아래의 내용도 표현이 좀 복잡할 뿐이지 본질적인 아이디어는 이 특수한 경우에서 벗어나지 않는다. 다만, 현재 상황에서는 주어진 선형 변환의 정의역과 공역이 Fn과 Fm라는 가장 기본적인 벡터 공간이고, 행렬을 대응시키기 위해 사용하는 기저도 가장 다루기 편한 표준 기저로 주어져 있다. 아래에서 선형 변환과 행렬을 대응시키기 위해 사용하는 복잡한 함수들은 일반적인 상황을 가장 특수하고 다루기 쉬운 현재 상황으로 바꾸기 위한 것들이다.
체 F 위의
벡터 공간 V,W와
선형 변환 L:V→W가 주어져 있다고 하자. 이 일반적인 경우에도 우리는 A를 위와 같이 정의할 것이다. 하지만 그러기 위해서는 위 문단에서의 표준 기저 E에 대응하는 것이 있어야 하므로, V의 순서가 주어진 기저 B={v1,⋯,vn}와 W의 순서가 주어진 기저 C={w1,⋯,wm}가 주어져 있다고 하자.
그런데 L(vi)가 열벡터라는 보장은 없으므로 A=(L(v1),⋯,L(vn))이라고 정의하는 것은 애초에 말이 되지 않는다. 이 문제를 해결하기 위해서는 L(vi) 대신 L(vi)의 C에 대한 좌표를 사용해야 한다. 좌표의 정의를 모르는 독자는 아래 내용을 참고하자. 어찌 됐든, 이제 우리는 L에 대응되는 A를 ([L(v1)]C,⋯,[L(vn)]C) 로 정의하고, [L]CB라고 표기하며 이를 선형 변환 L의
행렬 표현이라 부른다.
- 【좌표의 정의】
- 좌표에 대한 정의를 간단히 요약하면, v∈V가 v=c1v1+⋯+cnvn으로 표현될 때, [v]B=(c1,⋯,cn)t을 v의 (B에 대한) 좌표라고 한다. 이 벡터를 좌표라고 부르는 이유는 이 벡터가 기존의 좌표의 정의를 확장한 것이기 때문이다. 이를 설명하기 위해 Fn에서 v=(v1,⋯,vn)t를 생각해보자. 그러면 v는 v1e1+⋯+vnen으로 나타내어지고, 따라서 [v]E=(v1,⋯,vn)t가 성립한다. 즉 v의 좌표 (v1,⋯,vn)t는 사실 v의 E에 대한 좌표인 것이다!
- 【기저의 순서에 관한 문제】
- 다만 행렬 표현의 정의에 사소한 문제가 있다. {v1,v2}과 {v2,v1}는 집합으로서는 똑같은 집합이지만, 위의 정의에서 이렇게 기저의 원소들의 순서를 바꿔버리면 행렬 표현의 열들의 위치가 변해버리기 때문이다. 이 때문에 선형 대수학에서는 기저들의 원소 사이에 순서가 있다고 가정하고, 같은 원소로 이루어진 기저라도 순서가 다르면 다른 기저로 본다.
그러면 이 행렬 A가 선형 변환 L에 대응한다는 것은 무엇을 의미할까? 위와 똑같이 L(v)=Av라고 할 수는 없다. v는 열 벡터가 아니기 때문이다. 물론 해결법은 위와 마찬가지로 기저에 대한 좌표를 사용하는 것이다. 즉 L이 A에 대응된다는 것은 L(v)의 C에 대한 좌표가 A[v]B로 표현된다는 것이다. 이 사실이 참이라는 것은 [L(v)]C=[L(c1v1+⋯+cnvn)]C= c1[L(v1)]C+⋯+cn[L(vn)]C= c1[A]1+⋯+cn[A]n=A[v]B라는 계산을 통해 알 수 있다. 결론을 깔끔한 수식으로 나타내면 아래와 같다.
[L(v)]C=[L]CB[v]B
3. 선형대수학의 기본정리
이제 기본적인 아이디어에 대한 설명은 끝났으니 선형대수학의 기본정리의 내용에 대해 설명한다. 선형 변환 L:V→W는 V에서 W로 가는 선형 변환들의 집합 L(V,W)의 원소이고, 그에 대응되는 행렬 [L]CB는 F 위의 m×n 행렬들의 집합 Mm,n(F)의 원소이다. 그렇다면, 선형 변환 L를 [L]CB에 대응시키는 것은 L(V,W)에서 Mm,n(F)로 가는 함수라고 할 수 있다. 선형대수학의 기본정리는 이 대응이 사실은 두 벡터 공간 사이의 동형 사상이라고 주장한다. 즉, 각각의 선형 변환 L를 그 행렬 표현 [L]CB와 같은 대상으로 보면 두 벡터 공간은 본질적으로 동일한 벡터 공간이란 뜻이다.
이 대응이 동형 사상이라는 것은 우선 선형 변환 L+M이 행렬 [L]CB+[M]CB에 대응되고, cL은 행렬 c[L]CB에 대응된다는 뜻이다. 또한, 이 대응이 역함수가 존재하는 일대일 대응이란 뜻이기도 하다. 그렇다면 이 대응의 역함수는 무엇일까? 위에서의 논의를 생각해보면 역함수는 행렬 A를 [LA(v)]C=A[v]B로 정의되는 선형 변환 LA에 대응시켜야 함을 알 수 있다.
추가적으로, 이 정리는 두 선형 변환의 합성 M∘L에 대응되는 행렬이 무엇인지도 알려준다. 선형 변환 L와 M가 각각 행렬 A, B에 대응된다고 할 때, BAx=B(Ax)란 사실을 생각하면 LB와 LA의 합성은 LBA에 해당할 것임을 예측할 수 있으며, 따라서 M∘L는 BA에 대응될 것이다.
체 F 위의 유한 차원 벡터 공간 V,W과 그 기저 B={v1,⋯,vn}, C={w1,⋯,wm}가 주어져 있다고 하자.
그리고 함수 ΦCB:Mm,n(F)→L(V,W)와 ΨCB:L(V,W)→Mm,n(F)를 다음과 같이 정의한다.
-
ΦCB(A)=LA, 여기서 LA는 [LA(v)]C=A[v]B를 만족하는 L(V,W)의 원소
-
ΨCB(L)=[L]CB
그러면 ΦCB와 ΨCB는 동형 사상이고 ΦCB=(ΨCB)−1이다.
또한, 유한 차원 벡터 공간 U와 그 기저 D={u1,⋯,ur}를 추가로 생각하면 임의의 A∈Mm,n(F), B∈Mr,m(F)에 대해 LBA=LB∘LA가 성립하고, 임의의 L∈L(V,W)와 M∈L(W,U)에 대해 [M∘L]DB=[M]DC[L]CB가 성립한다.
아래 증명은 수식이 많아서 복잡하게 보일 수는 있으나, 사실상 선형변환과 행렬의 성질을 반복적으로 적용할 뿐인 기계적인 증명임을 생각하고 보면 크게 어렵지는 않을 것으로 생각된다.
4.1.1. ΨCB는 선형변환
임의의 i∈{1,⋯,n}와 L,M∈L(V,W)에 대해
(L+M)(vi)=L(vi)+M(vi)
이므로,
[(L+M)(vi)]C=[L(vi)]C+[M(vi)]C
이다. 이로부터 행렬 [L+M]CB의 i번째 열은 [L]CB의 i번째 열과 [M]CB의 i번째 열의 합임을 알 수 있다.
그러면 [L+M]CB=[L]CB+[M]CB가 되어
ΨCB(L+M)=ΨCB(L)+ΨCB(M)
이다.
또한, 임의의 c∈F에 대해
[(cL)(vi)]C=c[L(vi)]C
이므로 [cL]CB=c[L]CB가 되어
ΨCB(cL)=cΨCB(L)
이다. 따라서 ΨCB는 선형 변환이다.
4.1.2. ΦCB는 선형변환
임의의 A,B∈Mm,n(F)와 v∈V에 대해
[LA+B(v)]C=(A+B)[v]B=A[v]B+B[v]B=[LA(v)]C+[LB(v)]C
이므로 LA+B(v)=LA(v)+LB(v)가 되어 LA+B=LA+LB이다. 즉,
ΦCB(A+B)=ΦCB(A)+ΦCB(B)
이다.
그리고 임의의 c∈F에 대해
[LcA(v)]C=(cA)[v]B=c[LA(v)]C
이므로 LcA(v)=cLA(v)가 되어 LcA=cLA이다. 즉,
ΦCB(cA)=cΦCB(A)
이다. 따라서 ΦCB는 선형 변환이다.
4.2.1. ΨCB는 전단사
우선 ΨCB가 전단사임을 확인하자. 먼저 단사임을 보이기 위해 ΨCB(L)=ΨCB(M)인 L,M∈L(V,W)가 있다고 가정하자. 그러면 임의의 i∈{1,⋯,n}에 대해 [L]CB과 [M]CB의 i번째 열이 같으므로 [L(vi)]C=[M(vi)]C이고, 따라서 L(vi)=M(vi)이다. 그런데 임의의 v∈V를 택하면 B가 V의 기저이므로 v=∑i=1ncivi인 c1,⋯,cn∈F가 존재한다. 따라서
L(v)=L(i=1∑ncivi)=i=1∑nciL(vi)=i=1∑nciM(vi)=M(i=1∑ncivi)=M(v)
이다. 즉, L=M이 되므로 ΨCB는 단사이다.
이제 ΨCB가 전사임을 보이기 위해서 임의의 A∈Mm,n(F)를 택하자. A의 i번째 열을 [A]i로 표기하고 선형 변환 L∈L(V,W)를 [L(vi)]C=[A]i로 주면, [L]CB는 i번째 열이 [A]i인 행렬이므로 [L]CB=A이다. 따라서 ΨCB는 전사이다.
4.2.2. ΦCB는 전단사
이제 ΦCB가 전단사임을 보이자. 먼저 단사임을 보이기 위해 ΦCB(A)=ΦCB(B)인 A,B∈Mm,n(F)가 있다고 가정하자. 그러면 임의의 i∈{1,⋯,n}에 대해 [LA(vi)]C=A[vi]B=Aei=[A]i이고 마찬가지로 [LB(vi)]C=[B]i이므로 A와 B는 각각의 열이 같은 행렬이다. 즉, A=B이다. 따라서 ΦCB는 단사이다.
이제 ΦCB가 전사임을 보이기 위해 임의의 L∈L(V,W)를 택하자. 그리고 행렬 A를 A=[[L(v1)]C⋯[L(vn)]C]로 주면 [LA(vi)]C=A[vi]B=Aei=[A]i=[L(vi)]C이므로 LA(vi)=L(vi)이다. 따라서 위에서 보인 것과 마찬가지의 방법으로 LA=L임을 보일 수 있다. 그러므로 ΦCB는 전사이다.
4.3. 두 대응 간의 역함수 관계
임의의 L∈L(V,W)와 v∈V를 택하자. 그러면
[ΦCB∘ΨCB(L)(v)]C=[ΦCB([L]CB)(v)]C=[L]CB[v]B=[L(v)]C
이므로 ΦCB∘ΨCB(L)=L이다. 따라서
ΦCB∘ΨCB=idL(V,W)
이다.
반대 방향을 보이기 위해 임의의 A∈Mm,n(F)를 택하자. 그러면 ΨCB∘ΦCB(A)의 i번째 열은 [ΦCB(A)(vi)]C=A[vi]B=Aei=[A]i이다. 즉, ΨCB∘ΦCB(A)와 A는 각각의 열이 같은 행렬이므로 같은 행렬이다. 따라서
ΨCB∘ΦCB=idMm,n(F)
이다.
4.4. 합성과 곱의 관계
임의의 L∈L(V,W)와 M∈L(W,U)를 택하고 P=[L]CB, Q=[M]DC라 하자. P=(aij)m×n라고 하면, 임의의 k∈{1,⋯,n}에 대해
Q[P]k=i=1∑maik[Q]i=i=1∑maik[M(wi)]D=[i=1∑maikM(wi)]D=[M(i=1∑maikwi)]D=[M(L(vk))]D
이다. 따라서 QP의 k번째 열은 [(M∘L)(vk)]D이다. 즉, QP와 [M∘L]DB는 모든 열이 같으므로 같은 행렬이다. 결국
[M∘L]DB=[M]DC[L]CB
이다.
이제 후자를 증명하기 위해서 임의의 A∈Mm,n(F)와 B∈Mr,m(F), v∈V를 택하자. 그러면 [LBA(v)]D=BA[v]B=B[LA(v)]C=[LB(LA(v))]D이므로 LBA(v)=(LB∘LA)(v)가 성립해
LBA=LB∘LA
이다.
5. 기저의 변환
선형 변환의 행렬 표현은 어떤 기저를 택했냐에 따라 바뀔 수 있음을 유의해야 한다. 예를 들어, L:R2→R3가 L(x,y)=(x+2y,x−y,2x−y)로 정의될 때, 표준 기저 E={(1,0),(0,1)}, F={(1,0,0),(0,1,0),(0,0,1)}에 대해서는 [L]FE= ⎣⎡1122−1−1⎦⎤이지만 E∗={(1,1),(1,−1)}, F∗={(1,0,0),(1,1,0),(1,1,1)}에 대해서는 [L]F∗E∗= ⎣⎡3−11−3−13⎦⎤이다.
그렇다면 다른 기저가 사용되었을 때 행렬 표현은 어떻게 바뀔까? 체 F 위의 벡터 공간 V와 W가 있고 이 두 벡터 공간이 각각 기저 B,B∗와 C,C∗를 가지며 선형 변환 L:V→W이 주어져 있다고 하자. 그러면 L=IW∘L∘IV 이므로
[L]C∗B∗=[IW]C∗C[L]CB[IV]BB∗
임을 알 수 있다. 이때, [IV]B∗B와 같은 형태의 행렬을 (B에서 B∗로의) 추이 행렬(transition matrix)이라 부르며, [IV]BB∗[IV]B∗B=[IV]BB=I이므로 [IV]BB∗=([IV]B∗B)−1가 되어 가역 행렬임을 알 수 있다.
이때, 만약 V와 W가 같고 B=C, B∗=C∗이면 특히 [L]B∗B∗=[IV]B∗B[L]BB[IV]BB∗ =[IV]B∗B[L]BB([IV]B∗B)−1가 되어 두 행렬 [L]B∗B∗ 와 [L]BB가
상사 관계에 있음을 알 수 있다. 이 때문에 정의역과 공역이 같은 선형 변환의 대각합이나 행렬식 등을 정의할 수 있다. 대각합이나 행렬식을 행렬 표현의 대각합이나 행렬식으로 정의하면 되고, 이 값들은 상사 관계에 있는 행렬끼리는 항상 같기 때문에 행렬 표현이 달라진다고 선형 변환의 대각합이나 행렬식 값이 달라지진 않기 때문이다.
6. 같이 보기