mir.pe (일반/어두운 화면)
최근 수정 시각 : 2024-05-30 18:06:52

일반 상대성 이론의 기초 수학


상대성 이론
Theory of Relativity
{{{#!wiki style="margin:0 -10px -5px"
{{{#!wiki style="word-break: keep-all;"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
<rowcolor=#2A1A5B> 특수 상대성 이론 일반 상대성 이론
<colcolor=#00a0de><colbgcolor=#2A1A5B> 배경 상대성 이론/역사 · 맥스웰 방정식 · 마이컬슨-몰리 실험
기초 가설 상대성 원리 · 광속 불변의 원리 등가 원리( 중력 · 관성력)
이론 체계 시공간( 세계선 · 고유 시간 · 고유 길이 · 민코프스키 다이어그램 · 아인슈타인 표기법) · 미분기하학( 리만 다양체)
로런츠 변환( 로런츠 인자) · 로런츠 군 아인슈타인 방정식 · 힐베르트 액션
( 슈바르츠실트 계량 · 라이스너-노르드스트룀 계량 · 커 계량/커-뉴먼 계량)
현상 동시성의 상대성 · 시간 지연 · 길이 수축 · 질량-에너지 등가원리 · 상대론적 효과( 도플러) 중력 렌즈 효과 · 중력파 · 적색편이
응용 및 심화 기본 상호작용 · 상대론적 역학 · 상대론적 전자기학 · 양자 전기역학 · 천체물리학( 천문학 둘러보기) · 통일장 이론 · 루프 양자 중력 이론 · 타임 패러독스 · 중력 자성
쌍둥이 역설 · 막대와 헛간 역설 · 아광속 · 초광속 · 타키온 중력자 · 블랙홀( 블랙홀 둘러보기 · 사건의 지평선 · 중력 특이점 · 양자블랙홀) · 우주론 · 우주 상수 }}}}}}}}}}}}

1. 평평한 시공간2. 다양체(Manifold)3. 기하학적 양(Geometric objects)
3.1. 벡터3.2. 듀얼 벡터3.3. 텐서3.4. 메트릭 텐서
4. 곡률(Curvature)과 열률(Torsion)
4.1. 공변 도함수와 접속4.2. 평행이동4.3. 측지선4.4. 리만 텐서4.5. 측지선 편차4.6. 비앙키 항등식4.7. 아인슈타인 텐서
5. 참고 자료

1. 평평한 시공간

일반 상대성 이론에서 사용되는 4차원 시공간 모델의 기초는 특수 상대성 이론에서 정립된 평평한 시공간에 있다. 따라서, 평평한 시공간에서 기하학이 어떻게 전개되는지 먼저 살펴볼 필요가 있다. 특수 상대성 이론에서 정의되는 관성좌표계inertial frame는 시간의 흐름이 균일하고, 두 점 사이의 거리가 변화하지 않는 좌표계이다. 우리는 주어진 시공간 영역에 공간축의 방향과 관찰자의 상대 속도에 따라서 관성 좌표계가 다양하게 정의될 수 있다는 것을 알고 있다.

먼저, 사건event이란 것을 정의하자. 사건은 각 기준계에 대하여 시간좌표 [math(t)]와 공간좌표 [math(x, y, z)]를 합한 [math((t, x, y, z))], 총 4개의 실수(정보)로 표현되는 각각의 점이다. 사실 각각의 사건은 좌표계의 방향과 속도에 상관없이 정의되며, 좌표계에 의존하지 않는 객관적인 물리적 존재이다. (예를 들어, 두 공이 충돌하는 사건은 모든 관찰자가 관찰할 수 있는 것이다.) 하지만, 좌표계를 잡은 방식에 따라 각각의 실수(좌표)는 다르게 표현될 수 있다. 두 사건 [math(P, Q)]에 대하여, 각각의 관성좌표계에서 다음 값을 정의한다.

[math(\Delta^2(P, Q) = - c^2(\Delta t)^2 + (\Delta x)^2 + (\Delta y)^2 + (\Delta z)^2)]


이 때, [math(c)]는 물론 광속이다. 특수 상대성 이론에서는 광속 불변 원리를 채택하고 있다. 이 원리로부터, [math(\Delta^2(P, Q))]가 "모든 관성 좌표계에서" 똑같이 계산된다는 것을 증명할 수 있다. (거꾸로 [math(\Delta^2(P, Q))]가 일정하다는 것으로부터 광속 불변원리를 증명할 수도 있는데(사실 [math(\Delta^2(P, Q) = 0)]이 모든 좌표계에서 성립한다는 것으로부터 너무나도 쉽게 증명된다.) 이것을 특수 상대성 이론의 가정으로 삼기도 한다.)

이 공식을 통해, 시간과 공간을 통합한 4차원 시공간을 정의해야만 한다는 것을 알 수 있다. 이렇게 정의된 4차원 공간을 민코프스키 공간Minkowski space이라고 한다.

이 때, [math(\Delta^2)]의 값으로부터 두 사건 사이의 관계를 정의할 수 있다.

[math(\Delta^2 > 0)] : 공간꼴로 분리spacelike separated되어 있다.
[math(\Delta^2 = 0)] : 빛꼴(영꼴)로 분리lightlike / null separated되어 있다.
[math(\Delta^2 < 0)] : 시간꼴로 분리timelike separated되어 있다.

공간꼴로 분리된 두 사건은 어떤 좌표계에 대하여 "동시에 나타나도록" 만들 수 있으며, 빛꼴로 분리된 두 사건은 언제나 빛의 속도로만 도달할 수 있다. 시간꼴로 분리된 두 사건은 어떤 좌표계에 대하여 "한 점에서 차례로 나타나도록" 만들 수 있다. 특히, 공간꼴 분리란 개념은 동시라는 개념을 상대성 이론에 맞게 확장한 것이라고 생각할 수 있다. 좌표계에 따라 동시라 정의되는 사건의 집합이 다르므로 절대적인 동시는 정의할 수 없지만 한 사건 [math(\mathrm A)]와 공간꼴 분리된 사건들을 (조금 느슨하게 정의된) 동시라고 생각할 수 있다. 이들은 어느 한 좌표계에서 [math(\mathrm A)]와 동시가 되도록 할 수 있으며, 빛의 속도보다 빠른 건 없으므로 서로 영향을 주고받을 수 없다.

2. 다양체(Manifold)

이렇게 정의된 평평한 시공간의 수학적 모델은 사실 4차원 다양체의 일종이다. 다양체는 흔히 말하는 평평한 공간과 휘어진 공간을 모두 아우르는 용어인데, 휘어진 공간의 경우엔 일반적으로 '각 점에서' 조그만 영역만 생각하면 평평한 공간과 유사하다. 따라서 다양체 역시 각 점 근방에서 같은 차원의 유클리드 공간과 닮은 공간으로 정의된다. 전체 다양체는 이렇게 각각의 점에서 찾은 유클리드 공간 꼴을 하나하나 (부드럽게) 이어붙인 것으로 정의되며, 전체로 봐서는 유클리드 공간과 닮지 않을 수 있다.

다양체manifold란 각 점 근방에서 [math(n)]차원 유클리드 공간을 닮은, 즉 동형사상이 존재하는 위상 공간을 의미한다. 이 때 [math(n)]은 고정된 자연수이며, 이를 다양체의 차원이라고 부른다. 다시 말해, [math(n)]차원 [math(C^{\infty})] 다양체 [math(M)]은 부분집합 [math(O_{\alpha})]들과 함께 다음 조건을 만족시킨다.
(1) 각 [math(p \in M)]은 적어도 하나의 [math(O_{\alpha})]에 속한다. 즉, [math(\{O_{\alpha} \})]는 [math(M)]을 덮는다.
(2) 각각의 [math(\alpha\,)]에 대하여 전단사 사상 [math(\psi_{\alpha} : O_{\alpha} \rightarrow U_{\alpha}\,)]가 존재하며, 각각의 [math(U_{\alpha})]는 [math(\mathbb{R}^n)]의 부분집합이다.
(3) [math(O_{\alpha} \cap O_{\beta} \ne \varnothing)]일 경우, 전이 사상 [math(\psi_{\beta}\,\circ\,\psi_{\alpha}^{-1})]은 영역 [math(\psi_{\alpha}(O_{\alpha} \cap O_{\beta}) \subset U_{\alpha} \subset \mathbb{R}^n)]을 [math(\psi_{\beta}(O_{\alpha} \cap O_{\beta}) \subset U_{\beta} \subset \mathbb{R}^n)]로 옮긴다. 이들 부분 집합은 모두 열린 집합이고, 전이 사상은 [math(C^{\infty})]이다.

각각의 사상 [math(\psi_{\alpha})]를 수학에서는 차트Chart, 물리학에서는 좌표계Coordinate system라고 부른다. (3)은 조각조각 나뉜 차트를 매끄럽게 연결할 수 있다는 조건이다.

이제, 다양체 간 함수의 미분가능성, 부드러움을 정의할 수 있다. 두 다양체에 차트(들) [math((M, \{\psi_{\alpha}\}))]와 [math((M', \{\psi'_{\beta}\}))]가 주어졌다고 하자. 이 때, 각각의 [math(\alpha, \beta)]에 대하여 [math(\psi'_{\beta} \circ f \circ \psi_{\alpha}^{-1})]이 [math(C^{\infty})]이면 [math(f : M \rightarrow M')]을 [math(C^{\infty})]라고 부른다. 만약, 함수 [math(f : M \rightarrow M')]이 [math(C^{\infty})]이고, 전단사 사상이며 역함수도 [math(C^{\infty})]이면 [math(f)]를 미분동형사상diffeomorphism이라고 부른다. 미분동형사상이 존재하는 두 다양체는 '다양체로서' 서로 같은 집합이라고 할 수 있다.

3. 기하학적 양(Geometric objects)

일반 상대성 이론은 시공간의 기하학적 성질과 좌표 선택에 따른 성질을 구분한다. 사건의 경우, 기하학적으로 정의되는 가장 기본적인 양으로 그냥 시공간 위의 점이다. 이처럼, 좌표계와 상관없이 정의되는 기하학적 양들인 벡터, 듀얼 벡터, 텐서 등을 다음과 같이 정의할 수 있다. 이는 일반 상대성 이론에서 추구하는 정신인 좌표 불변성과 밀접한 관련이 있다. (하지만, 좌표 불변성 자체는 일반 상대성 이론에서만 성립하는 개념은 아니다.)

3.1. 벡터

점, 스칼라에 이어서 가장 기본적인 기하학적 양은 벡터vector이다. 가장 초보적인 관점에서 벡터를 화살표로 생각할 수 있다. 이러한 관념은 평평한 공간에는 큰 무리 없이 적용될 수 있으나 보다 일반적인 다양체, 즉 휘어진 공간에서는 화살표가 뚫고 나온다든지 하는, 수학적으로 그냥 둘 수 없는 (참을 수 없는) 문제들이 있다. 이를 해결하는 것은 2가지 단계로 이루어진다. 앞으로 나오는 듀얼 벡터, 텐서 역시 벡터와 비슷하게 문제를 해결할 수 있다.

첫번째로, 벡터의 가장 중요한 성질은 선형 연산이 보장되는 것이다. 즉, 자유롭게 더하고 늘리거나 줄일 수 있어야 한다. 그러나 휘어진 공간에서는 서로 떨어진 점에서 정의된 벡터끼리 연산하는 것이 조금 곤란하다. 이에 대해서는 각 점에서 다양체가 평평한 공간으로 수렴한다는 것을 이용한다. 즉, 각각의 점 [math(p)]에서 다양체 [math(M)]에 접하는 벡터를 모두 모은 벡터 공간을 정의하여 접공간tangent space [math(T_pM)]이라 한다. 이 때 각 [math(T_pM)]에 속하는 벡터를 접벡터tangent vector라고도 한다. 벡터는 보통 화살표로 표시되지만, 접공간 안에 있는 벡터는 진짜로 화살표처럼 튀어나와서 공간 밖으로 나가는 것이 아니다. 각각의 벡터는 실함수처럼 각 점에서만 정의된 (화살표처럼 행동하는) 추상적인 양일 뿐이다.

이제, [math(T_pM)] 안에 격리된 벡터는 시점이 [math(p)]로 통일되어 있으므로 자유롭게 선형연산을 할 수 있다. 즉,

#!wiki style="text-align: center"
[math((a + b)(V + W) = aV + bV + aW + bW \quad (a, b \in \R, \,\, V, W \in T_pM))]
}}}

가 성립한다. 또한, 항등원 [math(0)]과 역원 [math(-V)]도 존재한다. 접공간은 각 점에서 다양체와 가장 닮은 벡터공간이며, 그 차원은 동일하다.

두번째로, 벡터의 정의를 분명히 해야 한다. 두 점 [math(p, q)]에 대하여 [math(V = q - p)]라 정의하는 것은 앞서 살펴봤듯이 일반적인 다양체에서 사용하기 곤란하고, 또 접공간 안에서는 이러한 설명이 불가능하다. 따라서 벡터가 국소적인 방법으로 정의되도록 점 [math(p)]를 지나는 임의의 곡선을 찾아 그 미분 [math(\displaystyle V = \frac{dp}{d\lambda})]을 벡터로 정의해볼 수 있는데, 이것은 기존보다는 국소적이지만 이웃한 점을 이용하는 건 마찬가지고, 벡터를 정의하기 위해 특정 곡선에 의존해야 한다는 점이 아쉽다.
궁극적인 해결책은 임의의 벡터가 함수의 방향 미분directional derivative을 준다는 것을 이용하는 것이다. 즉, 벡터 [math(V)]는 함수 [math(f)]와 만나 방향미분 [math(\nabla_V f \in \R)]를 만드므로, 벡터를 [math(\displaystyle V \equiv \frac {d}{d \lambda} : \mathcal{F} \rightarrow \mathbb R)]와 같이 표시하고, 다음 조건을 만족시키는 양으로 정의한다.

(1) 선형성(linearity) : [math(V(f + ag) = V(f) + aV(g) \quad (f, g \in \mathcal{F}, \,\, V \in T_pM))]
(2) 라이프니츠 규칙(leibnitz rule) : [math(V(fg) = f(p)V(g) + g(p)V(f))]

이 때, [math(\displaystyle V = \frac {d}{d \lambda})]는 [math(\displaystyle V(f) \equiv \frac{df}{d\lambda})]를 나타낸다.

또한, 벡터는 다양체 전체에서 정의되도록 확장할 수 있다. 이는 곧 벡터장vector field이다. 한편, 접공간 전체의 집합을 접다발tangent bundle이라 하고, [math(TM)]으로 나타낸다. 따라서, 각 벡터장을 [math(V : M \rightarrow TM)]으로 정의할 수 있다.

이처럼, 다양체 위 각 점에서 벡터를 좌표에 의존하지 않고 명확하게 정의할 수 있다. 그러나, 벡터를 특정 기저basis에 대한 표현으로 나타내는 것 역시 중요하다.

벡터의 기저를 [math(\hat{e}_{(\mu)\,\,(\mu = 0, 1, 2, 3)})]라 표시한다. 벡터의 기저를 정할 때에는 다양체에 정의된 특정 좌표계에 대한 기저coordinate basis [math(\displaystyle \frac{\partial}{\partial x^{\mu}})] (즉, 함수 [math(f)]에 대하여 편미분 [math(\displaystyle \hat{e}_{(\mu)}(f) = \frac{\partial f}{\partial x^{\mu}})]를 내놓는 벡터) 로 정의할 수도 있으나, 일반적으로 기저는 좌표계에 상관없이 각 [math(T_pM)]에서 차원에 맞게 임의로 정할 수 있다. 좌표계 기저는 각각의 [math(T_pM)]에 기저를 부여하는 효율적인 방식의 하나일 뿐이다.

벡터를 다음과 같이 특정 기저 [math(\hat{e}_{(\mu)})]의 선형 결합으로 표현할 수 있다. (좌표계 기저일 경우, [math(\displaystyle \hat{e}_{(\mu)} = \partial_{\mu} \equiv \frac{\partial}{\partial x^{\mu}})]로 표시한다.)

[math(A = A^{\mu}\hat{e}_{(\mu)})]


이 때, [math(A^{\mu})] 각각을 벡터 [math(A)]의 (기저 [math(\hat{e}_{(\mu)})]에 대한) 성분이라고 한다. 일반적으로 [math(A^{\mu})]를 그냥 벡터라고 하기도 하지만, 이는 기저의 선택에 의존적인 표현임을 명심해야 한다. 실제 벡터는 좌표에 의존하지 않고 정의되는 기하학적 양이기 때문에, [math(A = A^{\mu}\hat{e}_{(\mu)})]를 벡터라고 하는 것이 수학적으로는 정확하다. 기저의 첨자에 쓴 소괄호는 이 첨자가 성분이 아니라 각각 하나의 벡터임을 표시한 것이다.

이처럼, 벡터는 좌표 선택에 대한 불변량이다. 하지만, 좌표 선택에 따라 기저가 다르게 정의되므로 벡터의 성분 역시 바뀐다. 벡터의 성분에 대한 좌표 변환 규칙을 알아보자. 먼저, 두 좌표계 [math(\{x^{\mu}\})]와 [math(\{x^{\mu'}\})]에 대하여 chain rule에 따라 [math(\displaystyle \frac{\partial}{\partial x^{\mu'}} = \frac{\partial x^{\mu}}{\partial x^{\mu'}}\frac{\partial}{\partial x^{\mu}})]이다. 즉 (좌표계) 기저의 좌표 변환은 다음과 같이 주어진다.

[math(\displaystyle \hat{e}_{(\mu')} = \frac{\partial x^{\mu}}{\partial x^{\mu'}}\hat{e}_{(\mu)})]


이제, 벡터 [math(A)]의 두 좌표계에 대한 성분 [math(A^{\mu}, A^{\mu'})]에 대하여 [math(A = A^{\mu}\hat{e}_{(\mu)} = A^{\mu'}\hat{e}_{(\mu')})]임을 이용하면 이 둘은 다음과 같이 변환된다.

[math(\displaystyle A^{\mu'} = \frac{\partial x^{\mu'}}{\partial x^{\mu}}A^{\mu})]

3.2. 듀얼 벡터

벡터 공간에는 항상 그에 대응되는 벡터 공간이 하나 있으며, 그것을 쌍대 공간dual space라고 한다. 이는 하나의 벡터를 정의역으로 하는 선형사상linear functional의 집합으로 정의된다. 한편, 각각의 [math(p \in M)]에서 정의된 접공간 [math(T_pM)] 역시 벡터 공간이므로 그에 대응되는 cotangent space [math(T^*_pM)]이 정의된다. 각각의 듀얼 벡터dual vector, covector [math(\omega \in T^*_pM)]는, 다음을 만족시키는 선형사상 [math(\omega : T_pM \rightarrow \R)]이다.

#!wiki style="text-align: center"
[math(\omega(V + aW) = \omega(V) + a\omega(W)\quad)] (선형성)

[math((\omega + a\eta)(V) \equiv \omega(V) + a\eta(V)\quad)] (듀얼 벡터의 연산)
}}}

단일 접공간에 놓인 벡터를 다양체 전체에 정의된 벡터장으로 확장했듯이 듀얼 벡터도 다양체 전체, 즉 듀얼 벡터장으로 확장할 수 있다. 이것을 일차 형식one form이라고도 한다. [math(M)]에서 정의된 cotangent space 전체의 집합은 cotangent bundle [math(T^*M)]이라 한다. 듀얼 벡터장은 [math(\omega : M \rightarrow T^*M)]으로 볼 수 있다. (혹은, 각각의 [math(T_pM)]에서 정의되므로 [math(\omega : TM \rightarrow \R \,\,;\,\, \omega_p : T_pM \rightarrow \R)]로 볼 수도 있다.)

듀얼 벡터 역시 벡터이므로, 그 기저 [math(\hat{\theta}^{(\nu)})]를 생각할 수 있다. 이들은 기존 벡터 기저 [math(\hat{e}_{(\mu)})]에 대하여 다음과 같이 정의할 수 있다. 즉, 같은 첨자를 가진 기저 벡터의 함숫값은 1, 다른 첨자를 가진 기저 벡터의 함숫값은 0으로 정의한다.

[math(\hat{\theta}^{(\nu)}(\hat{e}_{(\mu)}) = \delta^{\nu}_{\mu})]


이 때, 듀얼 벡터를 다음과 같이 분해할 수 있다.

[math(\displaystyle \omega = \omega_{\mu}\hat{\theta}^{(\mu)})]


이처럼 벡터의 성분은 위 첨자이며, 듀얼 벡터의 성분은 아래 첨자이다.

임의의 벡터 [math(V)]에 대하여 함숫값 [math(\omega(V))]는 다음과 같다.

[math(\begin{aligned}\omega(V) &= \omega_{\mu}V^{\nu}\hat{\theta}^{(\mu)}(\hat{e}_{(\nu)}) \\ &= \omega_{\mu}V^{\nu}\delta^{\mu}_{\nu} \\ &= \omega_{\mu}V^{\mu}\end{aligned})]


벡터의 성분과 기저가 만나서 불변량이 되듯이, 벡터의 성분과 듀얼벡터의 성분이 만나면 불변량이 된다. 따라서, 듀얼벡터의 성분과 기저는 벡터와 그 성질이 반대가 된다고 추측할 수 있다. 실제로, 벡터의 함숫값이 스칼라임을 이용하면 듀얼벡터의 성분과 기저는 각각 다음과 같이 변환됨을 확인할 수 있으며, 벡터와 변환규칙이 서로 반대이다.

[math(\displaystyle \omega_{\mu'} = \frac{\partial x^{\mu}}{\partial x^{\mu'}}\omega_{\mu})]

[math(\displaystyle \hat{\theta}^{(\mu')} = \frac{\partial x^{\mu'}}{\partial x^{\mu}}\hat{\theta}^{(\mu)})]


듀얼 벡터의 대표적인 예로, 함수의 Gradient가 있다. Gradient는 다음과 같이 정의된 선형사상으로, "방향"(벡터)을 집어넣으면 함수의 변화량이 나온다.

[math(\displaystyle \mathrm{d}\phi = (\partial_{\mu}\phi)\,\hat{\theta}^{(\mu')})]


([math(\displaystyle \partial_{\mu} = \frac{\partial}{\partial x^{\mu}})]으로 표시한다.) chain rule을 사용하면, Gradient의 각 성분 [math(\partial_{\mu} \phi)]은 다음과 같이 좌표변환됨을 알 수 있다.

[math(\displaystyle \partial_{\mu'}\phi = \frac{\partial x^{\mu}}{\partial x^{\mu'}}\partial_{\mu}\phi)]


곡선 [math(x^{\mu}(\lambda))]의 속도벡터에 대해 정의된 함수의 미분은 다음과 같이 나타낼 수 있다.

[math(\displaystyle \frac{d\phi}{d\lambda} = \partial_{\mu}\phi\frac{dx^{\mu}}{d\lambda})]

3.3. 텐서

텐서tensor는 다양체에서 정의될 수 있는 가장 일반화된 선형 사상이다. 일반적으로, 텐서를 정의하는 방법은 좌표 변환, 다중 선형 사상, 텐서곱의 세가지이다. 뒤로 갈수록 이해하기 어렵지만, 그만큼 다른 구조에 의존하지 않고 단독적으로 정의할 수 있다. 우선, 다중 선형 사상의 관점에서 접근할 수 있다.

각 점 [math(p \in M)]에서 정의된 [math((k, l))] 텐서는 [math(p)]에서 정의된 [math(k)]개의 듀얼 벡터와 [math(l)]개의 벡터에 대한 다중 선형 사상이다. 이 때, [math((k, l))]을 텐서의 랭크rank라 한다.

[math(T : T^*_p \times ... \times T^*_p \times T_p \times ... \times T_p \,\, \rightarrow \,\, \mathbb{R})]
([math(k)] 개) [math(\quad\quad\quad\quad\,)] ([math(l)] 개) [math(\quad\,\,\,)]


텐서는 각각의 항에 대해 선형성을 만족시킨다. 예를 들어 [math((0, 2))] 텐서 [math(T)]에 대하여,

[math(T(U + aV, W + bX) = T(U, W) + bT(U, X) + aT(V, W) + abT(V, X))]


이다. 스칼라는 (0, 0) 텐서, 벡터는 (1, 0) 텐서, 듀얼 벡터는 (0, 1) 텐서이다.

텐서 역시 벡터 공간이며, 서로 더하거나 스칼라 곱을 할 수 있다. 따라서 기저를 정의할 수 있는데, 기저는 벡터와 듀얼 벡터의 텐서곱Tensor product으로 나타낼 수 있다. 텐서곱은 [math(\otimes)]로 나타내며, (k, l) 텐서 [math(T)]와 (m, n) 텐서 [math(S)]의 텐서곱은 [math((k+m, l+n))] 텐서 [math(T \otimes S)]로 다음과 같이 정의된다.

[math(\begin{aligned}T &\otimes S(\omega_1, ..., \omega_{k+m}, V_1, ..., V_{l+n}) \\ &= T(\omega_1, ..., \omega_k, V_1, ..., V_l)S(\omega_{k+1}, ..., \omega_{k+m}, V_{l+1}, ..., V_{l+n})\end{aligned})]


이제, [math((k, l))] 텐서 전체의 집합에 대한 기저를 다음과 같이 정의할 수 있다.

[math(\hat{e}_{(\mu_1)} \otimes ... \otimes \hat{e}_{(\mu_k)} \otimes \hat{\theta}^{(\nu_1)} \otimes ... \otimes \hat{\theta}^{(\nu_l)})]


이에 대하여, 텐서를 성분을 다음과 같이 정의할 수 있다. 기저 텐서곱의 순서(벡터와 듀얼벡터끼리)를 바꿀 수 있는데, 이 경우 첨자의 순서가 바뀐다.

[math(T = T^{\mu_1...\mu_k}_{\quad\quad\nu_1...\nu_l}\,\hat{e}_{(\mu_1)} \otimes ... \otimes \hat{e}_{(\mu_k)} \otimes \hat{\theta}^{(\nu_1)} \otimes ... \otimes \hat{\theta}^{(\nu_l)})]

[math(T^{\mu_1...\mu_k}_{\quad\quad\nu_1...\nu_l} = T(\hat{\theta}^{(\mu_1)}, ... , \hat{\theta}^{(\mu_k)}, \hat{e}_{(\nu_1)}, ... , \hat{e}_{(\nu_l)}))]


텐서의 함숫값은 다음과 같음을 알 수 있다.

[math(T(\omega_1, ..., \omega_k, V_1, ..., V_l) = T^{\mu_1...\mu_k}_{\quad\quad\nu_1...\nu_l}(\omega_1)_{\mu1}\,...\,(\omega_k)_{\mu_k}(V_1)^{\nu_1}\,...\,(V_l)^{\nu_l})]


[math(T(\omega_1, ... , \omega_k, V_1, ..., V_l))]이 스칼라임을 이용하면, 텐서의 성분은 다음과 같이 변환된다.

[math(\displaystyle T^{\mu'_1...\mu'_k}_{\quad\quad\nu'_1...\nu'_l} = \frac{\partial x^{\mu_1'}}{\partial x^{\mu_1}}...\frac{\partial x^{\mu_k'}}{\partial x^{\mu_k}}\frac{\partial x^{\nu_1}}{\partial x^{\nu_1'}}...\frac{\partial x^{\nu_k}}{\partial x^{\nu_k'}}T^{\mu_1...\mu_k}_{\quad\quad\nu_1...\nu_l})]


텐서의 대칭성에 관하여 다음 용어와 기호를 정의한다.
대칭성Symmetric : [math(S_{\mu\nu} = S_{\nu\mu})]
반대칭성Antisymmetric : [math(A_{\mu\nu} = -A_{\nu\mu})]
대칭화Symmetrize : [math(\displaystyle T_{(\mu_1 ... \mu_n)} = \frac{1}{n!}\sum_{\sigma \in S(n)} T_{\mu_{\sigma(1)} ... \mu_{\sigma(n)}})]
반대칭화Antisymmetrize : [math(\displaystyle T_{[\mu_1 ... \mu_n]} = \frac{1}{n!}\sum_{\sigma \in S(n)}\mathrm{sgn}(\sigma)T_{\mu_{\sigma(1)} ... \mu_{\sigma(n)}})]

텐서에 대한 몇 가지 연산을 정의할 수 있다. 먼저 축약contraction은 [math((k, l))] 텐서를 [math((k-1, l-1))] 텐서로 바꾸는 자연스러운 사상이다. 예를 들어,

[math(T^{\mu\rho}_{\quad\sigma} = T^{\mu\nu\rho}_{\quad\,\,\,\sigma\nu})]


이다.

편미분partial derivative [math(\partial_{\mu})]은 평평한 공간에 놓인 직교좌표계에서 [math((k, l))] 텐서장을 [math((k, l + 1))] 텐서장으로 만든다. 즉,

[math(T_{\mu}^{\alpha\beta} = \partial_{\mu}T^{\alpha\beta})]


는 텐서이다. 다만, 일반적인 다양체에서는 편미분이 텐서장을 만들지 못하므로, 이를 교정하기 위한 도구가 필요하다. (한가지 예외로, 스칼라의 편미분은 항상 [math((0, 1))] 텐서가 된다.)

3.4. 메트릭 텐서

텐서 중에서 특히 신경써야 할 것이 메트릭 텐서metric tensor이다. 메트릭 텐서는 두 벡터 사이의 내적inner product을 계산해주는 특수한 텐서이다. 즉,

[math(V \cdot W \equiv g(V, W) = g_{\mu\nu}V^{\mu}W^{\nu})]


이다. 메트릭 텐서는 모든 다양체에 자동으로 정의되는 것이 아니라 필요에 따라 다양체에 추가적으로 정의되는 구조additional structure이다. 다양체에 메트릭 구조가 추가되면 이 다양체에서는 두 벡터의 내적, 특히 벡터의 크기를 정의할 수 있다.

사실, 이러한 텐서는 이미 도입부에서 다룬 바 있다. 평평한 시공간, 즉 민코프스키 공간의 메트릭 텐서 [math(\eta_{\mu\nu})](의 성분)를 다음과 같이 정의할 수 있다.

[math(\eta_{\mu\nu} = \begin{pmatrix} -c^2&0&0&0 \\ 0&1&0&0 \\ 0&0&1&0 \\ 0&0&0&1 \end{pmatrix})]


메트릭 텐서의 역함수(성분행렬의 역행렬) [math(g^{\mu\nu})]는 다음과 같이 정의된다.

[math(g_{\mu\sigma}g^{\sigma\nu} = \delta^{\nu}_{\mu})]


메트릭 텐서를 이용해 첨자를 올리거나 내려서 rank를 바꿀 수 있다. 텐서의 첨자는 다음과 같이 올리거나 내릴 수 있다.

[math(T_{\,\,\mu\nu}^{\alpha} = g_{\mu\sigma}T_{\quad\nu}^{\alpha\sigma})]

[math(T^{\,\,\mu\nu}_{\alpha} = g^{\mu\sigma}T^{\quad\nu}_{\alpha\sigma})]


예를 들어, 메트릭 텐서를 이용해 벡터와 듀얼 벡터를 다음과 같이 서로 대응시킬 수 있다.

[math(V_{\mu} = g_{\mu\nu}V^{\nu})]

[math(\omega^{\mu} = g^{\mu\nu}\omega_{\nu})]


일반적인 유클리드 공간의 경우 [math(g_{\mu\nu} = \mathrm{diag}(1, ..., 1))]이므로, [math(V^{\mu} = V_{\mu})]가 되어 서로 대응되는 벡터와 듀얼 벡터는 성분이 똑같으며, 서로 구분되지 않는다. 그러나, 민코프스키 공간에서 [math(g_{\mu\nu} = \eta_{\mu\nu} = \mathrm{diag}(-c^2, 1, 1, 1))]이므로, [math(V^{\mu} = (v_0, v_1, v_2, v_3))]이면 [math(V_{\mu} = (-c^2v_0, v_1, v_2, v_3))]이다. 따라서, 벡터와 듀얼 벡터를 구분하는 것이 의미가 있다.

메트릭 텐서는 휘어진 공간을 공부할 때 가장 중심이 되는 텐서이다. 곡률 파트에서 그 중요성이 드러나게 되지만, 직관적으로 봤을 때 메트릭 텐서는 다양체 위 두 점 사이의 거리를 정의할 수 있다. 거리(제곱)를 [math(ds^2)]로 표시하면, 거리와 방향을 표현한 벡터 [math(dx^{\mu})]의 크기는

[math(ds^2 = g_{\mu\nu}dx^{\mu}dx^{\nu})]


가 된다. 이것을 다양체 위 임의의 두 점에 대해 시행하여 거리를 일일이 구한다고 생각해볼 수 있다. 이 거리 정보를 모두 모으면 원래의 공간을 그대로 재구성할 수 있으며, 물론 공간의 곡률도 확인할 수 있다. 이 설명은 다소 원론적인 논의이므로 좀 더 구체적으로 평평한 3차원 공간 위에 직교좌표계를 놓으면

[math(ds^2 = dx^2 + dy^2 + dz^2)]


으로 주어진다. 즉, 모든 점에서 메트릭 텐서의 각 성분은 상수이다. 반면 구면좌표계를 놓으면

[math(ds^2 = dr^2 + r^2(d\theta^2 + \mathrm{sin}^2\theta d\phi^2))]


이므로, [math(g_{\mu\nu} = \mathrm{diag}(1, r^2, r^2\mathrm{sin}^2\theta))]가 되어 메트릭 텐서의 성분은 상수가 아니게 된다. 하지만, 평평한 공간은 그대로이므로 이를 가지고 바로 공간이 휘어있다고 단정할 수는 없다. 지금 메트릭 텐서의 성분이 바뀐 것은 단순히 좌표를 바꿨기 때문이다. 따라서, 메트릭 텐서의 특정 변화를 통해 공간의 곡률을 확인할 수 있는 건 맞으나 그것을 찾아내는 데에는 다소 어려움이 있다. 실제로, 메트릭 텐서의 값과 그 일계 미분은 각각의 점에서 직교 좌표계처럼 되도록 만들 수 있다. 이는, 메트릭 텐서의 일계 미분까지는 공간의 곡률을 전혀 반영하지 못함을 의미한다. (schutz, local flatness theorem 참고) 곡률 파트에서 정의되는 곡률 텐서는 메트릭 텐서의 2계 미분을 포함한다.

4. 곡률(Curvature)과 열률(Torsion)

이제부터는 서로 떨어져 있는 점에 있는 벡터, 듀얼 벡터, 텐서를 비교하는 방법(접속)을 도입하고, 그것을 미분(공변 미분)하는 방법을 소개한다. 이는 메트릭 텐서의 미분으로 이루어진 곡률 텐서를 정의하기 위해서라도 필수적인 과정이다.

4.1. 공변 도함수와 접속

평평한 공간 위 직교좌표계에서 정의된 편미분 [math(\partial_{\alpha})]은 [math((k, l))] 텐서장 [math(\displaystyle T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l})]을 [math((k, l+1))] 텐서장 [math(\displaystyle \partial_{\alpha}T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l})]으로 보낸다. 이렇게 텐서의 미분이 다시 텐서가 되는 성질이 직교좌표계라는 한정적인 상황뿐만 아니라 임의의 좌표계에서도 성립하도록 만드는 것이 공변 도함수의 문제 의식이다. 즉, 공변 도함수 [math(\nabla)]는 좌표계에 상관없이 [math((k, l))] 텐서장에서 [math((k, l+ 1))] 텐서장으로 가는 사상으로서 다음 두 조건을 만족시킨다.

(1) 선형성(linearity) : [math(\nabla(T + aS) = \nabla T + a\nabla S)]
(2) 라이프니츠 규칙(leibnitz rule) : [math(\nabla(T \otimes S) = (\nabla T) \otimes S + T \otimes (\nabla S))]

우선, 어떤 텐서장의 단순한 편미분은 일반 좌표에서 텐서장을 형성하지 못한다. 이는 좌표변환을 해보면 쉽게 알 수 있다. 예를 들어 벡터 [math(V^{\mu})]에 대하여 편미분 [math(\partial_{\alpha}V^{\mu})]는 다음과 같이 좌표변환된다.
[math(\displaystyle \partial_{\alpha'}V^{\mu'} = \partial_{\alpha'} \biggl(\frac{\partial x^{\mu'}}{\partial x^{\mu}}V^{\mu} \biggr) = \frac{\partial x^{\alpha}}{\partial x^{\alpha'}}\frac{\partial x^{\mu'}}{\partial x^{\mu}} \partial_{\alpha}V^{\mu} + \frac{\partial x^{\alpha}}{\partial x^{\alpha'}} V^{\mu} \frac{\partial}{\partial x^{\alpha}}\frac{\partial x^{\mu'}}{\partial x^{\mu}})]

따라서, 그냥 편미분은 공변 도함수의 조건을 만족시키지 못한다. (다만, 스칼라장은 성분이 없으므로 공변 도함수가 곧 편미분임을 알 수 있다.) 여기에는 일종의 보정항이 필요한데, 이것을 접속Connection이라는 추가 구조가 도와준다. 접속의 각 계수(접속계수connection coefficient) [math(\Gamma)]는 다음과 같이 (선형적으로) 편미분을 보정해준다. 이것을 공변 도함수Covariant Derivative라 생각하자. (사실, Leibnitz rule로부터 공변 도함수가 편미분과 어떤 선형 변환의 합으로 이루어진다는 것을 증명할 수 있다. (Wald))

[math(\displaystyle \nabla_{\alpha}V^{\mu} \equiv \partial_{\alpha}V^{\mu} + (\Gamma_{\alpha})^{\mu}_{\nu}V^{\nu})]


이제, 공변 도함수가 어떻게 좌표변환되는지 알아보자. 물론,

[math(\displaystyle \nabla_{\alpha'}V^{\mu'} = \frac{\partial x^{\alpha}}{\partial x^{\alpha'}}\frac{\partial x^{\mu'}}{\partial x^{\mu}} \nabla_{\alpha}V^{\mu})]


가 성립하도록 만드는 것이 우리의 목표이므로 정확히는 이 조건을 만족시키기 위해 접속계수가 어떻게 변환되는지 확인하는 것이다. 공변 도함수의 정의와 그 변환 조건을 서로 비교해보면
[math(\displaystyle \nabla_{\alpha'}V^{\mu'} = \frac{\partial x^{\alpha}}{\partial x^{\alpha'}}\frac{\partial x^{\mu'}}{\partial x^{\mu}} \partial_{\alpha}V^{\mu} + \frac{\partial x^{\alpha}}{\partial x^{\alpha'}} V^{\mu} \frac{\partial}{\partial x^{\alpha}}\frac{\partial x^{\mu'}}{\partial x^{\mu}} + (\Gamma_{\alpha'})^{\mu'}_{\nu'}\frac{\partial x^{\nu'}}{\partial x^{\nu}}V^{\nu})]
[math(\displaystyle \quad\quad\quad\,\, = \frac{\partial x^{\alpha}}{\partial x^{\alpha'}}\frac{\partial x^{\mu'}}{\partial x^{\mu}} \partial_{\alpha}V^{\mu} + \frac{\partial x^{\alpha}}{\partial x^{\alpha'}}\frac{\partial x^{\mu'}}{\partial x^{\mu}}(\Gamma_{\alpha})^{\mu}_{\nu}V^{\nu})]

이므로
[math(\displaystyle (\Gamma_{\alpha'})^{\mu'}_{\nu'}\frac{\partial x^{\nu'}}{\partial x^{\nu}} = \frac{\partial x^{\alpha}}{\partial x^{\alpha'}}\frac{\partial x^{\mu'}}{\partial x^{\mu}}(\Gamma_{\alpha})^{\mu}_{\nu} - \frac{\partial x^{\alpha}}{\partial x^{\alpha'}} \frac{\partial}{\partial x^{\alpha}}\frac{\partial x^{\mu'}}{\partial x^{\nu}})]

를 얻는다. 즉,

[math(\displaystyle (\Gamma_{\alpha'})^{\mu'}_{\nu'} = \frac{\partial x^{\nu}}{\partial x^{\nu'}}\frac{\partial x^{\alpha}}{\partial x^{\alpha'}}\frac{\partial x^{\mu'}}{\partial x^{\mu}}(\Gamma_{\alpha})^{\mu}_{\nu} - \frac{\partial x^{\nu}}{\partial x^{\nu'}}\frac{\partial x^{\alpha}}{\partial x^{\alpha'}} \frac{\partial}{\partial x^{\alpha}}\frac{\partial x^{\mu'}}{\partial x^{\nu}})]


이다.

접속계수는 텐서의 성분이 아니다. 이는 공변 도함수는 텐서인데 편미분은 텐서가 아니므로 당연한 현상이다. 따라서 첨자를 쓰는 방식에 있어서 그렇게 신경쓸 필요가 없으므로, 그냥 [math(\displaystyle (\Gamma_{\alpha})^{\mu}_{\nu} = \Gamma^{\mu}_{\alpha\nu})]라 쓰기로 하자. 다만, 두 아래 첨자는 원칙적으로 서로 교환되지 않음에 유의한다.

마찬가지로, 1-형식의 공변 도함수도 정의할 수 있다. 임의의 벡터 [math(V^{\mu})]에 대하여 축약 [math(\omega_{\mu}V^{\mu})]가 스칼라이므로 그 공변 도함수가 편미분임을 이용하면 다음을 얻는다.

[math(\displaystyle \nabla_{\alpha}\omega_{\mu} = \partial_{\alpha}\omega_{\mu} - \Gamma_{\alpha\mu}^{\nu}\omega_{\nu})]


즉, 접속계수의 부호만 반대로 바꾼 것이다.

일반적으로, 임의의 [math((k, l))] 텐서 [math(\displaystyle T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l})]의 공변 미분은 다음과 같이 전개된다.

[math(\displaystyle \begin{aligned}\nabla_{\alpha}T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l} = \,\,&\partial_{\alpha}T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l} \\ & + \Gamma^{\mu_1}_{\alpha \sigma}T^{\,\sigma ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l} + \Gamma^{\mu _2}_{\alpha \sigma}T^{\,\mu_1 \sigma ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l} + ... \\ & - \Gamma^{\sigma}_{\alpha \nu_1}T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\sigma ... \nu_l} - \Gamma^{\sigma}_{\alpha \nu_2}T^{\,\mu_1\sigma ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l} - ... \end{aligned})]


지금까지 우리는 공변 도함수를 정의하기 위해 다양체에 접속이라는 추가 구조를 도입하여 그 변환규칙과 전개식을 살펴보았다. 접속은 직관적으로 (이름이 시사하듯) 서로 다른 두 점 위의 접공간 등을 옮겨서 비교하는, 또는 겹쳐보는 도구라고 할 수 있다. 때문에 평행이동, 공변 도함수 등을 정의할 수 있다. (거꾸로 말하자면, 공변 도함수는 접속이라는 추가 구조를 필요로 한다. 하지만, 리 미분처럼 다양체에 정의된 벡터장만으로 미분을 정의할 수도 있다.) 이러한 접속은 어느 하나(예; 메트릭 텐서)에 의존할 필요 없이 임의적으로 정의할 수 있다. 이 때, 서로 다른 두 접속의 차이 [math(\Gamma^{\mu}_{\alpha\beta} - \tilde{\Gamma}^{\mu}_{\alpha\beta})]는 좌표변환 규칙을 확인해보면 알겠지만 자동으로 텐서가 된다.

이 때, 아래 첨자 둘을 서로 맞바꾼 것도 새로운 접속을 정의한다. 이 둘의 차이 [math(T^{\mu}_{\alpha\beta} = \Gamma^{\mu}_{\alpha\beta} - \Gamma^{\mu}_{\beta\alpha} = 2 \Gamma^{\mu}_{[\alpha\beta]})]를 비틀림 텐서Torsion tensor라 정의한다. 비틀림 텐서는 아래 첨자에 대해 반대칭이며, 비틀림 텐서가 0인 접속을 Torsion - free라고 한다. 물론, 이러한 접속은 아래 첨자에 대해 대칭적이다.

이제, 일반 상대성 이론에서 가장 중요하게 쓰이는 접속을 정의해보자. 이 접속은 다음 두 조건을 만족시킨다.

(1) Torsion - free : [math(\Gamma^{\mu}_{\alpha\beta} = \Gamma^{\mu}_{\beta\alpha})]
(2) metric compatible : [math(\nabla_{\sigma}g_{\mu\nu} = 0)]

이 접속은 메트릭 텐서를 항상 자기 자신과 같아지도록 옮긴다. 이것을 해석하는 방법은 여러가지지만, 일단 특수 상대성 이론에서 [math(\partial_{\alpha}g_{\mu\nu} = \partial_{\alpha}\eta_{\mu\nu} = 0)]을 일반화한 것으로 생각해도 좋다. 또한, [math(g_{\mu\nu}\nabla_{\alpha}V^{\nu} = \nabla_{\alpha}(g_{\mu\nu}V^{\nu}) = \nabla_{\alpha} V_{\mu})]이므로 공변 도함수에 대해서도 [math(g_{\mu\nu})]의 "첨자 옮김" 역할이 자연스럽다는 것도 큰 장점이다. 따라서, 공변 도함수가 있더라도 자유롭게 첨자를 배치할 수 있다.

이렇게 정의된 접속계수는 다음과 같은 세 등식을 연립하면 쉽게 유도할 수 있다.

[math(\nabla_{\alpha}g_{\mu\nu} = \partial_{\alpha}g_{\mu\nu} - \Gamma^{\sigma}_{\mu\alpha}g_{\sigma\nu} - \Gamma^{\sigma}_{\nu\alpha}g_{\sigma\mu} = 0)]
[math(\nabla_{\mu}g_{\alpha\nu} = \partial_{\mu}g_{\alpha\nu} - \Gamma^{\sigma}_{\mu\alpha}g_{\sigma\nu} - \Gamma^{\sigma}_{\mu\nu}g_{\sigma\alpha} = 0)]
[math(\nabla_{\nu}g_{\mu\alpha} = \partial_{\nu}g_{\mu\alpha} - \Gamma^{\sigma}_{\mu\nu}g_{\sigma\alpha} - \Gamma^{\sigma}_{\nu\alpha}g_{\sigma\mu} = 0)]

[math(\displaystyle \Gamma^{\alpha}_{\mu\nu} = \frac{1}{2}g^{\alpha\sigma}(\partial_{\mu}g_{\sigma\nu} + \partial_{\nu}g_{\mu\sigma} - \partial_{\sigma}g_{\mu\nu}))]


이를 레비치비타 접속Levi-civita connection 또는 리만 접속Riemannian connection이라 하고, 그 계수를 크리스토펠 기호Christoffel symbol라고 한다.

레비치비타 접속은 벡터의 (공변) 발산 [math(\nabla_{\mu}V^{\mu})]를 간단하게 표현할 수 있다. 먼저,

[math(\displaystyle\Gamma^{\mu}_{\mu\nu} = \frac{1}{2}g^{\mu\sigma}(\partial_{\nu}g_{\sigma\mu} + \partial_{\mu}g_{\sigma\nu} - \partial_{\sigma}g_{\mu\nu}))]


에서, [math(g^{\mu\sigma}(\partial_{\mu}g_{\sigma\nu} - \partial_{\sigma}g_{\mu\nu}))]는 [math(\mu, \sigma)]에 대하여 반대칭이고 [math(g^{\mu\sigma})]는 대칭이므로 0이 된다. 따라서

[math(\displaystyle\Gamma^{\mu}_{\mu\nu} = \frac{1}{2}g^{\mu\sigma}\partial_{\nu}g_{\sigma\mu})]


이다. 이 때, [math(g^{\mu\nu})]는 [math(g_{\mu\nu})]의 역행렬이므로 행렬식 [math(g)]에 대하여 [math(\displaystyle \partial_{\mu}g = gg^{\alpha\beta}\partial_{\mu}g_{\beta\alpha})]이다. 즉

[math(\displaystyle \Gamma^{\mu}_{\mu\nu} = \frac{1}{2}\frac{1}{g}\partial_{\nu}g = \frac{1}{\sqrt{|g|}}\partial_{\nu}\sqrt{|g|})]


이다. 따라서,

[math(\displaystyle \nabla_{\mu}V^{\mu} = \frac{1}{\sqrt{|g|}}\partial_{\mu}(\sqrt{|g|}V^{\mu}))]


를 얻는다.

4.2. 평행이동

이제, 접속의 두번째 활용인 평행이동parallel transport을 정의할 수 있다. 일반적으로, 평평한 공간에서는 평행이동에 대해 심각하게 고민할 필요가 없다. 직교 좌표계를 잡았다면, 다른 점으로 이동시킨 벡터나 텐서는 그 성분이 그대로 보존된다. 이는 어떤 경로를 따라 옮기더라도 성립한다. 그러나, 휘어진 공간에서는 평행이동의 결과물이 경로에 의존하게 된다. 예를 들어, 지구 적도 위에 놓인 화살표는 그대로 북극으로 이동시킨 것과, 적도를 따라 90도 이동시켰다가 북극으로 이동시킨 것의 방향이 서로 다르다. 이것은 휘어진 공간의 가장 핵심적인 성질이며, 어떤 방식으로도 이를 해소할 수가 없다. 따라서, 일반적인 공간에서는 경로에 의존하는 평행이동을 정의해야만 한다. 이 때, 평행이동이란 벡터를 최대한 건드리지 않고 조심스럽게 옮겨야 한다. 따라서 경로 방향으로 놓인 새로운 벡터(평행이동된 벡터)와의 차이(공변 도함수)가 0이어야 함을 짐작할 수 있다.

[math(\lambda)]로 매개화된 경로 [math(x^{\alpha}(\lambda))]에 대한 공변미분을 다음과 같이 정의한다.

[math(\displaystyle \frac{D}{d \lambda} = \frac{d x^{\alpha}}{d \lambda}\nabla_{\alpha})]


따라서, 텐서 [math(\displaystyle T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l})]의 평행이동은

[math(\displaystyle \biggl(\frac{D}{d \lambda}T\biggr)^{\,\mu_1 ... \mu_k}_{\,\nu_1 ... \nu_l}= \frac{d x^{\alpha}}{d \lambda}\nabla_{\alpha}T^{\,\mu_1 ... \mu_k}_{\quad\quad\,\nu_1 ... \nu_l} = 0)]


을 만족시켜야 한다.

이 때, 레비치비타 접속은 다음과 같이 두 벡터의 내적을 보존하게 된다. 즉, 두 벡터 [math(V^{\mu})]와 [math(W^{\mu})]를 평행이동시켰을 때

[math(\displaystyle \frac{D}{d \lambda}(g_{\mu\nu}V^{\mu}W^{\nu}) = \frac{D}{d \lambda}(g_{\mu\nu})V^{\mu}W^{\nu} + \frac{D}{d \lambda}(V^{\mu})g_{\mu\nu}W^{\nu} + \frac{D}{d \lambda}(W^{\nu})g_{\mu\nu}V^{\mu})]


의 세 항은 각각 0이다. 이러한 성질은 다양체에 메트릭 텐서가 주어졌을 때 가장 자연스러운 접속이 레비치비타 접속임을 말해준다.

4.3. 측지선

측지선geodesics 은 평평한 공간의 '직선'을 일반화한 것으로, 최대한 똑바르게 나아가는 곡선을 의미한다. 따라서, 측지선은 그 속도벡터가 자기자신으로 평행이동되는 곡선으로 정의된다. 즉, 곡선의 속도벡터 [math(\displaystyle V = \frac{d}{d\lambda})]에 대하여

[math(\displaystyle \frac{D}{d\lambda}V = \nabla_VV = 0)]


혹은 특정 기저를 선택하면

[math(\displaystyle V^{\alpha}\nabla_{\alpha}V^{\mu} = 0)]


이다. 이를 풀면 다음 측지선 방정식geodesic equation을 얻는다.

[math(\displaystyle \frac{d^2x^{\mu}}{d\lambda^2} + \Gamma^{\mu}_{\alpha\beta}\frac{dx^{\alpha}}{d \lambda}\frac{dx^{\beta}}{d \lambda} = 0)]


한편, 측지선은 길이가 최소 또는 최대로 최적화되어있는 경로, 즉 (미세 경로 변동에 대한) 길이 변동이 거의 없는 경로로도 이해할 수 있다. 즉,

[math(\displaystyle \tau = \int\biggl(-g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\biggr)^\frac{1}{2}d\lambda)]


라 두고 [math(\delta \tau = 0)]을 풀어보면, 평행이동에 따른 측지선 방정식과 밀접한 연관을 갖는 방정식이 유도된다.

이를 풀기 위해선, 먼저 [math(x^{\mu})]와 [math(g_{\mu\nu})]를 다음과 같이 미세하게 변화시킨다.

[math(x^{\mu} \rightarrow x^{\mu} + \delta x^{\mu})]
[math(g_{\mu\nu} \rightarrow g_{\mu\nu} + \delta x^{\sigma}\partial_{\sigma}g_{\mu\nu})]


이를 측지선 식에 대입하면 다음과 같이 전개된다.

[math(\displaystyle \begin{aligned} \tau + \delta \tau &= \int\biggl(-g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda} - \partial_{\sigma} g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\delta x^{\sigma} - 2g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{d(\delta x^{\nu})}{d\lambda}\biggr)^{\frac{1}{2}} \\ &= \int\biggl(-g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\biggr)^{\frac{1}{2}}\Bigg[1 + \biggl(-g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\biggr)^{-1}\biggr)\times\biggl(-\partial_{\sigma}g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\delta x^{\sigma} - 2g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{d(\delta x^{\nu})}{d\lambda}\biggr)\Biggr]^{\frac{1}{2}}d\lambda \end{aligned})]


[math(\delta x^{\sigma})]는 매우 작으므로, 대괄호의 제곱근을 다음과 같이 전개할 수 있다.

[math(\displaystyle \delta \tau = \int\biggl(-g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\biggr)^{-\frac{1}{2}}\biggl(-\frac{1}{2}\partial_{\sigma}g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\delta x^{\sigma} - g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{d(\delta x^{\nu})}{d\lambda}\biggr)d\lambda)]


이 때, [math(\lambda)]를 고유 시간 [math(\tau)]에 대해 [math(\displaystyle d\lambda = \biggl(-g_{\mu\nu}\frac{dx^{\mu}}{d\lambda}\frac{dx^{\nu}}{d\lambda}\biggr)^{-\frac{1}{2}}d\tau)]와 같이 매개화하면, 식은 다음과 같이 바뀐다.

[math(\displaystyle \begin{aligned} d\tau &= \int\biggl(-\frac{1}{2}\partial_{\sigma}g_{\mu\nu}\frac{dx^{\mu}}{d\tau}\frac{dx^{\nu}}{d\tau}\delta x^{\sigma} - g_{\mu\nu}\frac{dx^{\mu}}{d\tau}\frac{d(\delta x^{\nu})}{d\tau}\biggr)d\tau \\ &= \int\biggl(-\frac{1}{2}\partial_{\sigma}g_{\mu\nu}\frac{dx^{\mu}}{d\tau}\frac{dx^{\nu}}{d\tau} + \frac{d}{d\tau}\biggl(g_{\mu\sigma}\frac{dx^{\mu}}{d\tau}\biggr)\biggr)\delta x^{\sigma}d\tau \end{aligned})]


마지막 줄은 [math(\delta x^{\sigma})]가 곡선의 양 끝점에서 사라짐을 이용한 것이다. 이제, [math(d\tau = 0)]이라 두면 ([math(\displaystyle \frac{dg_{\mu\sigma}}{d\tau} = \frac{dx^{\nu}}{d\tau}\partial_{\nu}g_{\mu\sigma})])

[math(\displaystyle -\frac{1}{2}\partial_{\sigma}g_{\mu\nu}\frac{dx^{\mu}}{d\tau}\frac{dx^{\nu}}{d\tau} + \frac{dx^{\mu}}{d\tau}\frac{dx^{\nu}}{d\tau}\partial_{\nu}g_{\mu\sigma} + g_{\mu\sigma}\frac{d^2 x^{\mu}}{d\tau^2} = 0)]

[math(\displaystyle g_{\mu\sigma}\frac{d^2 x^{\mu}}{d\tau^2} + \frac{1}{2}(-\partial_{\sigma}g_{\mu\nu} + \partial_{\nu}g_{\mu\sigma} + \partial_{\mu}g_{\nu\sigma})\frac{dx^{\mu}}{d\tau}\frac{dx^{\nu}}{d\tau} = 0)]

[math(\displaystyle \frac{d^2 x^{\rho}}{d\tau^2} + \frac{1}{2}g^{\rho\sigma}(\partial_{\mu}g_{\nu\sigma} + \partial_{\nu}g_{\sigma\mu} - \partial_{\sigma}g_{\mu\nu})\frac{dx^{\mu}}{d\tau}\frac{dx^{\nu}}{d\tau} = 0)]


만약, 레비치비타 접속을 선택하면 이는 원래 유도했던 측지선 방정식과 동일해진다. 따라서, 메트릭 구조가 있는 다양체에서 최대(최소)의 길이를 갖는 경로는 속도벡터를 (레비치비타 접속에 따라) 평행이동시킨 경로와 같다는 결론을 얻는다.

4.4. 리만 텐서

앞서 살펴보았듯이, 평평한 공간과 휘어진 공간의 결정적 차이는 벡터의 평행이동이 경로에 의존하느냐 마느냐이다. 따라서, 두 경로에 따른 평행이동이 차이나는 정도를 곡률로 정의할 수 있으며, 이 개념을 기반으로 곡률 텐서, 즉 리만-크리스토펠 곡률 텐서Riemann–Christoffel–Krümmungstensor를 정의할 수 있다.

두 경로를 특정화하기 위해 두 벡터 [math(A^{\mu})]와 [math(B^{\mu})]를 생각한다. 경로 1은 [math((\delta a)A^{\mu} \rightarrow (\delta b)B^{\mu})]를 나타내고, 경로 2는 [math((\delta b)B^{\mu} \rightarrow (\delta a)A^{\mu})]를 나타낸다고 하자. 각 경로를 통해 벡터 [math(V^{\mu})]가 평행이동한 것을 [math((V_1)^{\mu})]와 [math((V_2)^{\mu})]라 하면 그 차이는 [math(V^{\mu})]에 선형이고 평행이동에 사용된 두 변에 각각 비례할 것이므로 다음과 같은 형태를 띠어야 한다. (보통, 두 경로보다는 두 벡터로 정의된 루프를 이용해 정의한다. 이 때는 부호가 반대로 뒤집힌다.)

[math(\delta V^{\mu} = (V_2)^{\mu} - (V_1)^{\mu} = (\delta a)(\delta b) R^{\mu}_{\,\,\nu\alpha\beta}A^{\alpha}B^{\beta}V^{\nu})]


여기에서 [math(R^{\mu}_{\,\,\nu\alpha\beta})]를 리만텐서라 부른다. 물론, 경로 1과 경로 2의 역할을 바꾸면 [math(\delta V^{\mu})]의 방향이 반대로 뒤집히므로, 리만텐서는 마지막 두 첨자에 대해 반대칭이다.

[math(R^{\mu}_{\,\,\nu\alpha\beta} = -R^{\mu}_{\,\,\nu\beta\alpha} )]


이렇게 표현한 식을 그대로 평행이동의 식에 맞춰서 계산해볼 수 있다. 일단, 특정 좌표계의 특정 벡터 - 두 기저 벡터 [math(A = \hat{e}_1,\,\, B = \hat{e}_2)]라 가정하고 간단하게 살펴보자. 이 때 시작점의 [math(x, y)] 좌표를 [math(a, b)], 끝점의 [math(x, y)] 좌표를 [math(a + \delta a, b + \delta b)]라 둘 수 있다. 또한 [math(\nabla_{\hat{e}_1}V^{\mu} = 0)], [math(\nabla_{\hat{e}_2}V^{\mu} = 0)]이므로, 다음과 같이 계산할 수 있다.
[math(\begin{aligned}(V_1)^{\mu} - V^{\mu} &= (V(a + \delta a, b + \delta b)^{\mu} - V(a + \delta a, b)^{\mu}) + (V(a + \delta a, b)^{\mu} - V(a, b)^{\mu}) \\ &\approx (\delta b)\partial_2 V^{\mu}(a + \delta a, b) + (\delta a)\partial_1 V^{\mu}(a, b) \\ &= - (\delta b)\Gamma^{\mu}_{2\sigma} V^{\sigma}(a + \delta a, b) - (\delta a)\Gamma^{\mu}_{1\sigma} V^{\sigma}(a, b)\end{aligned})]
[math(\begin{aligned}(V_2)^{\mu} - V^{\mu} &= (V(a + \delta a, b + \delta b)^{\mu} - V(a , b + \delta b)^{\mu}) + (V(a, b + \delta b)^{\mu} - V(a, b)^{\mu}) \\ &\approx (\delta a)\partial_1 V^{\mu}(a, b + \delta b) + (\delta b)\partial_2 V^{\mu}(a, b) \\ &= - (\delta a)\Gamma^{\mu}_{1\sigma} V^{\sigma}(a, b + \delta b) - (\delta b)\Gamma^{\mu}_{2\sigma} V^{\sigma}(a, b)\end{aligned})]
[math(\begin{aligned}(V_2)^{\mu} - (V_1)^{\mu} &= ((V_2)^{\mu} - V^{\mu}) - ((V_1)^{\mu} - V^{\mu}) \\ &= ((\delta b)\Gamma^{\mu}_{2\sigma}V^{\sigma}(a + \delta a, b) - (\delta b)\Gamma^{\mu}_{2\sigma}V^{\sigma}(a, b)) - ((\delta a)\Gamma^{\mu}_{1\sigma}V^{\mu}(a, b + \delta b) - (\delta a)\Gamma^{\mu}_{1\sigma}V^{\sigma}(a, b)) \\ &\approx (\partial_1(\Gamma^{\mu}_{2\sigma}V^{\sigma}) - \partial_2(\Gamma^{\mu}_{1\sigma}V^{\sigma})) \\ &= (\delta a)(\delta b)(\partial_1\Gamma^{\mu}_{2\sigma}V^{\sigma} + \Gamma^{\mu}_{2\sigma}\partial_1V^{\sigma} - \partial_2\Gamma^{\mu}_{1\sigma}V^{\sigma} - \Gamma^{\mu}_{1\sigma}\partial_2V^{\sigma}) \\ &= (\delta a)(\delta b)\biggl[\partial_1\Gamma^{\mu}_{2\sigma} - \partial_2\Gamma^{\mu}_{1\sigma} + \Gamma^{\mu}_{1\lambda}\Gamma^{\lambda}_{2\sigma} - \Gamma^{\mu}_{2\lambda}\Gamma^{\lambda}_{1\sigma}\biggr]V^{\sigma} \end{aligned})]

따라서, 정의식과 비교해보면

[math(R^{\mu}_{\,\,\sigma 12} = \partial_1\Gamma^{\mu}_{2\sigma} - \partial_2\Gamma^{\mu}_{1\sigma} + \Gamma^{\mu}_{1\lambda}\Gamma^{\lambda}_{2\sigma} - \Gamma^{\mu}_{2\lambda}\Gamma^{\lambda}_{1\sigma})]


임을 알 수 있다.

이를 좀 더 엄밀하게 살펴보려면 공변 도함수의 교환성으로 표현을 바꾸어 리만 텐서를 정의하는 것이 좋다. 경로를 정의하는 데 사용된 두 벡터 [math(A^{\mu})]와 [math(B^{\mu})]를 공변 도함수 방향을 정의하기 위한 벡터로 보면 두 개념의 관계는 굉장히 명료하다. 공변 도함수는 (텐서장이 주어졌을 때) 원래의 텐서와 이웃한 점에서 경로에 의존하여 평행이동된 텐서를 비교하는 것이다. 따라서, 경로를 따라가면서 벡터가 어떻게 바뀌었는지 보는 것과 거의 같은 행위가 된다. 따라서, 두 공변 도함수의 교환자는 두 경로로 움직이면서 발생한 벡터의 차이를 서로 뺀, 즉 두 경로로 평행이동된 벡터를 비교하는 것과 같다. 다음을 살펴보자.
[math(\begin{aligned}[\nabla_{\mu}, \nabla_{\nu}]V^{\alpha} &= \nabla_{\mu}\nabla_{\nu}V^{\alpha} - \nabla_{\nu}\nabla_{\mu}V^{\alpha} \\ &= \partial_{\mu}(\nabla_{\nu}V^{\alpha}) - \Gamma^{\sigma}_{\mu\nu}\nabla_{\sigma}V^{\alpha} + \Gamma^{\alpha}_{\mu\sigma}\nabla_{\nu}V^{\sigma} - \partial_{\nu}(\nabla_{\mu}V^{\alpha}) + \Gamma^{\sigma}_{\mu\nu}\nabla_{\sigma}V^{\alpha} - \Gamma^{\alpha}_{\nu\sigma}\nabla_{\mu}V^{\sigma}
\\ &= (\partial_{\mu}\Gamma^{\alpha}_{\nu\sigma} - \partial_{\nu}\Gamma^{\alpha}_{\mu\sigma} + \Gamma^{\alpha}_{\mu\lambda}\Gamma^{\lambda}_{\nu\sigma} - \Gamma^{\alpha}_{\nu\lambda}\Gamma^{\lambda}_{\mu\sigma})V^{\sigma} - 2\Gamma^{\lambda}_{[\mu\nu]}\nabla_{\lambda}V^{\alpha} \end{aligned})]

마지막 항은 앞서 정의한 비틀림 텐서이므로, 앞 항 역시 텐서이다. 이를 다음과 같이 쓴다.

[math([\nabla_{\mu}, \nabla_{\nu}]V^{\alpha} = R^{\alpha}_{\,\,\sigma\mu\nu}V^{\sigma} - T_{\mu\nu}^{\sigma}\nabla_{\sigma}V^{\alpha})]


따라서, 리만 텐서는 다음과 같다. 앞서 유도한 식과 동일하다.

[math(R^{\alpha}_{\,\,\sigma\mu\nu} = \partial_{\mu}\Gamma^{\alpha}_{\nu\sigma} - \partial_{\nu}\Gamma^{\alpha}_{\mu\sigma} + \Gamma^{\alpha}_{\mu\lambda}\Gamma^{\lambda}_{\nu\sigma} - \Gamma^{\alpha}_{\nu\lambda}\Gamma^{\lambda}_{\mu\sigma})]


리만 텐서는 온전히 접속에 의해서 정의되므로 어떠한 접속에 대해서도 정의될 수 있으며, 원래는 메트릭 텐서와 관련이 없다. 비틀림이 없을 필요도 없다.

다음 단계로 넘어가기 전에, 몇가지 다른 표현을 살펴보자. 일반적으로 벡터는 방향 미분으로 이해할 수 있으므로 두 벡터의 교환자(원래 이름은 Lie bracket이다.)를 다음과 같이 정의한다.

[math([X, Y]^{\mu} = X^{\sigma}\partial_{\sigma}Y^{\mu} - Y^{\sigma}\partial_{\sigma}X^{\mu})]


만약, 두 벡터가 어떤 좌표의 기저벡터였다면 편미분 교환법칙에 의해 [math([\partial_{\mu}, \partial_{\nu}] = 0)]이 될 것이다. 한편, 비틀림 텐서 [math(T(\,\\,\,))]와 리만 텐서 [math(R(\,\\,\,))]는 교환자를 이용하면 다음과 같이 변형할 수 있다. 이는 특정 기저에 의존하지 않고, 두 벡터장 [math(X, Y)]에만 의존하는 표현이다. 이 때, [math(T(X, Y)^{\mu} = T^{\mu}_{\alpha\beta}X^{\alpha}Y^{\beta}, \,\,[R(X, Y)Z]^{\mu} = R^{\mu}_{\,\,\sigma\alpha\beta}Z^{\sigma}X^{\alpha}Y^{\beta})]이다.

[math(T(X, Y) = \nabla_X Y - \nabla_Y X - [X, Y])]

[math(R(X, Y)Z = \nabla_X\nabla_Y Z - \nabla_Y\nabla_X Z - \nabla_{[X, Y]}Z)]


이 관계식으로부터 [math(R(\,\,,\,\,))]가 텐서임을 다음 세 단계로 보일 수 있다.

(1) [math(R(aX_1+bX_2, Y)Z = aR(X_1, Y)Z + bR(X_2, Y)Z)]
(2) [math(R(X, aY_1+bY_2)Z = aR(X, Y_1)Z + bR(X, Y_2)Z)]
(3) [math(R(X, Y)(aZ_1+bZ_2) = aR(X, Y)Z_1 + bR(X, Y)Z_2)]

이제, 일반 상대성 이론에서 중요한 레비치비타 접속에서 리만 텐서가 어떻게 되는지 확인해보자. 일단, 비틀림이 0이므로 공변 도함수의 교환자는 그대로 리만 텐서에 비례한다.

[math([\nabla_{\mu}, \nabla_{\nu}]V^{\alpha} = R^{\alpha}_{\,\,\sigma\mu\nu}V^{\sigma})]


또, 리만 텐서는 곡률 텐서이므로 평평한 공간이라면 0이 될 것이다. 이는 특정 좌표계, 즉 직교 좌표계에서만 살펴보면 되는데, 이 때 [math(g_{\mu\nu})]는 완전히 상수가 된다. 따라서 [math(\Gamma^{\alpha}_{\mu\nu})]와 [math(\partial_{\sigma}\Gamma^{\alpha}_{\mu\nu})]는 모두 사라지므로, [math(R^{\alpha}_{\,\,\sigma\mu\nu} = 0)]이 된다. 그러므로, 모든 좌표계에서 리만 텐서는 0이 된다.

물론, 리만 텐서가 0이면 거꾸로 공간이 평평해지는지도 알고 싶어진다. 이는 리만 텐서가 0일 때 모든 점에서 메트릭 텐서가 [math(\eta_{\mu\nu})]가 되도록 좌표계를 잡는 것이 가능하느냐는 것과 같은 말이다. 이 말은 결론적으로 참인데, 먼저 한 점 [math(p)]에서 [math(g_{\mu\nu} = \eta_{\mu\nu})]가 되도록 기저 [math(\{\hat{e}_{(\mu)}\})]를 잡아보자.

이제, 이 기저들을 통째로 나머지 모든 점으로 평행이동시켜서 기저 벡터장을 만들 수 있다. 일반적인 다양체의 경우 이 평행이동을 명확히 정해줘야 하지만, 리만텐서가 모든 점에서 0이라면 어떤 경로를 따라 평행이동을 하더라도 그 결과물이 같으므로 기저 벡터장은 혼동없이 단 하나로 정해진다. 반대로 각각의 점에서, 기저 벡터는 어떤 경로에 대해서도 그로부터 평행이동이 되었다고 말할 수 있다. (리만 텐서가 0이 아니면 이것이 불가능하다.) 특히 각 기저 벡터에 대해서도 이는 참이다.

[math(\displaystyle \nabla_{\hat{e}_{(\nu)}}\hat{e}_{(\mu)} = 0)]


따라서,

[math([\hat{e}_{(\mu)}, \hat{e}_{(\nu)}] = \nabla_{\hat{e}_{(\mu)}}\hat{e}_{(\nu)} - \nabla_{\hat{e}_{(\nu)}}\hat{e}_{(\mu)} - T(\hat{e}_{(\mu)}, \hat{e}_{(\nu)})= 0)]


이 성립한다. 이처럼 [math([\hat{e}_{(\mu)}, \hat{e}_{(\nu)}] = 0)]일 때 어떤 좌표계 [math(\{x^{\mu}\})]에 대하여 [math(\displaystyle \hat{e}_{(\mu)} = \partial_{\mu})]임을 프로베니우스 정리Frobenius Theorem가 말해준다. 따라서, 이 기저 벡터장은 그대로 어떤 좌표계의 기저가 됨을 바로 얻는다. 이 좌표계에서는 레비치비타 접속의 성질에 따라 모든 점에서

[math(g_{\mu\nu} = g(\hat{e}_{(\mu)}, \hat{e}_{(\nu)}) = g(\hat{e}_{(\mu)}, \hat{e}_{(\nu)})(p) = \eta_{\mu\nu})]


이며, 따라서 [math(\{x_{\mu}\})]는 평평한 공간의 직교 좌표계이다. 이로부터 리만 텐서가 0이라는 것과, 공간이 평평하다는 것이 서로 필요충분조건임을 확인할 수 있다.

4.5. 측지선 편차

지금까지, 리만 텐서는 (서로 관련이 깊은) 경로에 따른 평행이동의 차이와 공변 도함수의 교환자의 관점에서 설명되었다. 이번에는 리만 텐서를 가장 물리적으로 의미있는 형태로 알아보자. 이는 두 측지선의 편차geodesic deviation로 설명할 수 있다. 측지선 편차는, 평평한 공간에서 받아들여졌던 "평행선"의 의미가 휘어진 공간에서는 더이상 성립할 수 없다는 것을 보여준다.

먼저, 공간 상에 두 개의 실수 [math(s, t)]로 매개화된 측지선 그룹을 정의해야 한다. 물론, 이 측지선 그룹은 주어진 공간을 다 뒤덮을 필요는 없다. 곡면이라면 뒤덮겠지만, 3차원 이상부터는 그 안에 있는 하나의 곡면만을 정의할 뿐이다. 하지만, 우리가 원하는 두 측지선 사이의 관계를 정의하려면 두 개의 매개변수만으로 충분하다. [math(s)]는 "어떤 측지선인지"를 나타내며, [math(t)]는 동일 측지선 위의 "어떤 점인지"를 나타낸다. 따라서, 각각의 측지선을 [math(\gamma_{s}(t))]로 나타낼 수 있다. 이 때, 두 매개변수에 대한 접벡터 [math(S^{\mu})]와 [math(T^{\mu})]를 다음과 같이 정의한다.

[math(\displaystyle S^{\mu} = \frac{\partial x^{\mu}}{\partial s}, \quad T^{\mu} = \frac{\partial x^{\mu}}{\partial t})]


각각은, (작은 [math(s, t)] 변화에 대하여) "같은 순간" [math(t)]에 대한 다음 측지선을 향하는 벡터와 각 측지선의 접벡터를 표현한다. 전자를 편차 벡터deviation vector라고 한다. 편차 벡터를 다시 [math(t)]에 대해 미분하면, 다음과 같이 측지선의 상대 속도relative velocity와 상대 가속도relative acceleration를 정의할 수 있다. (이름 자체를 진지하게 받아들이긴 어려우나 직관적인 용어라고 생각하면 좋다.)

[math(\displaystyle V^{\mu} = (\nabla_{T}S)^{\mu} = T^{\sigma}\nabla_{\sigma}S^{\mu})]

[math(\displaystyle A^{\mu} = (\nabla_{T}V)^{\mu} = T^{\sigma}\nabla_{\sigma}V^{\mu})]


또, [math(S^{\mu}, T^{\mu})]는 [math((s, t))] 매개화에 대한 기저이므로 교환자가 0이 되며(Torsion - free를 가정하면 다음과 같이 바꿀 수 있다.), [math(T^{\mu})]는 측지선의 속도벡터이므로 자신에 대한 공변 도함수가 0이 된다.

[math(T^{\nu}\nabla_{\nu}S^{\mu} = S^{\nu}\nabla_{\nu}T^{\mu})]

[math(T^{\alpha}\nabla_{\alpha}T^{\mu} = 0)]


이제, 상대가속도 [math(A^{\mu})]를 다음과 같이 전개할 수 있다.

[math(\displaystyle \begin{aligned} A^{\mu} = \frac{D^2}{d\lambda^2}S^{\mu} &= T^{\alpha}\nabla_{\alpha}(T^{\beta}\nabla_{\beta}S^{\mu}) \\ &= T^{\alpha}\nabla_{\alpha}(S^{\beta}\nabla_{\beta}T^{\mu}) \\ &= T^{\alpha}S^{\beta}\nabla_{\alpha}(\nabla_{\beta}T^{\mu}) + (\nabla_{\beta}T^{\mu})T^{\alpha}\nabla_{\alpha}S^{\beta} \\ &= T^{\alpha}S^{\beta}(R^{\mu}_{\,\,\sigma\alpha\beta}T^{\sigma} + \nabla_{\beta}\nabla_{\alpha}T^{\mu}) + (\nabla_{\beta}T^{\mu})S^{\alpha}\nabla_{\alpha}T^{\beta} \\ &= R^{\mu}_{\,\,\sigma\alpha\beta}T^{\sigma}T^{\alpha}S^{\beta} + S^{\beta}\nabla_{\beta}(T^{\alpha}\nabla_{\alpha}T^{\mu} = 0) - S^{\beta}(\nabla_{\beta}T^{\alpha})(\nabla_{\alpha}T^{\mu}) + (\nabla_{\beta}T^{\mu})S^{\alpha}\nabla_{\alpha}T^{\beta} \\ &= R^{\mu}_{\,\,\sigma\alpha\beta}T^{\sigma}T^{\alpha}S^{\beta} \end{aligned})]


따라서, 휘어진 공간에서는 두 측지선이 평행을 유지하지 않고 서로에 대해 가속하게 되며 그 정도는 리만 텐서에 비례한다. (측지선의 속도와 편차 벡터에 비례하는 건 직관적으로 당연하다.) 이는 우리가 원하는 중력과 가장 가까이 있는 형태의 성질이다. 각각의 측지선을 4차원 시공간 다양체 위에 정의된 각 입자, 또는 빛의 세계선으로 보았을 때 이 세계선의 상대 가속도는 중력의 기조력으로 바뀌어 표현될 수 있다. 이처럼, 중력은 시공간 곡률이 물리적 세계에서 표현되는 하나의 방식이라고 생각할 수 있다.

4.6. 비앙키 항등식

마지막으로, 리만 텐서에 관한 몇가지 항등식을 살펴보자. 한 점 [math(p)]에서 직교 좌표계를 잡으면, 크리스토펠 기호는 모두 사라지지만, 도함수는 사라지지 않는다. 이 때,

[math(\displaystyle \begin{aligned}R_{\alpha\beta\mu\nu} = g_{\alpha\sigma}R^{\sigma}_{\,\,\beta\mu\nu} &= g_{\alpha\sigma}(\partial_{\mu}\Gamma^{\sigma}_{\nu\beta} - \partial_{\nu}\Gamma^{\sigma}_{\mu\beta}) \\ &= \frac{1}{2}g_{\alpha\sigma}g^{\sigma\lambda}(\partial_{\mu}\partial_{\nu}g_{\beta\lambda} + \partial_{\mu}\partial_{\beta}g_{\lambda\nu} - \partial_{\mu}\partial_{\lambda}g_{\nu\beta} - \partial_{\nu}\partial_{\mu}g_{\beta\lambda} - \partial_{\nu}\partial_{\beta}g_{\lambda\mu} + \partial_{\nu}\partial_{\lambda}g_{\mu\beta}) \\ &= \frac{1}{2}(\partial_{\mu}\partial_{\beta}g_{\alpha\nu} - \partial_{\mu}\partial_{\alpha}g_{\nu\beta} - \partial_{\nu}\partial_{\beta}g_{\alpha\mu} + \partial_{\nu}\partial_{\alpha}g_{\mu\beta})\end{aligned})]


이다. (직교 좌표계에서, 메트릭 텐서의 편미분은 0이다.) [math(R_{\alpha\beta\mu\nu})]는 다음 대칭성이 성립한다.

[math(R_{\alpha\beta\mu\nu} = -R_{\beta\alpha\mu\nu})]
[math(R_{\alpha\beta\mu\nu} = R_{\mu\nu\alpha\beta})]
[math(R_{\alpha\beta\mu\nu} + R_{\alpha\mu\nu\beta} + R_{\alpha\nu\beta\mu} = 0)]
[math(R_{\alpha[\beta\mu\nu]} = 0)]


이들은 특정 좌표계에서 유도되었지만 명백하게 텐서방정식이므로, 어떤 좌표계에서도 성립한다.

이들 대칭성을 활용하면 리만텐서의 독립된 성분은 총 [math(\displaystyle \frac{1}{12}n^2(n^2 - 1))]임을 보일 수 있다. 4차원에서는 총 20개이며, 이들은 메트릭 텐서의 이계 미분에 관한 20개의 자유도를 나타낸다. 따라서 어떤 좌표계를 선택하더라도 메트릭 텐서의 이계미분이 모두 사라지도록 만드는 것은 불가능하며, 리만 텐서가 곡률을 나타내는 객관적 지표임을 확인할 수 있다.

다음으로, 리만텐서의 (공변)미분에 관한 항등식을 살펴보자. 다시 국소 직교 좌표계를 잡으면,

[math(\displaystyle \begin{aligned}\nabla_{\sigma}R_{\alpha\beta\mu\nu} &= \partial_{\sigma}R_{\alpha\beta\mu\nu} \\ &= \frac{1}{2}\partial_{\sigma}(\partial_{\mu}\partial_{\beta}g_{\alpha\nu} - \partial_{\mu}\partial_{\alpha}g_{\nu\beta} - \partial_{\nu}\partial_{\beta}g_{\alpha\mu} + \partial_{\nu}\partial_{\alpha}g_{\mu\beta})\end{aligned})]


따라서,

[math(\nabla_{\sigma}R_{\alpha\beta\mu\nu} + \nabla_{\alpha}R_{\beta\sigma\mu\nu} + \nabla_{\beta}R_{\sigma\alpha\mu\nu} = 0)]


이 성립한다. 이 역시 좌표계에 의존하여 유도된 식이지만, 명백히 텐서 방정식이다. 이제 [math(R_{\alpha\beta\mu\nu} = -R_{\beta\alpha\mu\nu})]를 이용하면,

[math(\nabla_{[\sigma}R_{\alpha\beta]\mu\nu} = 0)]


이 성립한다. 이것을 비앙키 항등식Bianchi identity이라 한다.

4.7. 아인슈타인 텐서

일반 상대성 이론은 비앙키 항등식은 그대로 쓰기 보다는, 2번 축약된 형태가 보다 직접적으로 유용하다. 먼저, 리치 텐서Ricci tensor [math(R_{\mu\nu})]를 다음과 같이 정의한다.

[math(\displaystyle R_{\mu\nu} = R^{\sigma}_{\,\,\mu\sigma\nu})]


이 텐서는 두 첨자에 대해 대칭적이다. ([math(R_{\mu\nu} = R_{\nu\mu})]) 이로부터 다시 리치 스칼라Ricci scalar [math(R)]을 다음과 같이 정의한다.

[math(\displaystyle R = R^{\mu}_{\mu} = g^{\mu\nu}R_{\mu\nu})]


이제 비앙키 항등식을 두 번 축약해보면 다음과 같다.

[math(g^{\nu\beta}g^{\mu\sigma}(\nabla_{\sigma}R_{\alpha\beta\mu\nu} + \nabla_{\alpha}R_{\beta\sigma\mu\nu} + \nabla_{\beta}R_{\sigma\alpha\mu\nu}) = \nabla^{\mu}R_{\alpha\mu} - \nabla_{\alpha}R + \nabla^{\nu}R_{\alpha\nu} = 0)]


이는 다음과 같이 정리할 수 있다.

[math(\displaystyle \nabla^{\mu}R_{\alpha\mu} - \frac{1}{2}\nabla_{\alpha}R = 0)]


따라서, 아인슈타인 텐서Einstein tensor [math(G_{\mu\nu})]를 다음과 같이 정의한다.

[math(\displaystyle G_{\mu\nu} = R_{\mu\nu} - \frac{1}{2}Rg_{\mu\nu})]


두 번 축약된 비앙키 항등식에 의해, 이 텐서는 공변 보존된다.

[math(\nabla^{\mu}G_{\mu\nu} = 0)]


리치 텐서처럼 아인슈타인 텐서 역시 대칭적이며, 일반 상대성 이론에서 매우 중요한 텐서가 된다.

5. 참고 자료