1. 개요
스피너, spinor상대성 이론을 받아들였을 때 스칼라, 벡터, 텐서 외에 다른 물리량이 가능해진다고 로런츠 군 문서에서 밝혔다. 스피너가 바로 또다른 물리량이다. 보통 알고 있던 벡터 같은 것과 여러모로 다른 물리량으로, 상대성 이론이 등장하고 나서도 상대성 이론에 리 군 이론 등이 체계적으로 적용되고 이를 상대론적 양자역학에서 요구하게 되고 나서야 등장하게 된 개념이다. 파울리에 의한 기술은 3차원에 한한 것이긴 하지만. 그렇다고 스피너로 표현되는 물리적 대상이 늦게서야 발견된 것은 아닌데, 왜냐하면 모든 페르미온들, 즉 보통 물질들은 스피너로 기술되기 때문이다.(...)
참고로 수학에서는 같은 이름인데 이를 더더욱 일반화한 개념이 있다. 리 군의 덮개 군(covering group)으로 표현을 확장하면서 생기는 내용인데, 지독하게 추상적인 내용이다.
그리고 이 문서에서 스피너는 관례에 따라 스핀이 1/2[1]인 스피너만 다루기로 한다.
2. O(3)의 표현과 스피너
역사적으로는 파울리가 직교군(orthogonal group) [math({\rm O}(3))]를 다루면서 새로운 형태의 물리량을 찾은 것이 스피너 개념의 시작이라고 볼 수 있다. 로런츠 군 문서에서는 [math({\rm O}(3))]의 표현들을 모두 분류하면서 [math(s = 1)](혹은 [math(n = 2)])인 경우를 다뤘는데, 여기서는 [math(s = \frac{1}{2})]인 경우를 다뤄 보도록 하겠다.먼저 이 표현에서 [math(H, E, F)]의 행렬 꼴들을 모두 알아야 한다. 이 경우는 사실 로런츠 군 문서에서 다뤘었다. 결과만 적어 보자.
[math(H = \left( \begin{array}{rr} -1 && 0 \\ 0 && 1 \end{array} \right), \\E = \left( \begin{array}{rr} 0 && 0 \\ 1 && 0 \end{array} \right), \\F = \left( \begin{array}{rr} 0 && 1 \\ 0 && 0 \end{array} \right).)]
여기서 [math(H = 2J_3, E = J_1 + iJ_2, F = J_1 - iJ_2)]로부터 다음을 얻을 수 있다.
[math(J_1 = \frac{1}{2} \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right), \\J_2 = \frac{1}{2} \left( \begin{array}{rr} 0 && i \\ -i && 0 \end{array} \right), \\J_3 = \frac{1}{2} \left( \begin{array}{rr} -1 && 0 \\ 0 && 1 \end{array} \right).)]
이제 [math(A = \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right))]이라 두고 [math(J_n)]를 모두 [math(A J_n A^{-1})]로 바꿔 쓰자. 그래도 사실 상관 없다고 했었다. 그 결과를 쓰면 다음을 얻는다.
[math(J_1 = \frac{1}{2} \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right), \\J_2 = \frac{1}{2} \left( \begin{array}{rr} 0 && -i \\ i && 0 \end{array} \right), \\J_3 = \frac{1}{2} \left( \begin{array}{rr} 1 && 0 \\ 0 && -1 \end{array} \right).)]
보통 여기서 [math(J_i = \frac{1}{2} \sigma^i)]로 표기한다. 이 행렬들 [math(\sigma^i)]를 가리켜 파울리 행렬이라고 부른다. 물론 파울리가 먼저 고안해 낸 행렬이기에 이런 이름이 붙은 것이다.
파울리가 처음 이 행렬을 찾은 것은 양자역학에서 각운동량 연산자들의 고유값을 찾는 문제를 풀 때였다. 그리고 파울리 행렬과 함께 파울리는 전에 알려져 있던 각운동량 연산자의 고유값과 다른 종류의 고유값을 찾은 것이었다. 그 전에는 각운동량 연산자를 해석적으로 풀어 고유값을 찾았었다. 그 답은 사실 양자역학이 생기기 이전부터 잘 알려져 있는 답이기도 했다. 하지만 각운동량 연산자를 위처럼 대수적인(algebraic) 방식으로 다루자 그 이전에 몰랐던 고유값들이 튀어나왔다. 정수(의 [math(\hbar)]배)만 있는 줄 알았던 각운동량 값이 반정수(의 [math(\hbar)]배)로 늘어난 것이다. 그런 값들 중 하나가 [math(J_3)]의 대각 성분에 드러난 것이다. 그런데 이런 반정수 고유값은 예를 들어 수소 원자 문제에서 전자의 궤도 각운동량을 구할 때 나타날 수 없는 값이다. 파울리는 이를 보고 입자의 '자전', 즉 스핀에 해당하는 것이 바로 이 반정수 각운동량 고유값이라고 주장했다. 그리고 이 사실은 그 유명한 슈테른-게를라흐 실험으로 인해 확인이 되었다.
3. (0, 1/2) 표현과 스피너
조금 전에 3차원에서의 스피너를 다뤘다. 하지만 스피너가 갖는 더 강력한 물리적 의미는 파울리도 당장 알지 못 했다. 게다가 반정수 스핀은 슈뢰딩거 방정식에 기본적으로 포함되어 있지 않은 성질이다. 물리적으로 뭔가 설명이 빈약한 것이었다. 나중에 가셔야 디랙 방정식이 등장하고 로런츠 군의 수학적 내용(표현론)이 물리에 도입됨에 따라 스피너의 물리적 의미가 분명해져 갔다. 여기서는 앞서 다뤘던 3차원 유클리드 공간에서의 1/2-스피너를 확장시킨 것이라고 볼 수 있는 로런츠 군의 표현론에 따른 1/2-스피너를 다룰 것이다. 여기서는 먼저 (0, 1/2) 표현에서 다뤄지는 바일 스피너(Weyl spinor)[2]를 다룰 것이다.로런츠 군의 모든 표현은 [math((\frac{m}{2}, \frac{n}{2}))]로 표기가 된다고 다뤘다. 그리고 [math(\frac{m}{2} + \frac{n}{2})]가 정수인 표현은 모두 (스칼라, 벡터, )텐서를 다룬다고 했었다. 한편 [math(\frac{m}{2} + \frac{n}{2})]가 정수가 아닌 반정수인 표현은 (일반적인) 스피너들을 다룬다. 그 중에서도 가장 간단한 [math((0, \frac{1}{2}))] 표현을 다뤄 보자. 다만 이 문서에서는 로런츠 군 문서에서 쓰인 표기들을 그대로 가져다 쓸 것이기 때문에 한 번 해당 문서를 쭈욱 읽어 보고 다음 내용을 읽는 것이 좋을 것이다.
(0, 1/2) 표현에서 로런츠 군의 모양을 알고 싶다면 이 표현에서 로런츠 대수의 행렬 꼴을 알면 된다. 바로 전에 [math({\rm O}(3))]의 [math(H, E, F)]들이 [math(s = 1/2)] 표현에서 어떻게 표현되는가를 썼었다. 이제 이를 이용해 [math((H, 0), (E, 0), (F, 0))], [math((0, H), (0, E), (0, F))]의 행렬 꼴을 구해 보자.
그럴려면 [math(s = \frac{1}{2})]와 [math(s = 0)]인 [math({\rm O}(3))]의 표현에서 [math(H, E, F)]의 행렬 꼴을 구해야 한다. 첫번째 경우야 위에서 잘 구했다. 그런데 두번째 경우는 이야기가 좀 다르다. 이때 [math(H, E, F)]는 모두 [math(1 \times 1)]-행렬이다. 이런 행렬들의 곱은 사실 상 스칼라 곱과 같으므로 교환자는 항상 0이다. 따라서, [math(s = 0)]인 표현에서 [math(H, E, F)] 셋 다 전부 0이어야 한다. 뭔가 이상해 보이지만 그래도 별 상관은 없다.
이제 다음을 만족하는 표현 [math(s = \frac{1}{2})]에서의 벡터 [math(v_0, v_1)]를 생각해 보자.
[math(Hv_0 = -v_H, 0v_1 = v_1, Ev_0 = v_1, Ev_1 = 0, Fv_0 = 0, Fv_1 = v_0.)]
그리고 표현 [math(s = 0)]에서 아무 벡터나 뽑아 (어차피 1차원 공간이므로 뭘 뽑든 스칼라 배에 불과하다) 그걸 [math(w_0)]라 하자. 그러면
[math((X, Y)(w \otimes v) = (Xw) \otimes v + w \otimes (Yv))]
에 의하여 다음을 얻는다.
[math((H, 0)(w_0 \otimes v_0) = (H, 0)(w_0 \otimes v_1) = (E, 0)(w_0 \otimes v_0) = (E, 0)(w_0 \otimes v_1))]
[math( = (F, 0)(w_0 \otimes v_0) = (F, 0)(w_0 \otimes v_1) = 0, )]
[math((0, H)(w_0 \otimes v_0) = -(w_0 \otimes v_0), \;\;(0, H)(w_0 \otimes v_1) = w_0 \otimes v_1, )]
[math((0, E)(w_0 \otimes v_0) = w_0 \otimes v_1, \;\; (0, E)(w_0 \otimes v_1) = 0, )]
[math((0, F)(w_0 \otimes v_0) = 0, \;\; (0, F)(w_0 \otimes v_1) = w_0 \otimes v_0.)]
이는 기저 [math((w_0 \otimes v_0, w_0 \otimes v_1))]에서 이들의 행렬 표현이 다음과 같다는 것을 뜻한다.
[math((H, 0) = (E, 0) = (F, 0) = \left( \begin{array}{rr} 0 && 0 \\ 0 && 0 \end{array} \right), )]
[math((0, H) = \left( \begin{array}{rr} -1 && 0 \\ 0 && 1 \end{array} \right), \;\; (0, E) = \left( \begin{array}{rr} 0 && 0 \\ 1 && 0 \end{array} \right), \;\; (0, F) = \left( \begin{array}{rr} 0 && 1 \\ 0 && 0 \end{array} \right).)]
필요한 것을 구했다. 이제 [math(J_n, K_n)]을 구할 때다. 먼저 [math(A_n, B_n)]들을 구하자. 정의로부터( 로런츠 군 문서 참조) 다음을 구할 수 있다.
[math(A_1 = A_2 = A_3 = \left( \begin{array}{rr} 0 && 0 \\ 0 && 0 \end{array} \right), )]
[math(B_1 = \frac{1}{2} \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right), \;\; B_2 = \frac{1}{2} \left( \begin{array}{rr} 0 && i \\ -i && 0 \end{array} \right), \;\; B_3 = \frac{1}{2} \left( \begin{array}{rr} -1 && 0 \\ 0 && 1 \end{array} \right), )]
편의 상 아까 정의한 [math(A = \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right))]를 이용해 [math(A_n)]를 지금 [math(A A_n A^{-1})]로 바꾸자. 그러면 다음과 같이 쓰겠다는 이야기이다.
[math(A_1 = A_2 = A_3 = \left( \begin{array}{rr} 0 && 0 \\ 0 && 0 \end{array} \right).)]
[math(B_1 = \frac{1}{2} \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right), \;\; B_2 = \frac{1}{2} \left( \begin{array}{rr} 0 && -i \\ i && 0 \end{array} \right), \;\; B_3 = \frac{1}{2} \left( \begin{array}{rr} 1 && 0 \\ 0 && -1 \end{array} \right), )]
이제 [math(A_n = \frac{1}{2} (J_n + iK_n))], [math(B_n = \frac{1}{2} (J_n - iK_n))]으로부터 다음을 얻는다.
[math(J_1 = \frac{1}{2} \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right), \;\; J_2 = \frac{1}{2} \left( \begin{array}{rr} 0 && -i \\ i && 0 \end{array} \right), \;\; J_3 = \frac{1}{2} \left( \begin{array}{rr} 1 && 0 \\ 0 && -1 \end{array} \right), )]
[math(K_1 = \frac{1}{2} \left( \begin{array}{rr} 0 && i \\ i && 0 \end{array} \right), \;\; K_2 = \frac{1}{2} \left( \begin{array}{rr} 0 && 1 \\ -1 && 0 \end{array} \right), \;\; K_3 = \frac{1}{2} \left( \begin{array}{rr} i && 0 \\ 0 && -i \end{array} \right).)]
이것이 [math((0, \frac{1}{2}))]에서 [math(J_n, K_n)]의 행렬 꼴이다. 물론 이 행렬들로 로런츠 군 문서에서 했던 것처럼 [math(J^{\mu \nu})]도 정의할 수 있다. 이것으로 스피너의 로런츠 변환을 다룰 수 있게 된다.
참고로 이 행렬들의 선형결합 [math(X)]는 항상 대각 성분의 합이 0이다. 그리고 대각 성분의 합이 0인 임의의 복소 성분 [math(2 \times 2)]-행렬은 저 여섯 개 행렬의 선형결합으로 표현이 된다. 이런 행렬들의 집합을 [math(sl_R(2, C))]라고 부르는데, 이 잡합은 교환자(리 괄호)에 대해 닫혀 있기에 리 대수이다. 지금까지 한 작업은 로런츠 대수가 이 리 대수와 동형이라는 것을 확인시켜 준다.
한 가지 이상한 현상이 있다. 로런츠 변환이 [math(\exp{(i \vec{\theta} \cdot \vec{J} + i \vec{\beta} \cdot \vec{K})})]로 쓸 수 있다고 했다. 이때 [math(\vec{\theta} = (0, 0, 2\pi))], [math(\vec{\beta} = 0)]이면 [math(\exp{(i \vec{\theta} \cdot \vec{J} + i \vec{\beta} \cdot \vec{K})} = \exp{(i 2\pi J_3)})]는 다음과 같이 계산된다.
[math(\displaystyle \exp{(i 2\pi J_3)} = \sum_{n = 0}^\infty \frac{1}{n!} \left( i 2\pi J_3 \right)^n)]
[math(\displaystyle = 1 + \sum_{n = 1}^\infty \left( \frac{(-1)^n (2\pi)^{2n}}{(2n)!} \left( J_3 \right)^{2n} \right) + \sum_{n = 0}^\infty \left( \frac{(-1)^n (2\pi)^{2n + 1}}{(2n + 1)!} i \left( J_3 \right)^{2n + 1} \right).)]
[math((\frac{1}{2}, \frac{1}{2}))] 표현인 경우
[math(J_3 = \left( \begin{array}{rrrr} 0 && 0 && 0 && 0 \\ 0 && 0 && -i && 0 \\ 0 && i && 0 && 0 \\ 0 && 0 && 0 && 0 \end{array} \right))]
이었고 이때 [math((J_3)^{2n})]은 대각 성분이 0, 1, 1, 0인 대각 행렬이고 [math((J_3)^{2n + 1} = J_3)]이다. 따라서 다음을 얻는다.
[math(\displaystyle \exp{(i 2\pi J_3)} = )]
[math(\displaystyle 1 + \left( \sum_{n = 1}^\infty \frac{(-1)^n (2\pi)^{2n}}{(2n)!} \right) \left( \begin{array}{rrr} 0 && 0 && 0 && 0 \\ 0 && 1 && 0 && 0 \\ 0 && 0 && 1 && 0 \\ 0 && 0 && 0 && 0 \end{array} \right) + \left( \sum_{n = 0}^\infty \frac{(-1)^n (2\pi)^{2n + 1}}{(2n + 1)!} \right) \left( \begin{array}{rrr} 0 && 0 && 0 && 0 \\ 0 && 0 && 1 && 0 \\ 0 && -1 && 0 && 0 \\ 0 && 0 && 0 && 0 \end{array} \right))]
[math(\displaystyle = 1 + (\cos{2\pi} - 1) \left( \begin{array}{rrrr} 0 && 0 && 0 && 0 \\ 0 && 1 && 0 && 0 \\ 0 && 0 && 1 && 0 \\ 0 && 0 && 0 && 0 \end{array} \right) + (\sin{2\pi}) \left( \begin{array}{rrrr} 0 && 0 && 0 && 0 \\ 0 && 0 && 1 && 0 \\ 0 && -1 && 0 && 0 \\ 0 && 0 && 0 && 0 \end{array} \right) = 1.)]
이 결과는 3차원 공간의 벡터를 z축으로 한 바퀴 돌리면 ([math(2\pi)] 라디안만큼 회전시키면) 원래대로 돌아온다는 사실과 잘 맞는다.
그런데 [math((0, \frac{1}{2}))] 표현인 경우, [math((J_3)^{2n} = \frac{1}{2^{2n}} 1)]이다. 이는 다음을 말해 준다.
[math(\displaystyle \exp{(i 2\pi J_3)} = 1 + \left( \sum_{n = 1}^\infty \frac{(-1)^n (2\pi)^{2n}}{(2n)!} \frac{1}{2^{2n}} \right) 1 + \left( \sum_{n = 0}^\infty \frac{(-1)^n (2\pi)^{2n + 1}}{(2n + 1)!} \frac{1}{2^{2n + 1}} \right) \left( 2i J_3 \right))]
[math(\displaystyle = 1 + (\cos{\pi} - 1) 1 + (\sin{\pi}) \left( 2i J_3 \right) = -1.)]
이 결과는 1/2-스피너를 z축으로 한 바퀴 돌리면 제자리로 돌아오지 않고 방향이 반대로 변한다는 것을 말해 준다. 실제로 위 식들을 잘 들여다 보면 1/2-스피너를 [math(\theta)]만큼 회전시켜도 실제로는 [math(\frac{1}{2} \theta)]만큼 밖에 안 돌아간다는 것을 알 수 있다. 다시 말해 1/2-스피너를 제자리로 돌리려면 스피너를 두 바퀴(?) 돌려야 한다는 것이다. 스피너에서는 이런 이상한 일이 벌어진다.
하나 더 설명하자. 그런데 이번엔 스피너 이야기가 아니다. 위와 같이 구한 행렬로 벡터의 로런츠 변환을 표현할 수 있다. 우선 벡터의 로런츠 변환 [math(A)]는 마찬가지로 [math(\exp{(i \omega_{\mu \nu} J_V^{\mu \nu})})]와 같이 쓸 수 있다는 것을 상기하자. 여기서 [math(J_V^{\mu \nu})]는 로런츠 군 문서에서 정의한 그 [math(4 \times 4)]-행렬들 [math(J^{\mu \nu})]인데, 이 문서에서 이미 정의된 [math(J^{\mu \nu})]와 구분하기 위해 첨자를 하나 더 붙여 표기했다.
이제 임의의 4-벡터 [math(V^\mu)]에 대해 다음과 같은 것을 정의하자.
[math(\overline{V} = \left( \begin{array}{rr} V^0 + V^3 && V^1 - iV^2 \\ V^1 + iV^2 && V^0 - V^3 \end{array} \right).)]
여기서 다음이 성립한다는 것을 확인할 수 있다.
[math(\overline{\exp{(i \omega_{\mu \nu} J_V^{\mu \nu})} \cdot V} = \exp{(i \omega_{\mu \nu} J^{\mu \nu})}^\dagger \overline{V} \exp{(i \omega_{\mu \nu} J^{\mu \nu})}.)] [3]
이때 [math(SL(2, C))]의 모든 원소는 [math(\exp{(i \omega_{\mu \nu} J^{\mu \nu})})]의 꼴로 쓸 수 있다고 했다. 이를 고려하면 결국 모든 4-벡터의 로런츠 변환은 다음과 같이 표현할 수 있게 된다.
[math(\overline{V} \to A^\dagger \overline{V} A.)]
이는 [math(v \to Av)]와 같이 변환되던 바일 스피너와는 다르다. 일단 차원 수부터 다르니(4차원 vs 2차원).
위의 결과는 또 한 가지 흥미로운 것들을 만들어낸다. [math(\overline{V})]를 다음과 같이 쓸 수 있다.
[math(\overline{V} = \left( \begin{array}{rr} V^0 + V^3 && V^1 - iV^2 \\ V^1 + iV^2 && V^0 - V^3 \end{array} \right) = V^0 \left( \begin{array}{rr} 1 && 0 \\ 0 && 1 \end{array} \right) + V^1 \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right) + V^2 \left( \begin{array}{rr} 0 && -i \\ i && 0 \end{array} \right) + V^3 \left( \begin{array}{rr} 1 && 0 \\ 0 && -1 \end{array} \right))]
[math(=V^0 1 + V^1 \sigma^1 + V^2 \sigma^2 + V^3 \sigma^3.)]
이렇게 단위 행렬과 파울리 행렬로 이 식을 나타낼 수 있다. 이제 [math(\sigma^\mu = (1, \sigma^1, \sigma^2, \sigma^3))]를 생각해 보면 위 식으로부터 다음을 얻을 수 있다.
[math(A^\dagger \sigma^\mu A = A^\dagger \overline{e^\mu} A = \overline{(\Lambda(A)^\mu_\nu e^\nu)} = \Lambda(A)^\mu_\nu \sigma^\nu.)]
여기서 [math(\Lambda(A))]는 임의의 [math(A \in SL(2, C))]를 4-벡터의 로런츠 변환으로 바꾼 것이다. 즉, [math(A)]를 [math(\exp{(i \omega_{\mu \nu} J^{\mu \nu})})]와 같이 썼을 때 [math(\Lambda(A) = \exp{(i \omega_{\mu \nu} J_V^{\mu \nu})})]와 같이 정의하겠다는 뜻이다. 이렇게 스피너를 다루면서 나타난 행렬들로 만들어진, 벡터처럼 변환이 되는 행렬들은 스피너의 동역학을 다룰 때 매우 중요한 역할을 한다.
4. 디랙 스피너
위에서 (0, 1/2) 표현 혹은 바일 스피너를 다뤘다. 하지만 이것만 가지고 물리를 하기엔 부족하다. 왜 그런지 알아 보자.물리에서 어떤 동역학(dynamics)을 가지는 물리량은 항상 액션과 라그랑지언에 의하여 기술된다. 액션과 라그랑지언은 스칼라, 즉 로런츠 변환에 대해 변하지 않는 값이므로 라그랑지언에 어떤 물리량이 포함되려면 그 물리량으로 구성된 스칼라 꼴로 들어가야 한다. 따라서 주어진 물리량으로 어떤 스칼라를 만들 수 있는가가 중요한 문제가 된다.
벡터와 텐서의 경우는 축약(contraction)으로 그게 가능하다는 것을 상대성 이론에서 확인할 수 있었다. 비슷한 것도 바일 스피너로 된 물리량으로 할 수 있지 않을까 하기도 한다. 스피너 [math((a, b), (c, d))]에 대해 다음과 같은 것을 생각해 보자.
[math(\left( \begin{array}{r} a \\ b \end{array} \right)^\dagger \cdot M \left( \begin{array}{r} c \\ d \end{array} \right) = \left( \begin{array}{rr} a^* && b^* \end{array} \right) M \left( \begin{array}{r} c \\ d \end{array} \right).)]
여기서 [math(M)]는 어떤 행렬이다. 이것은 일반적인 내적에 해당한다.[4] 이 값이 스칼라이기를 기대한다. 과연 그런 지 확인해 보자. 스피너는 다음과 같이 로런츠 변환을 한다.
[math(\left( \begin{array}{r} a \\ b \end{array} \right) \to A \left( \begin{array}{r} a \\ b \end{array} \right).)]
여기서 [math(A)]는 [math(SL(2, C))]의 어떤 원소이다. [math(SL(2, C))]의 모든 원소는 스피너의 어떤 로런츠 변환에 해당한다. 따라서 이렇게 쓸 수도 있으며, 한편 저 식이 진정한 로런츠 변환이라면 [math(SL(2, C))]의 모든 원소에 대하여 저 식이 불변이어야 할 것이다. 일단 대입을 해 보자.
[math(\left( \begin{array}{r} a \\ b \end{array} \right)^\dagger \cdot M \left( \begin{array}{r} c \\ d \end{array} \right) \to \left( A \left( \begin{array}{r} a \\ b \end{array} \right) \right)^\dagger \cdot M \left( A \left( \begin{array}{r} c \\ d \end{array} \right) \right) = \left( \begin{array}{r} a \\ b \end{array} \right)^\dagger \cdot A^\dagger M A \left( \begin{array}{r} c \\ d \end{array} \right).)]
임의의 스피너에 대한 식이므로 모든 [math(A)]에 대해 [math(A^\dagger M A = M)]이어야 위 식이 스칼라일 것이다. 그런데 사실 모든 [math(A)]에 대해 저걸 만족하는 0이 아닌 [math(M)]은 사실 존재하지 않는다. 그 말은 즉슨 이런 방식으로 바일 스피너로 구성된 스칼라를 만들 수 없다는 뜻이다.
도함수 같은 걸 생각하면 그렇다고 아주 못 만드는 건 아니지만 그건 나중에 다루기로 하자. 지금은 도함수가 없는 채로 스칼라를 만들어 보도록 하겠다. 여기서 만약 [math((a, b))]가
[math(\left( \begin{array}{r} a \\ b \end{array} \right) \to (A^{-1})^\dagger \left( \begin{array}{r} a \\ b \end{array} \right))]
와 같이 변환된다면 이렇게 될 것이다.
[math(\left( \begin{array}{r} a \\ b \end{array} \right)^\dagger \cdot M \left( \begin{array}{r} c \\ d \end{array} \right) \to \left( (A^{-1})^\dagger \left( \begin{array}{r} a \\ b \end{array} \right) \right)^\dagger \cdot M \left( A \left( \begin{array}{r} c \\ d \end{array} \right) \right) = \left( \begin{array}{r} a \\ b \end{array} \right)^\dagger \cdot A^{-1} M A \left( \begin{array}{r} c \\ d \end{array} \right).)]
[math(M = 1)]만 되어도 위 식은 변환하기 전과 일치하게 된다. 즉, 스칼라인 것이다. 하지만 그럴려면 방금 전의 [math((a, b))]와 같이 새로운 방식으로 변환이 이루어지는 물리량이 필요하다는 뜻이 된다. 즉, (0, 1/2) 표현과는 다른 표현으로 되어 있는 물리량이 필요하다는 뜻이다.
이 표현의 차원은 [math((a, b))] 이 성분 수만 봐도 알 수 있듯이 2차원이다. (0, 1/2)이 아닌 2차원 기약 표현으로는 (1/2, 0) 뿐이다. 따라서 지금 요구하는 새로운 물리량은 (1/2, 0) 표현으로 되어 있는 스피너이어야 할 것이다. 과연 그게 맞는지 확인해 볼 필요가 있다.
바일 스피너가 [math(\left( \begin{array}{r} c \\ d \end{array} \right) \to A \left( \begin{array}{r} c \\ d \end{array} \right))]와 같이 변환된다고 했을 때 이 새로운 물리량은 [math(\left( \begin{array}{r} a \\ b \end{array} \right) \to (A^{-1})^\dagger \left( \begin{array}{r} a \\ b \end{array} \right))]와 같이 변환된다고 했다. 여기서 [math(A)]는 다음과 같이 써진다는 것을 안다.
[math(A = \exp{(i \omega_{\mu \nu} J^{\mu \nu})}.)]
이때 다음을 알 수 있다.
[math((A^{-1})^\dagger = (( \exp{(i \omega_{\mu \nu} J^{\mu \nu})} )^{-1})^\dagger = (\exp{(-i \omega_{\mu \nu} J^{\mu \nu})})^\dagger = \exp{(-i \omega_{\mu \nu} J^{\mu \nu})^\dagger} = \exp{(i \omega_{\mu \nu} (J^{\mu \nu})^\dagger)}.)]
즉, 리 군들끼리의 동형사상 [math(A \to (A^{-1})^\dagger)]에 해당하는 리 대수의 동형사상은 [math(A \to A^\dagger)]이다. 이 동형사상을 가하면 [math({\rm O}(3))]를 다룰 때 썼었던 [math(A_n, B_n)]가 서로 뒤바뀌는 결과를 만드는데, 이것은 [math((X, 0))]과 [math((0, X))] ([math(X = H, E, F)])를 뒤바꾸는 것과 똑같다. 그리고 이는 [math(w_0 \otimes v_i)]를 [math(v_i \otimes w_0)]로 바꾸는 것과 똑같은 것이다. 따라서 새로운 표현은 정확하게 (1/2, 0) 표현과 같다는 것을 알 수 있다. 이 표현으로 된 물리량을 가리켜 왼손잡이 바일 스피너(left-handed Weyl spinor)라고 부른다.
두 물리량이 같이 있어야 스칼라를 만들 수 있다고 했었다. 따라서 이들 스피너들을 합체시킨 새로운 스피너를 생각해 보자. 이건 단순히 [math((\frac{1}{2}, 0) \oplus (0, \frac{1}{2}))] 표현에 해당하는 물리량인데, 별 건 아니고 (1/2, 0) 스피너에 해당하는 성분을 [math((a, b))]라 표기하고 (0, 1/2) 스피너에 해당하는 성분을 [math((c, d))]라고 하면 그냥 [math((a, b, c, d))]로 표기하겠다는 뜻으로 봐도 무방하다. 이렇게 만들어진 새로운 스피너를 디랙 스피너(Dirac spinor)라고 부른다. 디랙 스피너는 다음과 같은 로런츠 변환을 한다.
[math(\left( \begin{array}{r} a \\ b \\ c \\ d \end{array} \right) \to \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \left( \begin{array}{r} a \\ b \\ c \\ d \end{array} \right).)]
여기서 우변의 앞에 추가된 행렬은 각 성분이 [math(2 \times 2)]-행렬들이다. 이렇게 표현이 되는 물리량으로 이제 스칼라를 만들 수 있다. 다음 행렬을 생각해 보자.
[math(\gamma^0 = \left( \begin{array}{rrrr} 0 && 0 && 1 && 0 \\ 0 && 0 && 0 && 1 \\ 1 && 0 && 0 && 0 \\ 0 && 1 && 0 && 0 \end{array} \right) = \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right).)]
여기서 맨 마지막 변의 각 성분들은 [math(2 \times 2)] 행렬이다. 그리고 디랙 스피너 [math(\psi)]에 대해 다음을 정의하자.
[math(\overline{\psi} = \psi^\dagger \gamma^0.)]
그러면 두 디랙 스피너 [math(\psi_1, \psi_2)]에 대해 다음과 같은 로런츠 변환이 일어난다.
[math(\overline{\psi_2} \psi_1 = \psi_2^\dagger \gamma_0 \psi_1 \to \left( \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \psi_2 \right)^\dagger \gamma^0 \left( \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \psi_1 \right))]
[math( = \psi_2^\dagger \left( \begin{array}{rr} A^{-1} && 0 \\ 0 && A^\dagger \end{array} \right) \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right) \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \psi_1)]
[math( = \psi_2^\dagger \left( \begin{array}{rr} 0 && A^{-1} \\ A^\dagger && 0 \end{array} \right) \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \psi_1)]
[math( = \psi_2^\dagger \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right) \psi_1 = \psi_2^\dagger \gamma^0 \psi_1 = \overline{\psi_2} \psi_1.)]
로런츠 변환을 해도 값이 변하지 않는다. 따라서 이 값은 스칼라이다. 이렇게 해서 디랙 스피너로 스칼라를 만들어 냈다.
이제 디랙 스피너의 도함수가 포함된 스칼라를 생각해 보자. 물론 [math(\overline{(\partial_\mu \psi)} \partial^\mu \psi)] 같은 걸 생각할 수 있다. 근데 이거보다 더 단순한 건 없을까?[5] 그 전에 디랙 스피너로 4-벡터를 만들 수는 없는 걸까?
이게 오른손잡이 바일 스피너에서는 됐다는 것을 봤었다. 임의의 (오른손잡이) 바일 스피너 [math(v, w)]에 대하여 [math(w^\dagger \sigma^\mu v)]가 바로 그것인데, 이 식은 다음과 같은 로런츠 변환을 갖는다.
[math(w^\dagger \sigma^\mu v \to (Aw)^\dagger \sigma^\mu (Av) = w^\dagger (A^\dagger \sigma^\mu A) v = w^\dagger (\Lambda(A)^\mu_\nu \sigma^\nu) v = \Lambda(A)^\mu_\nu (w^\dagger \sigma^\nu v).)]
바일 스피너 만으로 스칼라를 못 만들던 때와는 다르다. 이렇게 어렵지 않게 스피너로 구성된 벡터를 얻었다. 이걸 디랙 스피너에 적용하려면 오른손잡이 바일 스피너 뿐만 아니라 왼손잡이 바일 스피너에 대해서도 똑같은 것을 찾아야 한다. 그런데 [math(v, w)]가 왼손잡이 바일 스피너일 경우 다음과 같은 로런츠 변환을 갖는다.
[math(w^\dagger \sigma^\mu v \to ((A^{-1})^\dagger w)^\dagger \sigma^\mu ((A^{-1})^\dagger v) = w^\dagger (A^{-1} \sigma^\mu (A^{-1})^\dagger) v = \Lambda((A^{-1})^\dagger)^\mu_\nu (w^\dagger \sigma^\nu v).)]
따라서 [math(\sigma^\mu)]가 다른 것으로 교체되어야 한다. [math(A^{-1} \sigma^\mu (A^{-1})^\dagger = (A^\dagger \sigma^\mu A)^{-1})]인 것을 보면 뭔가 역행렬을 취해 주는 것으로 해결이 가능할 것 같다. 사실 다음이 성립한다. 임의의 4-벡터 [math(V)]에 대해 [math(\overline{V} \to A^\dagger \overline{V} A)]와 같이 변환된다고 했었는데, 그러면 만약 [math(\overline{V})]가 역행렬을 갖는다면, 다음과 같은 변환을 가질 것이다.
[math((\overline{V})^{-1} \to (A^\dagger \overline{V} A)^{-1} = A^{-1} \overline{V} (A^\dagger)^{-1}.)]
[math(\overline{A})]가 역행렬을 안 갖는 경우도 생각할 수 있다. 그럴 땐 [math(\overline{V})]의 역행렬 대신 adjoint를 찾아주면 된다. 역행렬이 있는 행렬의 경우 역행렬에 행렬식을 곱한 것과 같은 것으로, 모든 행렬에 대해 정의가 된다. 특히 [math(\overline{V})]의 경우, 그 adjoint를 [math(adj \; (\overline{V}))]와 같이 표기할 경우, 다음이 성립한다.
[math(adj \; (\overline{V}) = \left( \begin{array}{rr} V^0 - V^3 && -V^1 + iV^2 \\ -V^1 - iV^2 && V^0 + V^3 \end{array} \right).)]
그리고 조금 전에 말한 특성(역행렬에 행렬식을 곱한 것) 때문에 다음이 성립한다.
[math(adj \; (\overline{V}) \to adj \; (A^\dagger \overline{V} A) = A^{-1} (adj \; \overline{V}) (A^\dagger)^{-1}.)]
그런데 [math(adj \; (\overline{V}))]는 [math(\overline{V})]에서 [math(\sigma^1, \sigma^2, \sigma^3)] 성분들의 부호를 모두 바꾼 것과 똑같다. 이로부터 [math(\overline{\sigma}^\mu = (1, -\sigma^1, -\sigma^2, -\sigma^3))]과 같이 정의하면 오른손잡이 바일 스피너에서 썼던 것과 같은 방식으로 다음을 얻는다.
[math(A^{-1} \overline{\sigma}^\mu (A^{-1})^\dagger = \Lambda(A)^\mu_\nu \overline{\sigma}^\nu.)]
따라서 왼손잡이 바일 스피너 [math(v, w)]에 대해 다음과 같은 로런츠 변환이 성립한다.
[math(w^\dagger \overline{\sigma}^\mu v \to w^\dagger (A^{-1} \overline{\sigma}^\mu (A^{-1})^\dagger) v = w^\dagger (\Lambda(A)^\mu_\nu \overline{\sigma}^\mu) v = \Lambda(A)^\mu_\nu ( w^\dagger \overline{\sigma}^\mu v ).)]
따라서 왼손잡이 바일 스피너로 벡터를 만들 수 있었다. 이 결과들을 그대로 디랙 스피너에 작용시킬 수 있다. 다음을 정의하자.
[math((\gamma')^\mu = \left( \begin{array}{rr} \overline{\sigma}^\mu && 0 \\ 0 && \sigma^\mu \end{array} \right).)]
여기서 각 성분은 [math(2 \times 2)]-행렬이다. 이제 두 디랙 스피너 [math(\psi_1, \psi_2)]에 대해 다음을 알 수 있다.
[math(\psi_2^\dagger (\gamma')^\mu \psi_1 \to \left( \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \psi_2 \right)^\dagger (\gamma')^\mu \left( \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \psi_1 \right))]
[math( = \psi_2^\dagger \left( \left( \begin{array}{rr} A^{-1} && 0 \\ 0 && A^\dagger \end{array} \right) \left( \begin{array}{rr} \overline{\sigma}^\mu && 0 \\ 0 && \sigma^\mu \end{array} \right) \left( \begin{array}{rr} (A^{-1})^\dagger && 0 \\ 0 && A \end{array} \right) \right) \psi_1)]
[math( = \psi_2^\dagger \left( \begin{array}{rr} A^{-1} \overline{\sigma}^\mu (A^{-1})^\dagger && 0 \\ 0 && A^\dagger \sigma^\mu A \end{array} \right) \psi_1)]
[math( = \psi_2^\dagger \left( \Lambda(A)^\mu_\nu \left( \begin{array}{rr} \overline{\sigma}^\nu && 0 \\ 0 && \sigma^\nu \end{array} \right) \right) \psi_1 = \Lambda(A)^\mu_\nu \left( \psi_2^\dagger (\gamma')^\nu \psi_1 \right).)]
따라서 [math(\psi_2^\dagger (\gamma')^\mu \psi_1)]는 벡터이다. 여기서 [math(\psi^\dagger)] 대신에 [math(\overline{\psi} = \psi^\dagger \gamma^0)]로 쓰는 것이 여러 모로 편리하다. 이제
[math(\gamma^\mu = \left( \begin{array}{rr} 0 && 1 \\ 1 && 0 \end{array} \right)^{-1} (\gamma')^\mu)]
라고 정의하자. 여기서 우변의 행렬은 그 성분들이 모두 [math(2 \times 2)]-행렬이다. 이렇게 해서 정의된 [math(\gamma^0)]는 전에 정의했던 [math(\gamma^0)]와 정확히 일치한다. 이 행렬들을 디랙 행렬(Dirac matrices)라고 부른다. 이 표기로부터 [math(\overline{\psi} \gamma^\mu \psi = \psi^\dagger (\gamma')^\mu \psi)]가 4-벡터임을 알 수 있다.
이걸로부터 스피너의 도함수가 들어간 스칼라를 잘 정의할 수 있다. [math(\overline{\psi} \gamma^\mu (\partial_\mu \psi))]가 바로 그것이다. 그런데 여기서 이 식을 [math(\psi^\dagger (\gamma')^\mu (\partial_\mu \psi))]와 같이 쓰고, [math(\psi)]의 왼손잡이 바일 스피너 성분을 [math(\psi_L)], 오른손잡이 성분을 [math(\psi_R)]라 정의하면, 이 식은 정확하게 [math(\psi_L^\dagger \overline{\sigma}^\mu (\partial_\mu \psi_L))]와 [math(\psi_R^\dagger \sigma^\mu (\partial_\mu \psi_R))] 두 성분으로 쪼개진다. 스칼라 [math(\overline{\psi} \psi)]에서는 볼 수 없는 상황이다.
만약 디랙 스피너로 표현이 되는 물리량으로 구성된 라그랑지언이 [math(\overline{\psi} \gamma^\mu (\partial_\mu \psi))]와 [math(\overline{\psi} \psi)] 둘 다를 포함하고 있다면 이 라그랑지언은 [math(\psi_L)]와 [math(\psi_R)] 각각 독립적으로 구성된 항들로 쓸 수 없을 것이다. 하지만 만약 [math(\overline{\psi} \psi)] 항이 라그랑지언에 없다면, 위에서 봤듯이 [math(\overline{\psi} \gamma^\mu (\partial_\mu \psi))]는 [math(\psi_L)]와 [math(\psi_R)] 각각에 대해 독립적인 항들로 쪼개진다. 이때 왼손잡이 스피너와 오른손잡이 스피너는 따로 놀게 된다. 이 상황은 디랙 스피너로 표현되는 입자의 질량이 0이냐 아니냐를 말할 때 중요한 역할을 한다. 디랙 방정식 혹은 스핀 1/2 입자 문서 참조.
하나만 더 짚고 가자. 이렇게 정의된 새로운 행렬들 [math(\gamma^\mu)]는 다음과 같은 성질을 갖는다.
[math(\{\gamma^\mu, \gamma^\nu\} = 2\eta^{\mu \nu}.)]
여기서 [math(\{A, B\} = AB + BA)]로 정의되며, 반교환자(anti-commutator)라고 부른다. 이 성질을 이용해 많은 계산을 수행할 수 있다. 또한 이 성질을 일반화할 수 있는데, 이때 얻어지는 공간을 가리켜 클리포드 대수(Clifford algebra)라고 부른다. 사실 [math({\rm O}(3))] 혹은 리 대수 [math(s{\rm O}(3))]의 표현을 다루는 방법 중에는 이 클리포드 대수를 이용한 방법도 있다.[6] 이러한 추상화를 통해 [math(\{\gamma^\mu, \gamma^\nu\} = 2\eta^{\mu \nu})]와 몇 가지 성질(Hermitian에 관한 성질 등)만 갖고도 위에서 설명한 것들은 물론 필요한 모든 성질을 이끌어 낼 수 있다.
[1]
이렇게
정수가 아닌 유리수 중
기약분수로 표현했을 때 분모가 2인 수를 '반정수(half Integer,
半
整
數)'라고 부른다.
[2]
지금 다루는 것은 오른손잡이(right-handed) 바일 스피너이다. 물론 '왼손잡이' 바일 스피너도 있다. 조금 있다가 다룰 것이다.
[3]
리 군 이론에 따라 일반적인 경우에 대해 다 확인할 필요는 없고 [math(\omega_{\mu \nu})]가 매우 작은 경우, 즉 무한소 변환일 때에만 체크하여도 좋다. 그런데 이렇게 할 경우 리 대수의 언어로 문제가 바뀌게 된다. 리 군은 일반적으로 그 곱과 원소들을 직접 다루기가 까다롭지만 리 대수의 리 괄호는 다루기가 어렵지 않다. 그런데 많은 경우 리 군의 문제는 리 대수 문제로 환원이 가능하기에 리 군을 연구한다고 하면 리 대수로 이를 옮겨서 연구하는 경우가 많다. 리 대수로 문제롤 쉽게 만들 수 있다는 사실은 리 군 이론이 지금과 같이 발전할 수 있게 된 가장 큰 이유이겠다.
[4]
사실 내적은 아니다. 같은 벡터끼리 곱했을 때 0 혹은 음수가 나올 수 있기 때문이다.
[5]
양자장론에 가면 이 문제가 심각해진다. 한 입자는 있기만 한다면 특정 시간 대에 어디든 있을 확률이 1이므로 [math(1 = \int d^3 x \langle 0| \psi \psi^\dagger |0 \rangle)]로 주어지는데, 이로부터 (
자연 단위계에서) [math(\psi)]의 단위는 [math([mass]^{3/2})]임을 알 수 있다. 단위가 이렇다는 것으로부터 라그랑지안에 스피너가 들어갈 수 있는 꼴이 제한되는데, 이걸로 만들어지는 스칼라의 단위가 [math([mass]^4)]보다 높은 차수를 가지면 안되는데, 어차피 이 스칼라에는 [math(\psi)]와 [math(\psi^\dagger)]가 쌍으로 하나 씩은 들어가기 때문에 덧붙일 수 있는 것은 단위의 차원([math([mass]^n)]의 [math(n)])은 1로 한정된다. 이 때문에 미분 연산자(단위가 [math([length]^{-1} = [mass]^1)])는 딱 하나만 들어갈 수 있다. (그렇다고 단위가 [math([mass]^{-r} \;\; (r = 1, 2, \cdots)]인 상수를 곱하는 방식은 안 되는데, 이런 상수는 재규격화 과정에서 문제를 일으킨다.) 그런데 [math((\partial_\mu \psi^\dagger) \gamma^0 (\partial^\mu \psi))] 혹은 [math(\psi^\dagger \gamma^0 (\partial^2 \psi))]는 미분 연산자가 이미 두 개나 들어가 있다. 따라서 허용이 안 된다. 스피너의 동역학을 다룰려면 다른 방법으로 미분 연산자를 넣어서 스칼라로 만드는 방법이 필요한데, 스피너로 4-벡터를 만드는 것이 사실 상 유일한 방법이다.
[6]
사족이지만 일반적으로 [math(sl(l+1))]을 [math(A_l)] 타입, [math(so(2l+1))]을 [math(B_l)] 타입이라고 부른다. [math(A_l)] 타입도 그렇지만 [math(B_l)] 타입도 각 [math(l)]에 대해 모든 표현이 다 분류가 되어 있다. 그런데 [math(B_l)] 타입을 표현하는 방법 (가장 기본적인(fundamental) 방식들) 중에는 [math(A_l)] 타입에 없는 방식이 하나 존재한다. 이 방식에 클리포드 대수가 쓰인다. 한편 [math(A_1)] ([math(sl(2))])과 [math(B_1)] ([math(s{\rm O}(3))])은 밝혔다시피 똑같은 타입이다. 따라서 [math(sl(2))]을 표현하는 방식으로 클리포드 대수를 쓰는 방식 또한 존재한다고 볼 수 있다. 그 결과는 [math(s = 1/2)] 표현과 동일하며, 일반적인 [math(B_l)]에서 클리포드 대수를 이용한 표현이 스핀 표현(spin representation)이라고 불리는 이유이다. 자세한 것은 N. Jacobson의 Lie Algebras 중 7장을 참조할 것. 다만 일반적인 내용만 포함하고 있어 [math(s{\rm O}(3))]에서 무슨 일이 일어나는가는 직접 계산해 봐야 안다.