이번 글은
2022.09.16 - [분류 전체보기] - 상관계수 행렬은 positive definite!
상관계수 행렬은 positive definite!
이번 글은 2022.07.04 - [수학의 재미/행렬 이론] - 행렬이 양수다? positive semidefinite 행렬이 양수다? positive semidefinite 금융공학을 공부하다 보면 자산간의 상관계수와 그 상관계수로 이루어진 행렬의.
sine-qua-none.tistory.com
에서 이어집니다. 저번 글에서
- positive semidefinite라는 정의
- 상관계수 행렬이 positive semidefinite 라는 것
을 복습했습니다.
촐레스키 분해
Positive Semidefinite에는 아주 강력한 성질이 있는데요, 바로 촐레스키 분해(Cholesky decomposition)가 가능하다는 것입니다.
촐레스키 분해(Cholesky Decomposition)
positive semidefinite 행렬 A가 실수 원소로 이루어져 있다고 할 때,
A=LLt
로 분해된다. 여기서, L은
○ 하삼각행렬(lower triangular matrix)이다
○ L의 대각 원소는 0 이상이다.
만일, 조건이 더 엄격해서 positive definite이면 행렬 분해 시 (1)이 유일함
증명은 우선 생략토록 하겠습니다. 여러 행렬 분해 기법을 토대로 나온 결과물이라, 지면을 많이 차지할 것 같습니다. 나중에 기회 되면 증명해보도록 하겠습니다.
상관계수 행렬은 촐레스키 분해 가능!
그런데, 상관계수 행렬은 positive semidefinite입니다. 따라서 위의 촐레스키 분해가 가능하죠. 예를 들어볼까요?
2차원 상관계수 행렬
변수 X1,X2의 상관계수를 ρ라 합시다. 자기 자신과의 상관계수는 당연히 1이므로 변수 X1,X2에 대한 상관계수 행렬은
R=(1ρρ1)
입니다. 얘를 수식 (1)처럼 분해해 보도록 하죠. 수식(1)의 하삼각행렬을
L=(a0bc)
이라 하면, 촐레스키 분해에 의해
R=LLt
즉,
(1ρρ1)=(a0bc)(a0bc)=(a2ababb2+c2)
입니다. 따라서
{a2=1ab=ρb2+c2=1
이므로
a=1 , b=ρ , c=√1−ρ2
입니다.
즉,
L=(10ρ√1−ρ2)
입니다.
그런데 이 행렬이 원소들을 보시면,
[수학의 재미/확률분포] - 상관관계가 있는 두개의 표준정규분포 난수 구하기에서 구했던 상관관계있는 표준 정규분포 난수에서 다뤘던 식에서 나왔던 것들입니다.
3차원 상관계수 행렬
통계 변수 X1,X2,X3 에 대해
Corr(X1,X2)=ρ12 , Corr(X2,X3)=ρ23 , Corr(X1,X3)=ρ13
이라 합시다.
그러면 상관계수 행렬 R은
R=(1ρ12ρ13ρ121ρ23ρ13ρ231)
이 행렬이 아래와 같이 촐레스키분해 된다고 해볼까요?
(1ρ12ρ13ρ121ρ23ρ13ρ231)=(a00bc0def)(abd0ce00f)
좌변과 우변을 원소끼리 비교하면
{a2=1ab=ρ12ad=ρ13b2+c2=1bd+ce=ρ23d2+e2+f2=1
이죠. 이것을 풀면
a=1b=ρ12d=ρ13c=√1−ρ212e=1c(ρ23−ρ12ρ13)f=√1−ρ213−e2
이 값들이 제대로 나오는 값일까요? a,b,c,d,e는 사칙연산으로 구하면 나오는 값이지요. c가 보장되는 이유는 c의 root 안의 숫자 1−ρ212이 0보다 크거나 같기 때문입니다. 그러면 f는 어떨까요? f의 root안 숫자
1−ρ213−e2
이 0보다 작지 않아야 합니다. 간단히 살펴보도록 하죠.
1−ρ213−e2=1−ρ213−1c2(ρ23−ρ12ρ13)2=1−ρ213−(ρ23−ρ12ρ13)21−ρ212=11−ρ212(1−ρ212−ρ213−ρ223+2ρ12ρ23ρ13)=11−ρ212detR≥0
입니다. 마지막 부등식은 detR≥0 인 사실이 쓰였는데요. 이는 아래 더보기를 클릭해보세요.
FACT. positive semidefinite 행렬 A에 대해 detA≥0 이다.
Why?) 행렬 A는 대칭행렬이므로
2022.06.29 - [수학의 재미/행렬 이론] - 대칭행렬을 분해합시다 - 고유값 분해(eigen decomposition) #2 에 의해
A=QDQt
가 성립합니다. 여기서 Q는 직교행렬로서, 가역행렬이고 detQ=±1을 만족합니다.
또, D는 eigenvalue \{\lambda_i} 들을 대각원소로 하는 대각행렬이고 행렬식은
detD=\Prodλi
이죠.
그런데, 또
2022.07.04 - [수학의 재미/행렬 이론] - 행렬이 양수다? positive semidefinite 를 읽어보면, positive semidefinite의 모든 eigenvalue은 음수가 아닙니다. 따라서 $$\det \mathbf{D} \geq 0$이죠.
결론적으로,
detA=detQdetDdetQT=(±1)2detD≥0
입니다.
다음 글에서는 촐레스키 분해는 언제 긴요하게 쓰이는지 한번 보도록 하겠습니다.
'수학의 재미 > 행렬 이론' 카테고리의 다른 글
상관관계를 가지는 표준정규분포 변수 여러개 만들기(python) (0) | 2022.09.20 |
---|---|
n차원 상관계수행렬을 촐레스키 분해하면? (0) | 2022.09.20 |
3중 대각행렬의 풀이 (0) | 2022.07.29 |
상관계수와 상관계수 행렬 #2 (0) | 2022.07.06 |
상관계수와 상관계수 행렬 #1 (0) | 2022.07.05 |
댓글