지난 글에서는 조건부 확률분포의 정의에 대해 써보았습니다.
이번 글에서는 여러 조건부 통계량에 관한 식들을 다뤄보겠습니다.
일단 조건부 통계량에 관한 식을 다루기 전에 공분산과 상관계수부터 정의해보겠습니다.
두 확률변수 $ X,Y $ 가 유한한 분산값 $ \sigma_X ^2 , \sigma_Y ^2 $ 을 가진다고 해보겠습니다.
이들 분산값이 유한하다면, 더 낮은 차수의 적률에 대응하는 평균값도 유한합니다.
이 평균값들을 $ \mu_X , \mu_Y $ 라고 해보겠습니다.
위 조건들이 모두 충족된다면, 평균 $ E[(X-\mu_X)(Y-\mu_Y)] $ 가 유한한 값으로 잘 정의됩니다.
(이 평균이 유한하다는 것은 코시-슈바르츠 부등식으로 증명할 수 있습니다.)
이 평균값을 $ X,Y $ 의 공분산(covariance)이라고 하고, $ Cov(X,Y) $ 로 표기합니다.
한편, 두 확률변수의 분산값 $ \sigma_X ^2 , \sigma_Y ^2 $ 의 양의 제곱근을 $ \sigma_X , \sigma_Y $ 라고 하겠습니다.
이 때 공분산을 $ \sigma_X $ 와 $ \sigma_Y $ 의 곱으로 나눈 값( $ Cov(X,Y)/(\sigma_X \sigma_Y) $ )을
$ X,Y $ 의 상관계수(correlation coefficient)라고 하고, $ \rho_{XY} $ 로 표기합니다.
상관계수는 코시-슈바르츠 부등식을 통해 $ -1 \leq \rho \leq 1 $ 을 항상 만족하는 것을 볼 수 있습니다.
또한 공분산을 $ \sigma_X \sigma_Y $ 로 나누어 구한 값이기 때문에 unit-free 하다는 장점도 있습니다.
상관계수는 두 확률변수가 얼마나 강한 선형 관계를 갖는지를 보여줍니다.
이하에서 소개할 식들에서는 확률변수 $ X,Y $ 가 유한한 분산을 갖는 경우를 상정하려고 합니다.
이제 조건부 통계량에 관한 식들을 하나씩 소개해보겠습니다.
1. $ E[E[X|Y]]=E[X] $ (law of total expectation)
위 식은 반복 기댓값의 법칙(law of iterated expectation)이라고도 불리는 식입니다.
일단 $ X,Y $ 가 연속확률변수라고 가정하겠습니다만
이산확률변수의 경우도 적분 기호를 합 기호로 바꿔서 똑같은 방법으로 증명할 수 있습니다.
우선 조건부 평균의 정의에 따라 아래 식이 성립함을 알 수 있습니다.
$ E[E[X|Y]]=\int_{-\infty}^{\infty}E[X|Y=y]f_Y(y)dy=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}xf_{X|Y}(x|y)f_Y(y)dxdy $
그리고 조건부 확률밀도함수의 정의에 따라 우변의 적분식을 다시 쓰면 아래와 같습니다.
$ \int_{-\infty}^{\infty}\int_{-\infty}^{\infty}xf_{X|Y}(x|y)f_Y(y)dxdy=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}xf_{X,Y}(x,y)dxdy=E[X] $
따라서 $ E[E[X|Y]] = E[X] $ 식이 성립함을 알 수 있습니다.
2. $ Var(X)=E[Var(X|Y)]+Var(E[X|Y]) $ (law of total variance)
앞선 글에서 언급한 $ Var(X)=E[X^2]-(E[X])^2 $ 식은 조건부 분산에 대해서도 아래와 같이 성립합니다.
$ Var(X|Y)=E[X^2|Y]-(E[X|Y])^2 $
이제 전체 분산의 법칙이라고도 불리는 원래 식의 우변을 보겠습니다.
$ E[Var(X|Y)]+Var(E[X|Y]) $ 식은 아래와 같이 다시 쓸 수 있습니다.
$ E[Var(X|Y)]+Var(E[X|Y])=E[E[X^2|Y]]-E[(E[X|Y])^2]+E[(E[X|Y])^2]-(E[E[X|Y]])^2=E[E[X^2|Y]]-(E[E[X|Y]])^2 $
그리고 위에서 증명한 반복 기댓값의 법칙에 따라 아래 식이 성립합니다.
$ E[E[X^2|Y]]-(E[E[X|Y]])^2 = E[X^2]-(E[X])^2=Var(X) $
따라서 원래 식의 좌변과 우변이 같아지게 됩니다.
한편, 위 식에 등장하는 조건부 분산 $ Var(X|Y) $ 는 항상 nonnegative 합니다.
왜냐하면 $ (X-E[X|Y=y])^2 \geq 0 $ 이 모든 $ X=x $ 에 대해 성립하기 때문입니다.
앞선 글에서 어떤 확률변수 $ Z $ 가 $ Z \geq 0 $ 를 항상 만족하면 $ E[Z] \geq 0 $ 임을 보였기 때문에
$ Var(X|Y)=E[(X-E[X|Y])^2|Y] \geq 0 $ 임을 알 수 있습니다.
따라서 $ E[Var(X|Y)] \geq 0 $ 가 성립하고 이를 통해 $ Var(X) \geq Var(E[X|Y]) $ 의 부등식이 성립함을 알 수 있습니다.
이번 글에서는 조건부 통계량에 관련된 유명한 식들을 다루었습니다.
다음 글에서는 조건부 통계량에 관한 다른 식과 관련된 예시에 대해 써보겠습니다.
'수학 > 수리통계학' 카테고리의 다른 글
수리통계학 (19) - 독립확률변수 (0) | 2021.12.09 |
---|---|
수리통계학 (18) - 조건부 통계량의 활용사례 (0) | 2021.12.08 |
수리통계학 (16) - 조건부 확률분포 (0) | 2021.12.07 |
수리통계학 (15) - 연속확률벡터의 변환 (0) | 2021.12.06 |
수리통계학 (14) - 이변량 분포의 다른 특성들 (0) | 2021.12.06 |