본문 바로가기

수학/수리통계학

수리통계학 (15) - 연속확률벡터의 변환

앞선 글에서는 확률벡터가 확률변수로 변환되는 경우를 다루었습니다.

하지만 확률벡터가 또 다른 확률벡터로 변환되는 경우도 생각할 수 있습니다.

연속확률벡터의 변환이 다소 복잡하기 때문에 이에 대해서 다뤄보려고 합니다.

 

우선 $ \textbf{X}=(X_1,X_2)'$ 라는 확률벡터가 $ (X_1, X_2)'=(x_1, x_2)' $ 의 값으로 실현되었다고 해보겠습니다.

그러면 이 결과를 $ y_1 =u_1(x_1,x_2), y_2 =u_2(x_1,x_2) $ 의 변환을 거쳐서 새로운 벡터 $ (y_1,y_2)' $ 로 바꿀 수 있습니다.

여기서 $ u_1 , u_2 $ 는 꼭 일대일 함수일 필요도 없고, 미분가능해야 할 필요는 더더욱 없습니다.

하지만 의미 있는 결론을 이끌어내기 위해서 $ u_1, u_2 $ 가 일대일이면서 미분가능함을 전제하겠습니다.

$ u_1,u_2 $ 가 $ x_1,x_2 $ 에 대해 미분가능하다면 이들의 자코비안 행렬을 아래와 같이 써볼 수 있습니다.

$ \large{J=\begin{pmatrix} \frac{\partial x_1}{\partial y_1} \frac{\partial x_1}{\partial y_2} \\ \frac{\partial x_2}{\partial y_1} \frac{\partial x_2}{\partial y_2} \end{pmatrix}} $

그리고 변환된 변수의 적분에서는 $ |dx_1 dx_2|=|dy_1 dy_2| |det(J)| $ 가 성립하는 것이 알려져 있습니다.

 

이를 활용하면 변환된 확률벡터의 분포도 알아낼 수 있습니다.

예컨대, 어떤 실수 $ a,b $ 에 대해 $ P(X_1 \leq a , X_2 \leq b) $ 를 계산한다고 해보겠습니다.

우선 $ u_1 , u_2 $ 가 일대일 함수이기 때문에 이의 역함수인 $ x_1 = w_1(y_1,y_2),x_2 = w_2(y_1,y_2) $ 를 생각해볼 수 있습니다.

그리고 이하의 계산에서는 $ u_1 , u_2 $ 가 단조증가함수인 경우(i.e. $ \frac{\partial u_i}{\partial x_j}\geq 0 $ for all $ i,j $)를 가정하겠습니다.

$ u_1,u_2 $ 가 단조증가함수라면 $ P(X_1 \leq a , X_2 \leq b) = P(Y_1 \leq u_1(a,b), Y_2 \leq u_2(a,b)) $ 가 성립합니다.

하지만 아래 계산의 결과식은 $ u_1 , u_2 $ 의 증가감소 여부와 무관하게 항상 성립합니다.

 

우선 자코비안의 성질을 활용해서 아래 식을 얻을 수 있습니다.

$ P(X_1 \leq a , X_2 \leq b)=\int_{-\infty}^{a}\int_{-\infty}^{b}f_{X_1,X_2}(x_1,x_2)dx_2 dx_1=\int_{-\infty}^{u_1 (a,b)}\int_{-\infty}^{u_2 (a,b)}f_{X_1,X_2}(w_1(y_1,y_2),w_2(y_1,y_2))|det(J)|dy_2 dy_1 $

또한 $ P(Y_1 \leq u_1(a,b) , Y_2 \leq u_2(a,b))=\int_{-\infty}^{u_1 (a,b)}\int_{-\infty}^{u_2 (a,b)}f_{Y_1,Y_2}(y_1,y_2 )dy_2 dy_1 $ 이 성립합니다.

위의 두 식을 연립하면 다음과 같은 식을 얻게 됩니다.

$ \int_{-\infty}^{u_1(a,b)}\int_{-\infty}^{u_2(a,b)}f_{Y_1,Y_2}(y_1,y_2)dy_2dy_1 = \int_{-\infty}^{u_1(a,b)}\int_{-\infty}^{u_2(a,b)}f_{X_1,X_2}(w_1(y_1,y_2),w_2(y_1,y_2))|det(J)|dy_2dy_1 $

위 식은 모든 실수 $ a,b $ 에 대해 성립하므로 최종적으로 아래의 식을 얻습니다.

$ f_{Y_1,Y_2}(y_1,y_2) =f_{X_1,X_2}(w_1(y_1,y_2),w_2(y_1,y_2))|det(J)|$

물론 $ y_1, y_2 $ 가 $ w_1 , w_2 $ 의 정의역을 벗어나면 $ f_{Y_1,Y_2}(y_1,y_2)=0 $ 이 성립합니다.

 

확률벡터의 변환에 관한 간단한 예를 소개해보겠습니다.

확률변수 $ X_1,X_2 $ 의 결합확률밀도함수가 $ f_{X_1,X_2}(x_1,x_2) $ 로 주어지는 한편

$ Y_1 = X_1 + X_2 , Y_2 = X_2 $ 로 주어지는 변환을 생각해보겠습니다.

이 경우 자코비안 행렬식은 $ det(J)=|\begin{pmatrix}1 \; 0\\ 1 \; 1\end{pmatrix}|=1 $ 로 주어집니다.

따라서 $ f_{Y_1,Y_2}(y_1,y_2 ) = f_{X_1,X_2}(y_1 - y_2,y_2) $ 의 결합확률밀도함수를 얻게 됩니다.

여기서 $ Y_1 $ 의 주변확률밀도함수를 구해보면 아래의 식을 얻게 됩니다.

$ f_{Y_1}(y_1)=\int_{-\infty}^{\infty}f_{Y_1,Y_2}(y_1,y_2)dy_2 = \int_{-\infty}^{\infty}f_{X_1,X_2}(y_1 - y_2,y_2)dy_2 $ (convolution formula)

통계학에서는 두 확률변수의 합에 대해서 생각해야 할 때가 종종 있습니다. 이때 위 식을 활용할 수 있습니다.

 

이번 글에서는 연속확률벡터의 변환에 대해 써보았습니다.

다음 글에서는 이변량 분포에서의 조건부 확률에 대해 써보겠습니다.