지난 글에서는 이변량 분포에서 등장하는 여러 주변확률분포를 다루었습니다.
이번 글에서는 단변량 분포의 개념들이 이변량 분포에서는 어떻게 정의되는지에 대해 써보겠습니다.
다변량 분포에서는 벡터가 자주 등장합니다.
그리고 이 벡터를 표현하는 방법에는 크게 두 가지가 있습니다.
행벡터(row vector)로 표현하는 방법과 열벡터(column vector)로 표현하는 방법이 그것입니다.
수학, 물리학을 포함한 여러 분야에서는 벡터를 열벡터로 표현하는 관행이 있습니다.
통계학에서도 이런 관행을 대체로 따르는 편입니다.
따라서 확률벡터 역시 열벡터로 표현하는 것을 원칙으로 하되, 때로는 행벡터를 전치(transpose)해서 표현하기도 합니다.
이제 이변량 분포에서의 확률벡터 $ \textbf{X}=(X_1, X_2)' $ 가 있을 때, 이의 평균을 어떻게 정의하는지 보겠습니다.
이 확률벡터 $ \textbf{X} $ 의 평균이 존재할 필요충분조건은
이 벡터를 구성하는 두 확률변수의 평균이 모두 유한한 값으로 잘 정의되어야 한다는 것입니다.
그리고 확률벡터의 평균은 순전히 두 확률변수 $ X_1 , X_2 $ 의 평균을 요소로 갖는 새로운 벡터로 정의됩니다.
따라서 $ E[X_1] < \infty , E[X_2] < \infty \Rightarrow E[\textbf{X}]=(E[X_1],E[X_2])' $ 임을 알 수 있습니다.
한편, 확률벡터 역시도 변환을 통해 다른 변수로 바뀔 수 있습니다.
우선 확률벡터를 하나의 변수로 바꾸는 경우를 생각해보겠습니다.
확률벡터 $ \textbf{X}=(X_1, X_2)' $ 를 구성하는 두 확률변수가
$ D = \left \{ (x_1,x_2) \in \mathbb{R}^2 , x_i =X_i(s) (s \in S , i=1,2) \right \} $ 의 범위 안에서 변한다고 해보겠습니다.
그러면 이 두 확률변수값으로부터 새로운 값을 얻어내는 함수 $ g(X_1,X_2): D \rightarrow \mathbb{R} $ 를 생각해 볼 수 있습니다.
이 새로운 함수 $ g $ 는 표본공간 $ S $ 의 원소 $ s $ 를 어떤 실수로 보내는 것으로 생각할 수 있습니다.
따라서 $ Y:=g(X_1,X_2) $ 로 정의하면 $ Y $ 는 확률변수의 정의를 만족하게 됩니다.
$ Y $ 의 평균을 구하는 것은 간단합니다.
앞선 글에서 언급했듯이 $ \int_{-\infty}^{\infty}\int_{-\infty}^{\infty}|g(x_1,x_2)|f_{X_1,X_2}(x_1,x_2)dx_1 dx_2<\infty $ 만 충족된다면
원래 확률벡터의 분포만 알고 있어도 새로운 확률변수의 평균을 구할 수 있습니다.
따라서 $ E[Y]=E[g(X_1,X_2)]=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}g(x_1,x_2)f_{X_1,X_2}(x_1,x_2)dx_1 dx_2 $ 가 성립합니다.
한편으로는, 확률벡터에 대해서도 적률생성함수가 정의됩니다.
확률벡터 $ \textbf{X}=(X_1, X_2)' $ 의 적률생성함수를 정의하기 위해 $ \textbf{t} = (t_1 , t_2)' $ 와 같은 벡터를 생각하겠습니다.
벡터 $ \textbf{t} $ 는 단변량 분포의 적률생성함수에서 등장한 $ t $ 에 대응됩니다.
사실 확률벡터의 적률생성함수도 $ \textbf{t} = \textbf{0}=(0,0)' $ 에서의 값이 주된 관심사입니다.
따라서 $ (0,0) $ 을 포함하는 임의의 열린 집합 $ U \subseteq \mathbb{R}^2 $ 에서 적률생성함수가 유한한 값을 가져야만 이 함수가 정의될 수 있습니다.
구체적으로 확률벡터의 적률생성함수는 $ M_{X_1,X_2}(\textbf{t}) =E[e^{\textbf{t'X}}]=E[e^{t_1 X_1 + t_2 X_2}] $ 와 같이 정의됩니다.
이 적률생성함수는 $ t_1 , t_2 $ 의 함수입니다.
그런데 $ t_1, t_2 $ 중 한 변수의 값을 0으로 두면 $ X_1,X_2 $ 중 한 변수의 적률생성함수를 얻게 됩니다.
가령 확률벡터의 적률생성함수를 구하고 $ t_1 = 0 $ 으로 두면, 이 함수는 다름 아닌 $ X_2 $ 만의 적률생성함수가 됩니다.
앞선 글에서 적률생성함수가 어떤 변수의 확률분포에 관한 정보를 가지고 있음을 설명했습니다.
이는 확률벡터의 적률생성함수에도 그대로 적용되는 이야기입니다.
이번 글에서는 확률벡터의 평균과 적률생성함수가 어떻게 정의되는지에 대해서 써보았습니다.
다음 글에서는 확률벡터가 다른 확률벡터로 변환되는 과정에 대해서 써보겠습니다.
'수학 > 수리통계학' 카테고리의 다른 글
수리통계학 (16) - 조건부 확률분포 (0) | 2021.12.07 |
---|---|
수리통계학 (15) - 연속확률벡터의 변환 (0) | 2021.12.06 |
수리통계학 (13) - 이변량 분포의 특성 (0) | 2021.12.05 |
수리통계학 (12) - 이변량 분포 (0) | 2021.12.05 |
수리통계학 (11) - 통계학의 다른 부등식들 (0) | 2021.12.03 |