본문 바로가기

수학/수리통계학

수리통계학 (6) - 확률변수의 성질

지난 글에서는 확률변수와 누적분포함수를 소개했습니다.

실제로 누적분포함수는 요긴한 성질들을 가지고 있어서인지 자주 쓰이는 편입니다.

이번 글에서는 누적분포함수의 다른 성질들에 대해서 써보겠습니다.

 

1. $ X $ 의 누적분포함수를 $ F_X( \cdot ) $ 이라고 했을 때, $ P[a < X \leq b]=F_X (b)-F_X (a) $ 이 성립합니다.

 

두 실수구간 $ (-\infty , a] $ 과 $ (a,b] $ 을 생각하겠습니다.

이 두 구간은 서로소이고, 합집합하면 $ (-\infty,b] $ 가 됩니다.

따라서 $ p_X((-\infty,b])=p_X((-\infty , a]) + p_X((a , b]) $ 가 성립합니다.

누적분포함수의 정의에 따라 이 식은 $ F_X (b) = F_X (a) + p_X((a , b]) $ 로 다시 쓸 수 있습니다.

$ p_X((a , b]) = P[a < X \leq b] $ 이므로 원하는 결과를 얻게 됩니다.

 

2. 확률변수 $ X $ 에 대해서 $ P[X=x] = F_X (x) - \underset{u \uparrow x}{lim}F_X (u) $ 이 성립합니다.

 

$ F_X (x) - F_X (x-(1/n)) = p_X(x-(1/n)< X \leq x) $ 이 성립함을 위에서 보였습니다.

특히 $ x-(1/n) $ 이 $ x $ 의 왼쪽에서 $ x $ 로 수렴하므로 다음 식이 성립합니다.

$ F_X (x)- \underset{u \uparrow x}{lim}F_X (u) = \underset{n \rightarrow \infty}{lim}[F_X (x) - F_X (x-(1/n))] $ 

$ (x-(1/n),x] $ 은 감소수열로서 $ n $ 이 무한대로 발산하면 $ \left \{ x \right \} $ 로 수렴합니다.

따라서 위의 사실들을 종합하면 아래와 같이 원하는 결과를 얻게 됩니다.

$ F_X (x)- \underset{u \uparrow x}{lim}F_X (u) = \underset{n \rightarrow \infty}{lim}[F_X (x) - F_X (x-(1/n))]= p_X(\bigcap_{n=1}^{\infty}(x-(1/n), x])=p_X(x)=P [X=x]  $ 

 

이외에도 확률변수를 다룰 때, 사람들이 특별히 관심을 갖는 값들이 있습니다.

대표적으로 평균과 분산을 들 수 있습니다.

평균은 확률변수가 어느 값을 기준으로 변하는지에 대한 하나의 척도가 될 수 있습니다.

반면, 분산은 확률변수가 얼마만큼 퍼져있는지에 대한 척도가 됩니다.

 

평균값은 확률변수를 가중치로 확률분포함수를 더해서 구하게 됩니다.

이산확률변수의 경우는 $ \sum_{x}^{}xp_X(x) $ 와 같이 구하는 한편

연속확률변수는 $ \int_X xf_X(x)dx $ 으로 구하게 됩니다.

주의할 점은 위의 적분이 리만 적분이 아니라 르베그 적분이라는 것입니다.

르베그 적분은 측도를 기반으로 하는 적분입니다.

르베그 적분에서는 어떤 함수 $ f $ 가 적분 가능하다는 말은 절댓값 $ |f| $ 를 적분한 값이 유한하다는 말과 동치입니다.

따라서 어떤 확률변수의 평균값이 존재하려면 $ \int_X |x|f_X(x)dx < \infty $ (이산확률변수는 $ \sum_{x}^{} |x|p_X(x) < \infty $ ) 을 만족해야 합니다.

어떤 확률변수 $ X $ 의 평균값이 존재할 경우, 이를 $ E[X] $ 로 간단히 쓰기도 합니다.

르베그 적분이 linearity를 만족하기 때문에 평균 연산자 역시도 linearity를 만족합니다.

 

확률변수 $ X $ 의 분산은 $ X $ 의 평균값을 $ \mu $ 로 써서 $ E[(X- \mu )^2] $ 으로 구합니다.

물론 분산도 유한한 경우에만 정의하고, $ Var(X) $ 으로 표기합니다.

그리고 평균 연산자의 linearity 덕분에 아래의 관계식을 얻을 수 있습니다.

$ Var(X) = E[(X- \mu )^2] = E[X^2-2 \mu X + (\mu)^2]=E[X^2]-2 \mu \mu + (\mu)^2 = E[X^2] - (E[X])^2 $

따라서 분산은 확률변수 제곱의 평균에서 평균의 제곱을 뺀 값이 됩니다.

이번 글에서는 확률변수의 여러 성질과 특성에 대해서 알아보았습니다.

다음 글에서는 자주 쓰이는 확률변수에 대해서 써보겠습니다.