본문 바로가기

수학/수리통계학

수리통계학 (28) - 포아송 분포의 성질

지난 글에서는 포아송 과정 및 분포에 대해 써보았습니다.

이번 글에서는 포아송 분포의 성질에 대해 써보겠습니다.

 

우선 지난 글에서 유도한 포아송 분포의 확률질량함수는 아래와 같습니다.

$ p_X (x) = m^x e^{-m}/x! $

한편, 포아송 과정을 따르는 사건이 주어졌을 때

일정 시간구간에서 이 사건이 발생하는 횟수는 포아송 분포를 따른다는 것을 설명했습니다.

따라서 $ x<0 $ 이면 $ p_X(x)=0 $ 임을 알 수 있습니다.

이러한 점을 고려하면, 포아송 분포의 확률질량함수를 아래와 같이 다시 쓸 수 있습니다.

$ p_X(x)=\begin{cases} m^x e^{-m}/x! & \text{ if } x=0,1,2,... \\ 0 & \text{ otherwise } \end{cases} $

 

포아송 분포를 따르는 확률변수의 평균 및 분산을 알아내려면

이의 적률생성함수를 활용하는 것이 편리합니다.

포아송 확률변수의 적률생성함수를 계산해보면 아래와 같습니다.

$ M(t)=E[e^{tX}]=\sum_{x=0}^{\infty}[e^{tx}m^x e^{-m}/x!] =\sum_{x=0}^{\infty}[(me^t)^x e^{-m}/x!] $

위 식의 양변을 $ t $ 에 대해 미분하면 아래 식이 성립함을 알 수 있습니다.

$ M'(t)=\sum_{x=0}^{\infty}[xm^x e^{tx}  e^{-m}/x!]=\sum_{x=1}^{\infty}[(me^t)^x e^{-m}/(x-1)!]=me^t \sum_{x=0}^{\infty}[(me^t)^x e^{-m}/x!] =me^t M(t) $

따라서 $ M'(t) = me^t M(t) $ 로 주어진 미분방정식을 풀면 $ M(t)=cexp(me^t) $ 의 식을 얻습니다.

한편 $ M(0)=\sum_{x=0}^{\infty}[m^x e^{-m}/x!]=\sum_{x=0}^{\infty}p_X (x)=1 $ 의 식을 활용하면 상수 $ c $ 의 값을 구할 수 있습니다.

실제로 $ t $ 에 0을 대입하면 $ M(0)=ce^m=1 $ 이 성립하므로 $ c = e^{-m} $ 임을 알 수 있습니다.

결론적으로 $ M(t)=exp(m(e^t-1)) $ 의 적률생성함수를 얻게 됩니다.

 

위에서 얻은 적률생성함수를 활용해서 포아송 확률변수의 1, 2차 적률을 구해보면 아래와 같습니다.

$ E[X]=M'(0)=me^t exp(m(e^t-1))|_{t=0}=m $
$ E[X^2]=M''(0)=me^texp(m(e^t-1))(1+me^t)|_{t=0}=m(1+m)=m+m^2 $

따라서 이의 분산은 $ Var(X)=E[X^2]-(E[X])^2=m $ 으로 주어집니다.

 

한편, 이항분포에 대한 글에서 독립인 이항확률변수 여러 개를 합한 결과는

여전히 이항분포를 따른다는 것을 보였습니다.

포아송 분포를 따르는 확률변수들을 합해도 비슷한 결과가 성립합니다.

우선 독립인 확률변수 $ X_1,X_2,...,X_n $ 이 주어지고

모든 $ i=1,2,...,n $ 에 대해서 $ X_i $ 는 평균이 $ m_i $ 인 포아송 분포를 따른다고 해보겠습니다.

그러면 이 확률변수들을 모두 합한 $ \sum_{k=1}^{n}X_k $ 는 평균이 $ \sum_{k=1}^{n}m_k $ 인 포아송 분포를 따릅니다.

이의 증명은 적률생성함수의 성질을 활용하면 쉽게 할 수 있습니다.

우선 $ Y:= \sum_{k=1}^{n}X_k $ 라는 새로운 확률변수에 대한 적률생성함수는

$ X_i $ 들의 개별적인 적률생성함수들을 모두 곱한 것과 같습니다.

따라서 $ M_Y(t)=\prod_{k=1}^{n}M_{X_k}(t)=\prod_{k=1}^{n}exp(m_k(e^t -1))=exp((\sum_{k=1}^{n}m_k)(e^t -1)) $ 의 식이 성립합니다.

바로 위 식의 우변은 $ \sum_{k=1}^{n}m_k $ 의 평균을 갖는 포아송 분포의 적률생성함수입니다.

이를 통해 $ Y $ 가 상기한 평균을 갖는 포아송 확률분포를 따른다는 것을 알 수 있습니다.

 

이번 글에서는 포아송 분포의 성질에 대해 써보았습니다.

다음 글에서는 자주 쓰이는 연속확률분포에 대해 써보겠습니다.