지난 글에서는 포아송 과정 및 분포에 대해 써보았습니다.
이번 글에서는 포아송 분포의 성질에 대해 써보겠습니다.
우선 지난 글에서 유도한 포아송 분포의 확률질량함수는 아래와 같습니다.
$ p_X (x) = m^x e^{-m}/x! $
한편, 포아송 과정을 따르는 사건이 주어졌을 때
일정 시간구간에서 이 사건이 발생하는 횟수는 포아송 분포를 따른다는 것을 설명했습니다.
따라서 $ x<0 $ 이면 $ p_X(x)=0 $ 임을 알 수 있습니다.
이러한 점을 고려하면, 포아송 분포의 확률질량함수를 아래와 같이 다시 쓸 수 있습니다.
$ p_X(x)=\begin{cases} m^x e^{-m}/x! & \text{ if } x=0,1,2,... \\ 0 & \text{ otherwise } \end{cases} $
포아송 분포를 따르는 확률변수의 평균 및 분산을 알아내려면
이의 적률생성함수를 활용하는 것이 편리합니다.
포아송 확률변수의 적률생성함수를 계산해보면 아래와 같습니다.
$ M(t)=E[e^{tX}]=\sum_{x=0}^{\infty}[e^{tx}m^x e^{-m}/x!] =\sum_{x=0}^{\infty}[(me^t)^x e^{-m}/x!] $
위 식의 양변을 $ t $ 에 대해 미분하면 아래 식이 성립함을 알 수 있습니다.
$ M'(t)=\sum_{x=0}^{\infty}[xm^x e^{tx} e^{-m}/x!]=\sum_{x=1}^{\infty}[(me^t)^x e^{-m}/(x-1)!]=me^t \sum_{x=0}^{\infty}[(me^t)^x e^{-m}/x!] =me^t M(t) $
따라서 $ M'(t) = me^t M(t) $ 로 주어진 미분방정식을 풀면 $ M(t)=cexp(me^t) $ 의 식을 얻습니다.
한편 $ M(0)=\sum_{x=0}^{\infty}[m^x e^{-m}/x!]=\sum_{x=0}^{\infty}p_X (x)=1 $ 의 식을 활용하면 상수 $ c $ 의 값을 구할 수 있습니다.
실제로 $ t $ 에 0을 대입하면 $ M(0)=ce^m=1 $ 이 성립하므로 $ c = e^{-m} $ 임을 알 수 있습니다.
결론적으로 $ M(t)=exp(m(e^t-1)) $ 의 적률생성함수를 얻게 됩니다.
위에서 얻은 적률생성함수를 활용해서 포아송 확률변수의 1, 2차 적률을 구해보면 아래와 같습니다.
$ E[X]=M'(0)=me^t exp(m(e^t-1))|_{t=0}=m $
$ E[X^2]=M''(0)=me^texp(m(e^t-1))(1+me^t)|_{t=0}=m(1+m)=m+m^2 $
따라서 이의 분산은 $ Var(X)=E[X^2]-(E[X])^2=m $ 으로 주어집니다.
한편, 이항분포에 대한 글에서 독립인 이항확률변수 여러 개를 합한 결과는
여전히 이항분포를 따른다는 것을 보였습니다.
포아송 분포를 따르는 확률변수들을 합해도 비슷한 결과가 성립합니다.
우선 독립인 확률변수 $ X_1,X_2,...,X_n $ 이 주어지고
모든 $ i=1,2,...,n $ 에 대해서 $ X_i $ 는 평균이 $ m_i $ 인 포아송 분포를 따른다고 해보겠습니다.
그러면 이 확률변수들을 모두 합한 $ \sum_{k=1}^{n}X_k $ 는 평균이 $ \sum_{k=1}^{n}m_k $ 인 포아송 분포를 따릅니다.
이의 증명은 적률생성함수의 성질을 활용하면 쉽게 할 수 있습니다.
우선 $ Y:= \sum_{k=1}^{n}X_k $ 라는 새로운 확률변수에 대한 적률생성함수는
$ X_i $ 들의 개별적인 적률생성함수들을 모두 곱한 것과 같습니다.
따라서 $ M_Y(t)=\prod_{k=1}^{n}M_{X_k}(t)=\prod_{k=1}^{n}exp(m_k(e^t -1))=exp((\sum_{k=1}^{n}m_k)(e^t -1)) $ 의 식이 성립합니다.
바로 위 식의 우변은 $ \sum_{k=1}^{n}m_k $ 의 평균을 갖는 포아송 분포의 적률생성함수입니다.
이를 통해 $ Y $ 가 상기한 평균을 갖는 포아송 확률분포를 따른다는 것을 알 수 있습니다.
이번 글에서는 포아송 분포의 성질에 대해 써보았습니다.
다음 글에서는 자주 쓰이는 연속확률분포에 대해 써보겠습니다.
'수학 > 수리통계학' 카테고리의 다른 글
수리통계학 (30) - 다항분포의 정의 (0) | 2021.12.20 |
---|---|
수리통계학 (29) - 자주 쓰이는 연속확률분포 (0) | 2021.12.19 |
수리통계학 (27) - 포아송 과정 및 분포 (0) | 2021.12.18 |
수리통계학 (26) - 이항분포의 성질 (0) | 2021.12.17 |
수리통계학 (25) - 자주 쓰이는 확률분포들 (0) | 2021.12.16 |