지난 글에서는 포아송 과정 및 분포에 대해 써보았습니다.
이번 글에서는 포아송 분포의 성질에 대해 써보겠습니다.
우선 지난 글에서 유도한 포아송 분포의 확률질량함수는 아래와 같습니다.
pX(x)=mxe−m/x!
한편, 포아송 과정을 따르는 사건이 주어졌을 때
일정 시간구간에서 이 사건이 발생하는 횟수는 포아송 분포를 따른다는 것을 설명했습니다.
따라서 x<0 이면 pX(x)=0 임을 알 수 있습니다.
이러한 점을 고려하면, 포아송 분포의 확률질량함수를 아래와 같이 다시 쓸 수 있습니다.
pX(x)={mxe−m/x! if x=0,1,2,...0 otherwise
포아송 분포를 따르는 확률변수의 평균 및 분산을 알아내려면
이의 적률생성함수를 활용하는 것이 편리합니다.
포아송 확률변수의 적률생성함수를 계산해보면 아래와 같습니다.
M(t)=E[etX]=∑∞x=0[etxmxe−m/x!]=∑∞x=0[(met)xe−m/x!]
위 식의 양변을 t 에 대해 미분하면 아래 식이 성립함을 알 수 있습니다.
M′(t)=∑∞x=0[xmxetxe−m/x!]=∑∞x=1[(met)xe−m/(x−1)!]=met∑∞x=0[(met)xe−m/x!]=metM(t)
따라서 M′(t)=metM(t) 로 주어진 미분방정식을 풀면 M(t)=cexp(met) 의 식을 얻습니다.
한편 M(0)=∑∞x=0[mxe−m/x!]=∑∞x=0pX(x)=1 의 식을 활용하면 상수 c 의 값을 구할 수 있습니다.
실제로 t 에 0을 대입하면 M(0)=cem=1 이 성립하므로 c=e−m 임을 알 수 있습니다.
결론적으로 M(t)=exp(m(et−1)) 의 적률생성함수를 얻게 됩니다.
위에서 얻은 적률생성함수를 활용해서 포아송 확률변수의 1, 2차 적률을 구해보면 아래와 같습니다.
E[X]=M′(0)=metexp(m(et−1))|t=0=m
E[X2]=M″
따라서 이의 분산은 Var(X)=E[X^2]-(E[X])^2=m 으로 주어집니다.
한편, 이항분포에 대한 글에서 독립인 이항확률변수 여러 개를 합한 결과는
여전히 이항분포를 따른다는 것을 보였습니다.
포아송 분포를 따르는 확률변수들을 합해도 비슷한 결과가 성립합니다.
우선 독립인 확률변수 X_1,X_2,...,X_n 이 주어지고
모든 i=1,2,...,n 에 대해서 X_i 는 평균이 m_i 인 포아송 분포를 따른다고 해보겠습니다.
그러면 이 확률변수들을 모두 합한 \sum_{k=1}^{n}X_k 는 평균이 \sum_{k=1}^{n}m_k 인 포아송 분포를 따릅니다.
이의 증명은 적률생성함수의 성질을 활용하면 쉽게 할 수 있습니다.
우선 Y:= \sum_{k=1}^{n}X_k 라는 새로운 확률변수에 대한 적률생성함수는
X_i 들의 개별적인 적률생성함수들을 모두 곱한 것과 같습니다.
따라서 M_Y(t)=\prod_{k=1}^{n}M_{X_k}(t)=\prod_{k=1}^{n}exp(m_k(e^t -1))=exp((\sum_{k=1}^{n}m_k)(e^t -1)) 의 식이 성립합니다.
바로 위 식의 우변은 \sum_{k=1}^{n}m_k 의 평균을 갖는 포아송 분포의 적률생성함수입니다.
이를 통해 Y 가 상기한 평균을 갖는 포아송 확률분포를 따른다는 것을 알 수 있습니다.
이번 글에서는 포아송 분포의 성질에 대해 써보았습니다.
다음 글에서는 자주 쓰이는 연속확률분포에 대해 써보겠습니다.
'수학 > 수리통계학' 카테고리의 다른 글
수리통계학 (30) - 다항분포의 정의 (0) | 2021.12.20 |
---|---|
수리통계학 (29) - 자주 쓰이는 연속확률분포 (0) | 2021.12.19 |
수리통계학 (27) - 포아송 과정 및 분포 (0) | 2021.12.18 |
수리통계학 (26) - 이항분포의 성질 (0) | 2021.12.17 |
수리통계학 (25) - 자주 쓰이는 확률분포들 (0) | 2021.12.16 |