Processing math: 55%
본문 바로가기

수학/수리통계학

수리통계학 (28) - 포아송 분포의 성질

지난 글에서는 포아송 과정 및 분포에 대해 써보았습니다.

이번 글에서는 포아송 분포의 성질에 대해 써보겠습니다.

 

우선 지난 글에서 유도한 포아송 분포의 확률질량함수는 아래와 같습니다.

pX(x)=mxem/x!

한편, 포아송 과정을 따르는 사건이 주어졌을 때

일정 시간구간에서 이 사건이 발생하는 횟수는 포아송 분포를 따른다는 것을 설명했습니다.

따라서 x<0 이면 pX(x)=0 임을 알 수 있습니다.

이러한 점을 고려하면, 포아송 분포의 확률질량함수를 아래와 같이 다시 쓸 수 있습니다.

pX(x)={mxem/x! if x=0,1,2,...0 otherwise 

 

포아송 분포를 따르는 확률변수의 평균 및 분산을 알아내려면

이의 적률생성함수를 활용하는 것이 편리합니다.

포아송 확률변수의 적률생성함수를 계산해보면 아래와 같습니다.

M(t)=E[etX]=x=0[etxmxem/x!]=x=0[(met)xem/x!]

위 식의 양변을 t 에 대해 미분하면 아래 식이 성립함을 알 수 있습니다.

M(t)=x=0[xmxetxem/x!]=x=1[(met)xem/(x1)!]=metx=0[(met)xem/x!]=metM(t)

따라서 M(t)=metM(t) 로 주어진 미분방정식을 풀면 M(t)=cexp(met) 의 식을 얻습니다.

한편 M(0)=x=0[mxem/x!]=x=0pX(x)=1 의 식을 활용하면 상수 c 의 값을 구할 수 있습니다.

실제로 t 에 0을 대입하면 M(0)=cem=1 이 성립하므로 c=em 임을 알 수 있습니다.

결론적으로 M(t)=exp(m(et1)) 의 적률생성함수를 얻게 됩니다.

 

위에서 얻은 적률생성함수를 활용해서 포아송 확률변수의 1, 2차 적률을 구해보면 아래와 같습니다.

E[X]=M(0)=metexp(m(et1))|t=0=m
E[X2]=M

따라서 이의 분산은 Var(X)=E[X^2]-(E[X])^2=m 으로 주어집니다.

 

한편, 이항분포에 대한 글에서 독립인 이항확률변수 여러 개를 합한 결과는

여전히 이항분포를 따른다는 것을 보였습니다.

포아송 분포를 따르는 확률변수들을 합해도 비슷한 결과가 성립합니다.

우선 독립인 확률변수 X_1,X_2,...,X_n 이 주어지고

모든 i=1,2,...,n 에 대해서 X_i 는 평균이 m_i 인 포아송 분포를 따른다고 해보겠습니다.

그러면 이 확률변수들을 모두 합한 \sum_{k=1}^{n}X_k 는 평균이 \sum_{k=1}^{n}m_k 인 포아송 분포를 따릅니다.

이의 증명은 적률생성함수의 성질을 활용하면 쉽게 할 수 있습니다.

우선 Y:= \sum_{k=1}^{n}X_k 라는 새로운 확률변수에 대한 적률생성함수는

X_i 들의 개별적인 적률생성함수들을 모두 곱한 것과 같습니다.

따라서 M_Y(t)=\prod_{k=1}^{n}M_{X_k}(t)=\prod_{k=1}^{n}exp(m_k(e^t -1))=exp((\sum_{k=1}^{n}m_k)(e^t -1)) 의 식이 성립합니다.

바로 위 식의 우변은 \sum_{k=1}^{n}m_k 의 평균을 갖는 포아송 분포의 적률생성함수입니다.

이를 통해 Y 가 상기한 평균을 갖는 포아송 확률분포를 따른다는 것을 알 수 있습니다.

 

이번 글에서는 포아송 분포의 성질에 대해 써보았습니다.

다음 글에서는 자주 쓰이는 연속확률분포에 대해 써보겠습니다.