본문 바로가기

수학

(55)
수리통계학 (30) - 다항분포의 정의 지난 글에서는 자주 쓰이는 연속확률분포에 대해 써보았습니다. 이번 글에서는 다항분포에 대한 내용을 써보려고 합니다. 글을 시작하기에 앞서 통계학에서 미지의 변수를 바라보는 두 가지의 상반된 관점을 언급하고 넘어가겠습니다. 통계학의 기본적인 목표 중 하나는 자료를 해석해서 미지의 무언가를 찾아내는 것입니다. 예컨대, 표본을 조사해서 모집단의 통계적 특성인 모수를 찾아내는 것이 목표가 될 수 있습니다. 다시 말해서, 모수가 미지의 고정값이라고 전제하고 이 값을 찾아내려고 노력할 수 있습니다. 한편, 어떤 사람들은 모수의 정해진 값 대신에 모수가 따르는 확률분포를 찾아내려고 합니다. 만약 자료가 지극히 부족한 상황이라면 모수의 정확한 값을 알아내기 힘들 수도 있습니다. 따라서 이의 확률분포라도 알아내겠다고 하..
수리통계학 (29) - 자주 쓰이는 연속확률분포 지난 글에서는 포아송 분포의 성질에 대해 써보았습니다. 이번 글에서는 자주 쓰이는 연속확률분포인 감마분포와 베타분포에 대해 써보려고 합니다. 우선 이들 확률분포를 다루기 전에 감마함수에 대한 내용을 간략히 언급하겠습니다. 양수인 실수 집합 위에 정의된 함수 $ \Gamma(t) $ 가 아래와 같은 식을 만족한다고 해보겠습니다. $ \Gamma(t)=\int_{0}^{\infty}x^{t-1}e^{-x}dx $ 위 식을 들여다보면 $ \Gamma(1)=\int_{0}^{\infty} e^{-x}dx = 1 $ 이 성립하는 것을 바로 알 수 있습니다. 한편 자연수인 $ t $ 에 대해서 $ \Gamma(t)=(t-1)! $ 이 성립한다고 가정해보겠습니다. 그러면 $ \Gamma(t+1) $ 은 부분적분을 활..
수리통계학 (28) - 포아송 분포의 성질 지난 글에서는 포아송 과정 및 분포에 대해 써보았습니다. 이번 글에서는 포아송 분포의 성질에 대해 써보겠습니다. 우선 지난 글에서 유도한 포아송 분포의 확률질량함수는 아래와 같습니다. $ p_X (x) = m^x e^{-m}/x! $ 한편, 포아송 과정을 따르는 사건이 주어졌을 때 일정 시간구간에서 이 사건이 발생하는 횟수는 포아송 분포를 따른다는 것을 설명했습니다. 따라서 $ x
수리통계학 (27) - 포아송 과정 및 분포 지난 글에서는 이항분포의 성질에 대해 써보았습니다. 이번 글에서는 포아송 분포에 대해 써보려고 합니다. 이 분포를 소개하기 전에 포아송 과정(Poisson process)을 언급하고 넘어가겠습니다. 포아송 과정은 주어진 시간동안 어떤 사건이 몇 번 발생했는지를 묘사하는 방법 중 하나입니다. 이를 설명하기 위해서 $ g(n,t,w) $ 라는 함수를 $ (t,t+w] $ 의 시간구간에서 $ n $ 번의 사건이 발생할 확률로 정의해보겠습니다. 한편, 어떤 시간구간 $ (a,b] $ 에서 발생한 사건의 횟수를 $ N(a,b] $ 로 표기하면 $ g(n,t,w)=P(N(t,t+w]=n) $ 이 성립하는 것을 알 수 있습니다. 포아송 과정은 함수 $ g(\cdot),N(\cdot) $ 이 어떤 상수 $ \lambd..
수리통계학 (26) - 이항분포의 성질 지난 글에서는 자주 쓰이는 이산확률분포에 대해 써보았습니다. 이번 글에서는 이항분포의 성질에 대해 써보려고 합니다. 글을 시작하기 전에, 여러 확률변수를 선형결합해서 얻은 확률변수의 성질에 대해 써보겠습니다. 확률변수 $ X_1,X_2,...,X_n $ 이 주어졌을 때, 이들을 선형결합하면 아래와 같이 새로운 확률변수를 얻을 수 있습니다. $ Y = \sum_{i=1}^{n}c_i X_i $ 이하에서는 위의 확률변수 $ Y $ 의 평균과 분산을 계산해보겠습니다. 일단 평균 연산자는 linearity를 만족하기 때문에 모든 $ i=1,2,...,n $ 에 대해 $ X_i $ 의 평균이 잘 정의된다면 $ E[Y]=\sum_{i=1}^{n}c_i E[X_i] $ 의 식이 성립하게 됩니다. 한편 $ Y $ 의 ..