Loading [MathJax]/jax/output/CommonHTML/jax.js
본문 바로가기

수학/수리통계학

수리통계학 (53) - 최강력검정

지난 글에서는 최소충분통계량에 대해 써보았습니다.

이번 글에서는 가설검정에 관한 개념들을 써보려고 합니다.

 

우선 가설검정을 설명하기 위해서, 확률벡터 X=(X1,X2,...,Xn) 를 생각하고

이를 바탕으로 아래와 같은 가설의 진위를 판별하는 상황을 생각해보겠습니다.

H0:θw0 vs. H1:θw1

위와 같이 모수의 값을 유일하게 정해놓는 대신

여러 값들의 가능성을 내포하고 있는 가설을 복합가설(composite hypothesis)이라고 합니다.

반면, 한 개의 고정된 모수값을 제시하는 가설은 단순가설(simple hypothesis)이라고 부릅니다.

 

이제 가설검정 절차를 설명해보겠습니다.

앞선 글에서는 어떤 집합 C 를 기각역으로 설정하고 상기한 가설검정 절차를 다음과 같이 수행했습니다.

H0 기각  if XC
H0 유지  if XCc

그리고 귀무가설 H0 가 맞는데도 불구하고 이를 기각하는 오류는 제1종 오류라고 불렀고

H0 가 틀렸음에도 이를 기각하지 않는 오류를 제2종 오류라고 불렀습니다.

한편, 제1종 오류를 저지를 확률(유의수준)은 maxθw0Pθ(XC) 와 같이 계산했습니다.

보통 제1종 오류가 제2종 오류보다 더 심각한 결과를 초래하기 때문에

유의수준은 연구자가 특별히 염두에 둔 숫자로 정해지는 것이 보통입니다.

반면, 제2종 오류를 저지를 확률은 Pθ(type II error)=1Pθ(XC) (for all θw1) 으로 계산됩니다.

따라서 주어진 유의수준 하에서 제2종 오류를 저지를 확률을 최소화하기 위해서는

Pθ(XC) 의 확률이 w1 에 포함된 모든 원소 θ 에 대해 극대화되어야 합니다.

이러한 확률을 계산해주는 함수를 검정력 함수라고 부르고, γC(θ) 와 같이 표기합니다.

위의 검정력 함수는 기각역 C 에 따라 결정됩니다.

따라서 검정력 함수를 극대화하는 기각역 C 가 존재한다면, 제2종 오류를 저지를 확률이 최소가 됨을 알 수 있습니다.

우선 귀무가설과 대립가설이 모두 단순가설인 경우( H0:θ=θ vs. H1:θ=θ )를 가정한다면

아래와 같은 조건을 만족하는 기각역 C 는 검정력을 극대화하는 것을 알 수 있습니다.

(i) Pθ(XC)=α
(ii) Pθ(XC)=maxPθ(XA)=αPθ(XA)

위의 식을 만족하는 기각역은 최적기각역(best critical region)이라고 부릅니다.

 

한편, 최적기각역 C 는 아래와 같은 조건식을 통해 구할 수도 있습니다.

(i) L(θ;x)/L(θ;x)k for all xC
(ii) L(θ;x)/L(θ;x)k for all xCc
(iii) α=PH0(XC)

어떤 양수 k 에 대해 상기한 세 가지 조건을 모두 만족시키는 C최적기각역이 됩니다.(네이만-피어슨 정리)

그 이유는 다음과 같습니다.

우선 함수 f(B;θ)f(B;θ):=xBL(θ;x)dx1...dxn=Pθ(XB) 와 같이 정의하겠습니다.

상기한 함수는 α 의 유의수준을 갖는 임의의 기각역 A 에 대해 아래와 같은 관계식을 만족합니다.

f(C;θ)f(A;θ)=f(CA;θ)+f(CAc;θ)f(AC;θ)f(ACc;θ)=f(CAc;θ)f(ACc;θ)

한편, 상기한 조건식에 따르면 아래와 같은 부등식이 성립함을 알 수 있습니다.

f(CAc;θ)(1/k)f(CAc;θ)
f(ACc;θ)(1/k)f(ACc;θ)

위의 부등식들은 아래와 같이 정리할 수 있습니다.

f(CAc;θ)f(ACc;θ)(1/k)f(CAc;θ)(1/k)f(ACc;θ)

그리고 위 부등식의 우변은 다음과 같이 정리할 수 있습니다.

(1/k)f(CAc;θ)(1/k)f(ACc;θ)=(1/k)(f(CAc;θ)f(ACc;θ))=(1/k)(f(C;θ)f(A;θ))=(1/k)(αα)=0

따라서 아래와 같은 부등식이 성립함을 알 수 있습니다.

f(C;θ)f(A;θ)=f(CAc;θ)f(ACc;θ)0

따라서 임의의 기각역 A 에 대해 Pθ(XC)=f(C;θ)f(A;θ)=Pθ(XA) 의 부등식이 성립하고

C 는 최적의 기각역이 됨을 알 수 있습니다.

 

한편, 위에서처럼 단순가설로만 구성된 가설검정의 사례에서는

최적기각역 C 로 구한 검정력 함수 γC(θ)γC(θ)α 부등식을 만족합니다.

왜냐하면 X 를 고려하지 않고 α 의 확률로 H0 를 기각하는 가설검정 절차를 시행해도

α 의 값을 갖는 검정력 함수를 얻을 수 있기 때문입니다.

 

이제 귀무가설과 대립가설이 모두 복합가설로 주어진 경우를 살펴보고 글을 마치겠습니다.

H0:θw0 vs. H1:θw1

우선 위와 같은 가설을 유의수준 α 로 검정하는 절차가 아래와 같은 부등식을 충족한다고 해보겠습니다.

Pθ(XC)α for all θw1

만약 대립가설이 참인데도 불구하고 X 가 기각역에 포함될 확률이 α 보다 작다면

귀무가설을 기각하고 대립가설을 채택하는 선택이 합당하지 않을 수도 있게 됩니다.

그래서 대립가설이 참일 때 위의 부등식을 만족하는 가설검정절차는 불편성을 충족한다고 표현합니다.

한편, 윗글에서 정의한 최적기각역 C 는 대립가설이 단순가설인 경우를 가정하고 구한 것입니다.

복합가설의 경우에는 대립가설에서 모수가 가질 수 있는 값에 따라서 최적기각역이 달라질 수도 있습니다.

그런데 어떤 최적기각역 C 가 대립가설에서 모수가 가질 수 있는 모든 값 θw1 에 대해

유의수준 α 하에서의 검정력 함수 γC(θ) 를 극대화한다고 해보겠습니다.

이때, 상기한 기각역 C 를 활용한 가설검정절차는 최강력검정(UMP test, uniformly most powerful)이라고 부릅니다.

 

이번 글에서는 최강력검정에 대해 써보았습니다.

다음 글에서는 우도비검정에 대해 써보겠습니다.