글과 사진, 그리고 이야기

IE & SWCON/Statistics

[통계] 표본평균이 모평균과 같을 수 있을까?

뱃놀이가자 2023. 9. 16. 22:31
728x90

고등학교 교육과정에서 표본평균의 평균과 모평균은 같다라고 배웠다.

물론 당연하게도 표본평균은 모평균과 같을 수 없다. 

 

실제 데이터가 주어져있다면. "아니 같을 수 없다기 보다 같을 확률이 현저히 떨어진다"라고 정정할 수 있겠다.

 

무슨 말이냐 하면

 

우리나라 국민 남성의 평균키가 170이라고 했을 때 표본을 100명짜리를 뽑아서 키가 170일 확률은 극히 낮을 것이다.

물론 이때에 p-value를 사용한다. 

 

이렇듯 실제 데이터가 존재한다면 직접 구해봐야겠지만 아닐 가능성이 매우 높다는 것이다.

 

그렇다면 이론상으로는 어떨까

이론상 X라는 population이 있다고 하고 Xi가 각각의 표본으로서 존재한다면 X나 Xi나 랜덤변수로서 동일한 확률 분포를 가질 수 있다는 것이다. 다시, X나 Xi나 동일한 확률분포로서 그 기댓값이 동일 할 수 있다는 것이다. 

 

이러한 가설을 바탕으로 표본평균의 분산이 왜 모평균의 분산/n (n은 표본의 개수)인지 확인할 수 있다.

 

추가하자면 표본평균에서 표본의 크기가 커질 수록 모평균에 더 가까워질 것이며 이는 초반에 가설한 중심극한 정리로서 설명할 수 있다. 

 

Xi는 X라는 모집단의 각 표본 데이터 포인트로서 해석할 수 있는 여지가 있으므로 즉 X의 독립적인 복사본이므로 

Var(X1)=Var(X2)=...=Var(Xn)=Var(X)

이다.

 

따라서 내용을 정의하자면

 

인 것이다. 

728x90