이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다.
내용에 들어가기 앞서 전반적인 개요를 살펴보면, 지난 글까지는 모집단에서 표본을 뽑는 것과 관련된 내용에 대해 알아보았다. 이번 포스트부터는 표본에서 모집단을 추론하는 과정인 통계적 추론(statistical inference)에 대해 배워보고자 한다.
통계적 추론은 3가지 기준에 따라 나눌 수 있다.
- 모집단의 분포 가정 여부에 따른 통계적 추론 분류
- 모수처리방식에 따른 통계적 추론 분류
- 추론목적에 따른 통계적 추론 분류
이제 각 종류에 대해 알아보자.
분포 가정 유무에 따른 분류
- 모수적 추론 (parametric inference)
모집단에 대해서 특정 분포를 가정하고, 그 분포를 결정하는 모수에 대해 추론하는 방법이다.
예를 들어, 정규분포라고 가정하면 모수인 평균과 분산에 대해 추론하는 것이다.
그리고 그 모수들이 가질 수 있는 영역을 모수공간(parameter space)라고 부른다.
이 방법은 모집단의 가정이 적절히 이뤄져있다면 가장 좋은 방법이다. 따라서 모수적 추론에는 이런 가정을 잘 만족하는지 평가하는 부분이 포함되어 있다.
- 비모수적 추론 (non-parametric inference)
모집단에 대해 특정한 분포를 가정하지 않는 방법이며, 주로 이상치가 존재할 때 사용한다.
이는 모집단을 가정하지 않아 몇개의 모수로 특성을 결정할 수 있는지 알 수 없기 때문에 이론적으로는 모수 공간의 차원 dim(θ) = ∞이라고 한다.
이 때 어떤 특정한 모수에 관심을 가지지 않고 나름대로 직관적으로 추론하는 경향이 있어 다양한 통계량을 고려하여 추론할 수 있다. 대표적으로는 자료의 순위(rank) 등이 사용된다.
모수 처리방식에 따른 분류
- 빈도론자 추론 (frequentist inference)
모수를 고정된 값인 상수라고 가정
- 베이지안 추론 (bayesian inference)
미지의 값(모수, 결측값, 미래값)을 확률변수라고 가정하고, 해당 확률변수의 확률분포에 관심을 가지는 것
예를 들어, θ가 관심모수이고 x1, ... , xn이 표본관측값이라면 관심있는 분포는 f(θ|x1, ... ,xn)인 것이다.
이 때 표본은 아래와 같이 베이즈 정리를 이용해서 구할 수 있다.
추론 목적에 따른 분류
- 추정 (estimation)
- 점추정 (point estimation) : 모수값이 얼마인지 어떤 점으로 추정
- 구간추정 (interval estimation) : 모수가 포함될 것이라고 기대되는 구간을 확률적으로 구함 - 가설검정 (testing hypotheses)
모집단에 대한 가설을 나름대로 세워 그 가설의 옳고 그름을 확률적으로 판정
반응형
'MATH & STATS > STATISTICS' 카테고리의 다른 글
[통계학] 13-3. 통계적 추론의 개요 - 구간추정과 신뢰구간 (0) | 2020.03.18 |
---|---|
[통계학] 13-2. 통계적 추론의 개요 - 추정법과 점추정량 (0) | 2020.03.17 |
[통계학] 12-4. 표본분표 - 기타통계량의 표집분포 (0) | 2020.03.11 |
[통계학] 12-3. 표본분표 - 이항분포의 정규근사 (0) | 2020.03.11 |
[통계학] 12-2. 표집분포 - 중심극한정리 (0) | 2020.03.11 |