본문 바로가기

[통계학] 15-1-2. 단일모집단 추론 - 모평균에 대한 통계적 추론(2) 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 이번 포스트에서는 단일 모집단이 정규분포가 아닐 때의 모평균에 대한 통계적 추론을 알아보고자 한다. 비정규성을 띄는 대표본 정규성을 만족하지 않는데 표본의 크기가 큰 대표본인 경우(n ≥ 30), 중심극한정리에 의해 정규분포에 근사할 수 있다. 비모수적 방법 그렇다면 정규분포가 아닌데 표본 크기가 크지 않은 경우에는 어떻게 할까? 이 때 사용하는 방법이 비모수적 방법이다. 이는 분포에 대한 특별한 제약조건은 없으며, 특정 중심위치에 대한 검정을 진행한다. 부호 검정 (sign test) 특정 값을 기준으로 이항분포(B)를 통해 확률(p값)을 계산 Wilcoxon 부호 순위 검정 (Wilcoxon signe..
[통계학] 15-1-1. 단일모집단 추론 - 모평균에 대한 통계적 추론(1) 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 지난 13,14에 배운 통계적 추론에 대한 기본적인 내용을 바탕으로 다양한 경우에 대한 통계적 추론을 해보고자 한다. 이번 포스트에서는 단일 모집단이 정규분포일 때 모평균에 대한 통계적 추론을 배워보고자 한다. 모평균 점추정 모집단이 정규분포인 경우, 우선 정규분포의 가정을 데이터가 만족하고 있는지 확인해야 한다. 이는 Shapiro-Wilk test, Jacque-Bera test 를 통해 검정해볼 수 있다. 모집단에서 확률 표본 X1, ... , Xn ~ iid N(μ, σ^2)을 뽑은 후 평균을 추론하는데, 이 확률 표본은 X_i = μ + ε_i, ε_i ~ iid N(0, σ^2)으로 표현하기도 ..
[통계학] 14-4. 통계적 추론의 개요 - 유의확률(p-value) 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 이번에는 p값, p-value라고 불리는 유의확률이 무엇인지, 그리고 지난번에 다룬 유의수준과 어떤 차이가 있는지 알아보고자 한다. 들어가기에 앞서, 모평균을 검정하는 한 예시를 살펴보자. n개의 확률표본이 어떤 정규분포를 X1, ... , Xn ~ iid N(μ, σ^2) 이렇게 따르고 있다. 이 때 제시하려는 대립가설은 1) H1: μ > μ0, 2) H1: μ α 이면 귀무가설을 유지한다.
[통계학] 14-3. 통계적 추론의 개요 - 유의수준과 검정력 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 이번에는 지난 글에서 다룬 검정통계량과 오류에서 파생된 유의수준에 대해 다뤄보고자 한다. 우선 예시를 통해 제1, 2종의 오류와 그에 따른 유의수준 및 검정력에 대해 알아보자. 유의수준 유의수준(α) : 제 1종 오류 확률의 최대값 ex) 인구 데이터 X가 정규분포 N(μ, 4)를 따른다고 하자. 이 때 관심이 있는 값은 μ이다. 이 값을 알기 위해 X에서 16개의 표본 X1, ... , X16을 추출했다. 이 정규분포 X1, ... , X16 ~ iid N(μ, 4)를 통해 우리가 주장하는 대립가설은 H1 : μ > 0이며, 귀무가설은 H0 : μ ≤ 0이다. 검정 원칙으로는 'X의 표본평균 x̅ ≥ 0..
[통계학] 14-2. 통계적 추론의 개요 - 검정통계량과 오류 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 오늘은 귀무가설에서 표본이 얼마나 비정상적인지 보이는 방법인 검정통계량에 대해 알아보고, 가설검정을 통해 결론을 낼 때 나타나는 오류의 종류와 내용에 대해 배워보고자 한다. 검정통계량 (test statistic) 귀무가설에서 표본의 비정상성을 결정할 때 사용하는 통계량 더보기 통계량 : 미지의 모수를 포함하고 있지 않은 확률변수, 갖고 있는 확률표본들의 함수 → 확률분포 갖고 있음 → 확률적으로 판정하는 부분에서 사용 * 통계량이 무엇인지 헷갈린다면 더보기를 클릭하세요 * 앞으로 배울 검정통계량은 확률분포를 쉽게 유도할 수 있지만, 실제 분석에서는 알 수 없는 경우 많음 분포를 알고 있는 경우, 통계값이..
[통계학] 14-1. 통계적 추론의 개요 - 가설검정의 원리 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 이번에는 통계적 추론의 또 다른 분야인 통계적 가설검정에 대해 배워보고자 한다. 가설검정 (testing hypotheses) 모집단의 모수 or 분포에 대한 가설(추측, 주장)을 설정하고 그 가설의 옳고 그름을 표본 정보를 통해 확률적으로 판정하는 과정 가설 (hypotheses): 모수, 분포(모집단)에 대한 추측이나 주장 - 귀무가설 (null hypothesis, H0): 검정 대상이 되는 가설 - 대립가설 (alternative hypothesis, H1): 표본으로부터 얻은 정보를 통해 보이고자 하는 가설 → 내가 보이고자 하는 가설은 대립가설, 그 반대는 귀무가설 ex) 새로운 파이는 기존 파..
[통계학] 13-3. 통계적 추론의 개요 - 구간추정과 신뢰구간 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 지난 글에서 추론 목적에 따라 통계적 추론을 하는 방법에서의 추정 방법 중 하나인 점추정 방법에 대해 알아보았다. 이번에는 또 다른 방법인 구간추정에 대해 알아보고자 한다. 구간추정 미지의 모수가 포함될 것으로 기대되는 범위를 확률적(1-α)으로 선택하는 과정 신뢰구간(CI, confidence interval) 관심모수가 Φ일 때, 100(1-α)% 신뢰구간은 P(L
[통계학] 13-2. 통계적 추론의 개요 - 추정법과 점추정량 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅱ 강의를 기반으로 작성되었습니다. 지난 글에서 추론 목적에 따라 통계적 추론을 분리하는 방법 중 추정하는 방식에서 점추정 방법이 있었다. 이번에는 이 점추정량을 어떻게 구하는지, 어떤 성질을 가져야 되는지 등을 알아보고자 한다. 점추정 미지의 모수를 표본의 어떤 함수(=통계량: 미지의 모수를 포함하지 않는 표본에 의해 얻어질 수 있는 정보로만 이뤄진 값)를 통해 어떤 값으로 추정하는 과정 추정방법: 적률법, 최대가능도추정법, 최소제곱법 등 적률법 (Method of Moments) 우선 적률법은 E(X^k)로 나타내는 모멘트를 이용하는 것인데, 대부분 확률분포에서 모수는 기댓값으로 표시한다는 근거로부터 나오게 되었다. 예를 들어, N(μ,..