본문 바로가기

MATH & STATS/STATISTICS

[통계학] 1-2. 통계학이란 - 표본추출

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

표본추출의 종류

  • 확률표본추출 (probability sampling)
    모집단 구성요소에 대해 표본으로 추출될 확률을 알 수 있는 추출법
    ex) 모집단이 총 10개로 구성되어 있을 때 3개의 표본을 뽑는 경우, 어떤 개체가 표본으로 뽑힐 확률 = 3/10
    - 단순확률추출
    - 계통추출
    - 집락추출
    - 층화추출
  • 비확률표본추출 (non-probability sampling)
    모집단 구성요소에 대해 표본으로 추출될 확률을 알 수 없는 추출법
    - 편의추출 : 자발적 참여, 길거리에서 조사, 인터넷 설문조사
    - 유의추출 : 전문가들 섭외해서 조사
    - 할당추출 : 조사할 대상을 보고 분류별로 차이가 있을 것 같으면 잘라서 선택. 무작위 과정 없음

모집단의 종류

  • 목표모집단 (target population)
    관심대상이 되는 모든 집합
  • 조사(가능)모집단 (survey population, accessible population)
    표본추출틀을 통해 추출될 수 있는 대상 집합

확률표본추출방법

  • 단순확률추출법 (단순무작위추출법, simple random sampling(SRS))
    N개 모집단에서 n개 표본을 무작위 추출
    표본추출방법의 기초이지만 실제 조사에서는 사용 X
  • 계통추출법 (systematic sampling)
    전체를 k 단위로 구간을 나눠 구간마다 표본 추출
    k = N/n 또는 상황에 따라 정확도를 고려하여 임의로 결정
    1~k에서 랜덤으로 시작점 선택한 뒤 k를 반복적으로 더해서 표본 추출
    표집틀이 없어서 고유번호를 부여하기 어려운 경우에 사용 (선거출구조사 등)
  • 층화확률추출법 (stratified random sampling)
    모집단을 여러 층으로 나누고 각 층에서 단순확률추출로 표본 추출
    부모집단 구성내역 알고 있는 경우, 부모집단 간 특성에 차이가 있는 경우에 사용
    ex) 서울시내 서점의 월 매출액을 알기 위해 100개 서점을 표본추출하는데, 대형 서점이 얼마나 뽑혔는지에 따라 결과가 달라질 수 있으므로 '대형/중형/소형'으로 분류하고 각 분류마다 표본추출
    층의 비율이 맞지 않으면 가중치 반영
  • 집락추출 (cluster sampling)
    서로 비슷한 요소끼리 묶어 군집을 추출하고, 군집 내에서 조사
    표집틀 확보가 어려운 경우, 군집에 대해서는 표집틀 확보가 쉬우므로 사용
    또는 관측비용이 증가될 경우 사용 (지역이 산재되어 있는 경우 지역적으로 집중되도록 표본추출)
    PSU(Primary Sampling Unit) 이용
    ex)서울시 고등학생 월평균 사교육비 추정 위해 고등학교 먼저 추출한 뒤, 각 학급에서 학생 추출
반응형