본문 바로가기

MATH & STATS/STATISTICS

[통계학] 4-2. 다변량 자료 기술통계 - 비교그림과 산점도

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

이번 시간에는 범주형과 수치형 자료가 섞여있는 경우 또는 모두 수치형 자료인 경우에 대해 어떻게 정리하고 관계를 표현할지 알아보고자 한다.

표를 이용한 그룹별 수치자료 정리

범주형(일종의 그룹을 나타내는 분류 자료) + 수치형일 때 그룹 간 비교가 목적인 경우

  • 수치자료 특성을 나타내는 값을 그룹별로 정리
  • 표본크기, 평균, 표준편차 이용

그래프를 이용한 비교

  • 점도표, 히스토그램(막대그래프) 등 중첩 or 병렬 비교

출처 : kosis.kr

  • 상자그림(box plot) 그룹별 비교

지방선거 정당 box plot 비교

  • 산점도
    수치자료들을 순서쌍으로 표현하여 수치 변수들 간 관계 유도

육상 100미터 올림픽 우승기록

  • 산점도 행렬
    3개 이상의 수치변수를 두 변수씩 쌍으로 조합해서 산점도를 행렬 형태로 표시

우리나라 월간 평균기온, 강수량, 평균습도 간 관계 표시

  • 시계열그림 (time series plot)
    시간에 따라 수집된 시계열자료는 자료 간 종속성이 존재할 수 있으므로 관측순서가 중요
    x축에 관측시점, y축에 관측값을 표시

월별 하루 평균 출생아 수

 

반응형