본문 바로가기

MATH & STATS/STATISTICS

[통계학] 2-2. 일변량 자료 기술통계 - 범주형 자료 정리

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

이번에는 범주형 자료 중 일변량 자료에 대해 나타내는 방법을 알아보고자 한다.

도수분포표 (Frequency table)
각 범주에 몇 개의 관측 개체가 있는지 나타냄
- 도수 : 범주에 속한 개체 수 (빈도 수)
- 상대도수 : 전체자료 중 해당 범주에 속한 개체 비율

도수분포표 예시 : 성적분포

순서자료의 경우 범주가 한 방향으로 진행되기 때문에 누적시켜 표시할 수 있다.

그래프를 이용한 자료정리

  • 막대 그래프 (bar chart)
    비교를 목적으로 할 때 사용
    Cleveland에 의하면 사람들이 동일 척도에서의 위치, 길이, 각도, 기울기, 면적, 부피, 색상, 밀도 순으로 차이에 대해 인지하기 때문에 비교를 할 때는 원 도표보다는 위치, 길이를 활용한 막대 그래프가 좋음
  • 원 도표 (pie chart)
    원에 각 범주에 해당되는 비율만큼 각도 분할하여 표시 (각도 = 비율 * 360도)
    면적에 비례하여 색상, 짙은 농도를 표현하기도 함
    범주가 너무 많을 경우에는 비추천
    • ex) 나이팅게일 로즈 다이어그램
      1854.04~1856.03 크림전쟁 이스트지역에서 사망한 사병들의 사인(부상, 질병 등) 분류하여 정리
      각 원인별 사망자 수를 면적으로 표시
      한 지역을 제외하고는 대부분 질병에 의해 사망한 경우가 많은 것을 보여주며
      병원환경개선 필요성의 근거자료로 활용됨

빨강: 부상 / 파랑: 질병 / 검정: 기타 로 구분하여 표현

시각화의 중요성

Minard's graphic diagram (1868)

위 그림은 Charles Joseph Minard가 색상 명도, 선 굵기 등을 통해 병력 숫자를 표시함으로써 나폴레옹 전쟁 상황을 나타낸 것이다. 단순히 줄글로 되어 있는 것보다 그래프를 통해 시각화하는 것이 더 전달력이 뛰어나다는 것을 보여준 대표적 예시이다.

반응형