이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.
이번에는 범주형 자료 중 일변량 자료에 대해 나타내는 방법을 알아보고자 한다.
도수분포표 (Frequency table)
각 범주에 몇 개의 관측 개체가 있는지 나타냄
- 도수 : 범주에 속한 개체 수 (빈도 수)
- 상대도수 : 전체자료 중 해당 범주에 속한 개체 비율
순서자료의 경우 범주가 한 방향으로 진행되기 때문에 누적시켜 표시할 수 있다.
그래프를 이용한 자료정리
- 막대 그래프 (bar chart)
비교를 목적으로 할 때 사용
Cleveland에 의하면 사람들이 동일 척도에서의 위치, 길이, 각도, 기울기, 면적, 부피, 색상, 밀도 순으로 차이에 대해 인지하기 때문에 비교를 할 때는 원 도표보다는 위치, 길이를 활용한 막대 그래프가 좋음 - 원 도표 (pie chart)
원에 각 범주에 해당되는 비율만큼 각도 분할하여 표시 (각도 = 비율 * 360도)
면적에 비례하여 색상, 짙은 농도를 표현하기도 함
범주가 너무 많을 경우에는 비추천
- ex) 나이팅게일 로즈 다이어그램
1854.04~1856.03 크림전쟁 이스트지역에서 사망한 사병들의 사인(부상, 질병 등) 분류하여 정리
각 원인별 사망자 수를 면적으로 표시
한 지역을 제외하고는 대부분 질병에 의해 사망한 경우가 많은 것을 보여주며
병원환경개선 필요성의 근거자료로 활용됨
- ex) 나이팅게일 로즈 다이어그램
시각화의 중요성
위 그림은 Charles Joseph Minard가 색상 명도, 선 굵기 등을 통해 병력 숫자를 표시함으로써 나폴레옹 전쟁 상황을 나타낸 것이다. 단순히 줄글로 되어 있는 것보다 그래프를 통해 시각화하는 것이 더 전달력이 뛰어나다는 것을 보여준 대표적 예시이다.
반응형
'MATH & STATS > STATISTICS' 카테고리의 다른 글
[통계학] 3-1. 일변량 자료에 대한 수치적 기술통계 - 수치자료 분포의 중심위치 : 평균 (0) | 2020.03.01 |
---|---|
[통계학] 2-3. 일변량 자료 기술통계 - 수치형 자료 정리 (0) | 2020.03.01 |
[통계학] 2-1. 일변량 자료 기술통계 - 자료의 분류와 특성 (0) | 2020.03.01 |
[통계학] 1-3. 통계학이란 - 가중치 (0) | 2020.03.01 |
[통계학] 1-2. 통계학이란 - 표본추출 (0) | 2020.03.01 |