이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.
자료의 통계분석 방법은 분석하고자 하는 자료의 속성이나 분석 목적에 따라 달라진다.
- 변수
- 일변량 자료 : 변수 1개
- 다변량 자료 : 변수 여러개 (변수들 간 관련성 유무 파악해야 함)
- 관측개체 (관측값)
기본적으로 기초통계에서는 서로 관련성이 없다고 보지만, 시계열분석 등에서는 관측개체 간에 연관 있음
자료의 분류
- 범주형 자료 (categorical data)
- 명목 자료 (nominal data)
단순한 범주 표시 (숫자로 표시되어 있더라도 값이 크고 작음을 나타내는 것이 아님)
ex) 혈액형, 성별(주민번호 뒷자리 시작) - 순서 자료 (ordinal data)
범주의 순서가 상대적으로 비교가 가능한 경우
ex) 비만도, 선호도, 학점
범주화를 통해 수치형 자료를 순서 자료로 바꾸는 경우도 있음
ex) 비만도 지수 BMI를 구간에 따라 저체중, 정상, 과체중, 비만, 고도비만으로 분류
- 명목 자료 (nominal data)
- 수치형 자료 (numerical data)
- 이산 자료 (discrete data)
셀 수 있는(countable) 형태의 자료
범주형 자료의 발생 빈도를 나타내기도 함 - 연속 자료 (continuous data)
연속적인 속성을 가지는 자료
이산화를 통해 작은 단위로 잘라서 절사된 형태로 표시
- 이산 자료 (discrete data)
더보기
수치형 자료들을 범주화하면 순서 자료가 되거나 범주형 자료를 묶어서 이산 자료로 나타낼 수 있는 등
상황에 따라 변환될 수 있음
* 위쪽으로 올라갈수록 정보의 손실 있음
척도에 따라 명목, 순서, 구간, 비율척도로 나눠 분석하기도 함
반응형
'MATH & STATS > STATISTICS' 카테고리의 다른 글
[통계학] 2-3. 일변량 자료 기술통계 - 수치형 자료 정리 (0) | 2020.03.01 |
---|---|
[통계학] 2-2. 일변량 자료 기술통계 - 범주형 자료 정리 (0) | 2020.03.01 |
[통계학] 1-3. 통계학이란 - 가중치 (0) | 2020.03.01 |
[통계학] 1-2. 통계학이란 - 표본추출 (0) | 2020.03.01 |
[통계학] 1-1. 통계학이란 - 모집단과 표본 (0) | 2020.03.01 |