1. 다차원척도법 (MDS, MultiDimensional Scaling)
- 객체간 근접성 시각화하는 통계기법
- 개체들 대상 변수들 측정 후 유사성/비유사성 측정하여 2, 3차원 공간 상에 표현
- 개체들 사이 집단화를 시각적으로 표현
2. 다차원척도법 목적
- 데이터 속 잠재되어 있는 패턴, 구조 찾아냄 → 소수 차원의 공간에 기하학적으로 표현
- 데이터 축소 목적 : 데이터에 포함된 정보 추출하기 위한 탐색 수단으로 사용
- 얻은 결과를 데이터가 만들어진 현상이나 과정에 고유 구조로서 의미 부여
3. 다차원척도법 방법
- 개체들의 거리 계산 : 유클리드 거리
- 적합도를 스트레스 값으로 나타냄 : 관측대상의 상대적 거리 정확도를 높이기 위함
- 부적합도 기준으로 STRESS 또는 S-STRESS 사용 : 각 개체들을 공간 상에 표현하기 위함
- 부적합도 최소로 하는 반복알고리즘 이용 : 일정 수준 이하로 될 때 최종 적합 모형으로 제시
4. 다차원척도법 종류
- 계량적 MDS : 데이터가 구간/비율 척도인 경우
> loc <- cmdscale(data)
> x <- loc[,1]
> y <- loc[,2]
> plot(x, y, type="n", asp=1, main="Metric MDS"
> text(x, y, rownames(loc), cex=0.7)
> abline(v=0, h=0, lty=2, lwd=0.5) - 비계량적 MDS : 데이터가 순서척도인 경우
> mds <- isoMDS(data.dist)
> plot(mds$points, type="n")
> text(mds$points, labels=as.character(1:nrow(data)))
> abline(v=0, h=0, lty=2, lwd=0.5)
출처 : ADsP 데이터 분석 준전문가 (윤종식 저)
반응형
'DATA SCIENCE > ADSP' 카테고리의 다른 글
[ADsP] 3-5. 정형 데이터 마이닝 (1) 개요 (0) | 2020.06.06 |
---|---|
[ADsP] 3-4. 통계 분석 (6) 주성분 분석 (0) | 2020.06.06 |
[ADsP] 3-4. 통계 분석 (4) 시계열 분석 (0) | 2020.06.06 |
[ADsP] 3-4. 통계 분석 (3) 회귀 분석 (0) | 2020.06.06 |
[ADsP] 3-4. 통계 분석 (2) 기초 통계 분석 (0) | 2020.06.06 |