본문 바로가기

DATA SCIENCE/ADSP

[ADsP] 3-4. 통계 분석 (5) 다차원척도법 MDS

1. 다차원척도법 (MDS, MultiDimensional Scaling)

  • 객체간 근접성 시각화하는 통계기법
  • 개체들 대상 변수들 측정 후 유사성/비유사성 측정하여 2, 3차원 공간 상에 표현
  • 개체들 사이 집단화를 시각적으로 표현

2. 다차원척도법 목적

  • 데이터 속 잠재되어 있는 패턴, 구조 찾아냄 → 소수 차원의 공간에 기하학적으로 표현
    • 데이터 축소 목적 : 데이터에 포함된 정보 추출하기 위한 탐색 수단으로 사용
    • 얻은 결과를 데이터가 만들어진 현상이나 과정에 고유 구조로서 의미 부여

3. 다차원척도법 방법

  • 개체들의 거리 계산 : 유클리드 거리
  • 적합도를 스트레스 값으로 나타냄 : 관측대상의 상대적 거리 정확도를 높이기 위함
  • 부적합도 기준으로 STRESS 또는 S-STRESS 사용 : 각 개체들을 공간 상에 표현하기 위함
  • 부적합도 최소로 하는 반복알고리즘 이용 : 일정 수준 이하로 될 때 최종 적합 모형으로 제시

4. 다차원척도법 종류

  • 계량적 MDS : 데이터가 구간/비율 척도인 경우
    > loc <- cmdscale(data)

    > x <- loc[,1]
    > y <- loc[,2]
    > plot(x, y, type="n", asp=1, main="Metric MDS"
    > text(x, y, rownames(loc), cex=0.7)
    > abline(v=0, h=0, lty=2, lwd=0.5)
  • 비계량적 MDS : 데이터가 순서척도인 경우
    > mds <- isoMDS(data.dist)
    > plot(mds$points, type="n")
    > text(mds$points, labels=as.character(1:nrow(data)))
    > abline(v=0, h=0, lty=2, lwd=0.5)

 

출처 : ADsP 데이터 분석 준전문가 (윤종식 저)

반응형