본문 바로가기

MATH & STATS/STATISTICS

[통계학] 3-1. 일변량 자료에 대한 수치적 기술통계 - 수치자료 분포의 중심위치 : 평균

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

  • 표본 평균 (sample mean)
    표본의 합을 표본 크기로 나눈 값

표본평균

표본 평균 = 무게중심
무게중심 (w: 질량 - 여기에서는 질량이 동일하다고 가정)
n개의 자료 중 x1~xm이 a보다 작을 경우

편차의 합 = 0

  • 표본 비율 (sample proportion)
    일종의 표본 평균
    i번째 관측값이 관심 범주에 속하면 1, 아니면 0으로 표시한 후
    y = x값들의 합 (해당 범주에 포함된 표본 수) 으로 나타냄

표본비율 = 표본평균

이상치(outlier) - 평균이 항상 중심 위치로 적절한가?
대부분의 관측값으로부터 멀리 떨어져 있는 관측값의 일부로,
이상치 포함 여부에 따라 표본평균 값에 차이가 커짐 (평균은 이상치에 robust하지 않음)
대체 통계값으로 중앙값, 절사평균, 최빈값 등 이용

 

  • 가중 평균 (weighted mean)
    각 데이터마다 가중치가 다른 경우 (무게중심에서 질량이 다른 경우)

W = w의 합

  • 기하 평균 (geometric mean)
    가지고 있는 값에 배수가 곱해지는 것을 곱한 뒤 그 개수만큼 n분의 1 제곱
    ex) 수익률이 1월에는 28%, 2월에는 -28%인 경우 평균 수익률은? (0%가 아님)
         1인당 총 소득이 30년 전에는 209만 원, 현재는 3093만 원일 때 연평균 증가율은?

곱해지는 것이기 때문에 x는 항상 양수여야 함

  • 조화 평균 (harmonic mean)
    역수들의 산술평균의 역수
    ex) 거리의 반은 60km/h, 나머지 거리는 40km/h로 갔을 때 평균 속력은? (50km/h 아님)

더보기

기하평균, 조화평균은 왜 나온 것일까?

기하평균 : 가로, 세로 길이가 각각 a, b인 직사각형과 넓이가 같은 정사각형 한 변의 길이 = √ab 에서 유래
조화평균 : 현악기에서 음을 낼 때 한 옥타브 높게 내려면 현 길이를 1/2로 줄이며, 1과 1/2의 조화평균인 2/3만큼 현의 길이가 되면 5도 높은 음이 나와 조화로운 5도 화음이 나타난다는 것에서 유래

출처) https://blog.naver.com/PostView.nhn?blogId=forfriend5&logNo=220471155333&proxyReferer=https%3A%2F%2Fwww.google.com%2F

 

반응형