이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.
이번에는 모집단의 분산과 표준편차를 계산하는 방법에 대해 알아보도록 한다.
우선 표본에서의 분산을 어떻게 구하는지 다시 살펴보자.
표본크기가 n이고 표본이 가질 수 있는 값 x_i와 그 값을 가지는 표본 수를 n_i이라고 하면
표본분산 s^2는 다음과 같이 나타낼 수 있다.
여기에서 n을 계속 크게 만들면 아래와 같이 값들이 변할 것이며, 표본분산은 모분산으로 될 것이다.
따라서 모분산은 다음과 같이 나타낼 수 있다.
또한 모표준편차의 경우 모분산에 루트를 씌워 다음과 같이 표현한다.
이제 확률변수의 분산 Var(X)에 대해 알아보자.
먼저 이산확률변수의 경우 다음과 같이 나타낼 수 있다.
연속확률변수의 경우에도 이산확률변수와 거의 동일한데, 시그마(Σ) 대신 적분이 나온다.
그리고 확률변수의 분산에 대한 연산은 다음과 같이 이뤄지는데,
위치의 변화를 주는 상수 b는 분산에 영향을 주지 않으며,
분산은 측정단위의 제곱을 나타내는 것이기에 변수에 곱해지는 값의 제곱이 곱해진다.
표준편차는 루트를 씌우는 것이므로 다음과 같이 나타나진다.
이제 균일분포에 대한 예시를 통해 계산방법을 알아보자.
구간 (0,1)에서 균등하게 분포되어 있는 균일분포(uniform distribution)에 대해 계산하면 아래와 같다.
반응형
'MATH & STATS > STATISTICS' 카테고리의 다른 글
[통계학] 8-3. 확률벡터 - 공분산과 상관계수 (0) | 2020.03.07 |
---|---|
[통계학] 8-2. 확률벡터 - 결합분포와 주변분포 (0) | 2020.03.07 |
[통계학] 7-4. 확률변수와 확률분포 - 확률변수의 기댓값 (0) | 2020.03.07 |
[통계학] 7-3. 확률변수와 확률분포 - 연속확률변수와 확률밀도함수 (0) | 2020.03.06 |
[통계학] 7-2. 확률변수와 확률분포 - 이산확률변수와 확률질량함수 (0) | 2020.03.06 |