본문 바로가기

MATH & STATS/STATISTICS

[통계학] 7-3. 확률변수와 확률분포 - 연속확률변수와 확률밀도함수

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

확률밀도함수 (probability density function)
확률을 함수 형태를 표시한 것으로, 연속확률변수에 대해 확률 구조를 나타낸다.
(확률변수의 치역이 실수로 표현된다.)

확률밀도함수

우리는 히스토그램을 다룰 때 밀도에 대해 얘기를 한 적이 있었다. 히스토그램에서의 밀도란 히스토그램의 높이를 의미하며, 이 밀도들이 모여 전체 면적이 1이 된다.
이와 같은 히스토그램을
연속자료로 이뤄진 모집단에서 n을 무한대로 추출한 표본에 대해 그릴 때,
즉, 모집단에 대해서 히스토그램을 그릴 때 x에서의 높이(밀도)f(x)라고 하고 이를 확률밀도함수라고 부른다.

  • 확률밀도에서의 확률 = 확률밀도함수의 면적 (해당 구간에서의 확률)
    따라서 확률밀도함수는 x의 범위에서는 확률을 가지지만, 하나의 값에서는 확률이 0이다.
    즉, 예시를 들자면 P(X=3) = 0 인 것이다.
    또한 P(A) = 0일 때 A는 무조건 공집합이 아니다. 공집합이 아닌 것도 확률이 0이 될 수 있는 것이다.

연속확률변수 성질

확률밀도함수는 x에서의 확률이 아니다.
그 위치에서 상대적으로 얼마나 밀집되어 있는지를 나타낸 것

확률밀도함수의 성질

누적분포함수 (cumulative distribution function)
확률변수 X가 어떤 상수 x보다 작거나 같을 확률을 구한(적분한) 함수
확률밀도함수 세번째 성질의 특수한 형태

누적분포함수 공식

아래 누적분포함수 예시 그래프를 보면,
확률질량함수의 누적분포함수와는 다르게 점프되는 구간이 없는 것을 볼 수 있다.
즉, 이 말은 임의의 점에서의 확률은 0이라는 것을 의미한다. 

누적분포함수의 예

 

반응형