본문 바로가기

MATH & STATS/STATISTICS

[Peebles] 2. 랜덤변수 (1) 랜덤변수의 개념과 분포함수, 밀도함수

랜덤변수(random variable)이란, 표본 공간 S의 원소들의 실수 함수로 S의 각 점을 실선상의 어떠한 점으로 대응시키는 함수이다.

랜덤변수가 되기 위해서는 아래의 3가지의 조건을 만족해야 한다.

  1. S에서의 각 점은 랜덤변수가 가질 수 있는 값 중 하나의 값에만 대응되어야 한다.
  2. 집합 {X ≤ x}는 랜덤변수 X(s)가 x를 넘지 않는 것에 해당하는 표본 공간에 있는 점들 s에 대응한다.
  3. P{X=-∞} = P{X=∞} = 0

랜덤변수에는 3가지 종류가 있다.

  • 이산(discrete) 랜덤변수 : 이산적인 값만 가지는 랜덤변수
    • 표본공간 : 이산 / 연속 / 이산과 연속인 점들의 혼합
  • 연속(continuous) 랜덤변수 : 연속적인 값의 범위를 가지는 랜덤변수
    • 표본공간 : 연속
    • (이산 표본공간이 될 수 없는 이유 : 모든 랜덤변수들은 모든 표본 공간점의 단일값 함수가 되어야 한다는 조건 때문)
  • 혼합(mixed) 랜덤변수 : 어느 값들은 이산적, 또 다른 값들은 연속적

 

(누적 확률) 분포함수 : 사건 {X ≤ x}의 확률 --> FX(x) = P{X ≤ x}

분포함수가 가지는 성질은 다음과 같다.

더보기
  1. FX(-∞)=0
  2. FX(∞)=1
  3. 0≤FX(x)≤1
  4. 만약 x1<x2이면 FX(x1)≤FX(x2)
    • x에 대해 감소하지 않는 함수라는 의미를 담고 있음
  5. P{x1<X<x2} = FX(x2)-FX(x1)
    • {X≤x2} = {X≤x1} ∪ {x1<X≤x2}
    • P{X≤x2} = P{X≤x1} + P{x1<X≤x2}
  6. FX(x+)=FX(x)
    • FX(x)가 오른쪽으로부터 연속인 함수

 

성질 중 1, 2, 4, 6은 임의의 함수 GX(x)가 유효한 분포함수인지 확인하기 위한 시험으로 이용한다.

X가 이산 랜덤변수이면 FX(x)는 계단형으로 나타나며, 식으로 표현하자면 단위 계단 함수를 이용할 수 있다.

FX(x) = ∑P(xi)u(x-xi)

여기에서 u(x) = x≥0일 때 1, x<0일 때 0인 단위 계단 함수(unit-step function)이다.

 

확률 밀도함수(probability density function) : 분포함수의 미분

fX(x) = dFX(x) / dx

존재성 :

FX(x)의 미분이 존재하지 않을 경우(ex: 경사에서 급격히 변하는 점), 계단형 불연속점을 가진 함수로서 fX(x)를 그린다.

이 때 도함수를 나타내기 위해 단위 임펄스(unit-impulse) 함수 δ(x)를 도입하여 정의한다.

fX(x) = ∑P(xi)δ(x-xi)

더보기

여기에서 단위 임펄스 함수에 대해 좀 더 알아보자. 단위 임펄스 함수는 적분 성질에 의해 ∮(x0) = ∫∮(x)δ(x-x0)dx 와 같이 정의할 수 있으며, 여기에서 ∮(x)는 x=x0에서 연속인 임의의 함수이다. 다시 말하자면, δ(x)는 높이가 무한대, 면적이 1, 너비가 0인 함수이다. 

단위 임펄스 함수와 단위 계단 함수는 아래와 같은 성질을 가진다.

δ(x) = du(x) / dx ⇔ δ(ξ)dξ = u(x) (적분 범위 : -∞ ~ x)

위와 같은 성질로 인해 x=x0에서 단위 계단 함수의 진폭과 같은 높이의 수직 화살표로 나타낸다.

즉, 이산 랜덤변수에 대한 밀도함수는 분포함수의 계단점에서의 미분을 나타내기 위해 단위 임펄스 함수를 이용한다.

 

밀도함수의 4가지 성질은 아래와 같다.

  1. 모든 x에 대하여 fX(x) ≥ 0
  2. ∫fX(x)dx = 1 (적분 범위 : -∞ ~ ∞)
  3. FX(x) = ∫fX(ξ)dξ (적분 범위 : -∞ ~ x)
  4. P{x1<X≤x2} = ∫fX(x)dx (적분 범위 : x1 ~ x2)

 

반응형