본문 바로가기

MATH & STATS/STATISTICS

[통계학] 7-1. 확률변수와 확률분포 - 확률변수

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

이번에는 확률변수와 확률분포에 대해 알아보고, 이를 통해 통계학에서 세상을 어떤 시각으로 보는지 이해하고자 한다.

더보기

통계학은 불확실성을 제거하는 것이 아니라, 불확실성을 수학적으로 모델링하는 학문이다.
이 말이 무엇인지에 대해 알아가보자.

 

  • 확률 변수 (random variable)
    표본공간에서 정의된 실함수(real-valued function)로, 정의역이 표본공간이고 공역이 실수인 함수
    불확실한 현상을 수학적 모형으로 만들어 구체적으로 계량화된 분석을 하게 해주는 것
    (불확실성을 가지는 사회적, 자연적 현상 = 확률실험으로 이해하는 것으로, 불확실성을 제거하는 것은 아니다.)
    표본공간 값을 숫자로 바꾼 함수로, 확률변수가 어떤 값을 가진다 = 표본공간 내 대응하는 원소가 존재함을 의미
    일반적으로 확률변수는 X, Y, Z 등으로 ((w)는 생략함), 확률변수 값은 x, y, z 등으로 표시

확률 변수

ex) 윷 하나가 젖혀질 때까지 윷을 던지는 확률 실험
젖혀지면 S, 엎어지면 F / (X, Y) = (윷을 던진 횟수, 엎어진 수)
Ω = {S, FS, FFS, FFFS, ... } = {(1,0), (2,1), (3,2), (4,3), ... }

  • 이산 확률 변수 (discrete random variable)
    확률 변수가 가질 수 있는 값이 셀 수 있는(countable) 경우
    확률질량함수를 이용하여 모집단 확률구조 표시
    ex) 불량품 개수, 사고 건 수 등
  • 연속 확률 변수 (continuous random variable)
    확률 변수가 가질 수 있는 값이 셀 수 없을 정도로 많은 경우
    확률밀도함수를 이용하여 모집단 확률구조 표시
    ex) 수명, 키, 체중

확률변수의 수식 표현

  • X = x : 표본공간 상 { w | X(w) = x, w ∈ Ω } 를 만족하는 사건 존재
  • 임의의 상수 a, b에 대해 a ≤ X ≤ b : 표본공간 상 { w | a ≤ X(w) ≤ b, w ∈ Ω } 를 만족하는 사건 존재
  • 확률변수 대해 X=x, a ≤ X ≤ b 에 대응하는 확률 계산 가능
  • 확률분포 (probability distribution)
    확률변수의 값에 대해 확률을 나타낸 것으로, [0, 1] 사이의 범위를 가짐
    모집단을 숫자로 표시했을 때의 형태 (=모집단의 확률 구조)

ex) 동전 세 번 던질 때 앞면(H)이 X개 나올 확률
P(X=0) = P({TTT}) = P(X=3) = P({HHH}) = 1/8
P(X=1) = P({HTT, THT, TTH}) = P(X=2) = P({HHT, HTH, THH}) = 3/8

 

반응형