본문 바로가기

MATH & STATS/STATISTICS

[통계학] 6-4. 조건부 확률 - 베이즈 정리

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

이번에는 조건부 확률의 주요 이론인 베이즈정리(Bayes' theorem)에 대해 알아보고자 한다.

우선, 지금까지 다룬 내용은 다음과 같다.

  • 코호트 연구 (Cohort Study)
    P(B|A)를 순서적으로 생각하면 사건 A가 먼저 발생한 뒤 B가 이어서 발생할 확률을 말한다.
    즉, A가 원인이고 B가 결과인 전향적 연구(prospective study) 형태
  • 사전확률 (prior probability)
    원인의 가능성인 P(A) or P(A^c)
    사건 B가 관측되기 이전의 확률
  • 사례-대조연구 (case-control study)
    결과를 얻은 상태에서 결과가 발생하게 된 원인을 역으로 추정하는 후향적 연구(retrospective study)
    이 때 결과 B를 관측했을 때 원인이 A일 사건의 확률을 P(A|B)로 나타낼 수 있다.
  • 사후확률 (posterior probability)
    사건 B가 관측된 후 A의 확률

ex) 암진단
암에 걸렸을 때 양성 나올 확률 P(+|A) = 0.96
암에 걸리지 않았을 때 양성 나올 확률 P(+|A^c) = 0.05
이 때 양성반응이 나왔을 때 암에 걸렸을 확률 P(A|+)을 알기 위해서는 베이즈 정리가 필요!

  • 베이즈 정리 (Bayes' theorem)
    원인과 결과 형태의 문제에서 결과에 대한 원인을 분석할 때 사용하며, 공식은 다음과 같다.

베이즈 정리 공식
베이즈 정리의 일반식

다시 위의 예제로 돌아가보면,
베이즈 정리를 이용하기 위해서는 P(A), 즉 표본에서 암에 걸릴 확률에 대한 사전정보가 있으면 된다.
만약 P(A)=0.001이라면, P(A|+) = 0.001*0.96 / (0.001*0.96+0.999*0.05) = 0.01886으로
암일 가능성은 양성 결과가 나오기 전보다 약 19배 정도 더 높아진다.

 

반응형