이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.
이번에는 조건부 확률의 주요 이론인 베이즈정리(Bayes' theorem)에 대해 알아보고자 한다.
우선, 지금까지 다룬 내용은 다음과 같다.
- 코호트 연구 (Cohort Study)
P(B|A)를 순서적으로 생각하면 사건 A가 먼저 발생한 뒤 B가 이어서 발생할 확률을 말한다.
즉, A가 원인이고 B가 결과인 전향적 연구(prospective study) 형태 - 사전확률 (prior probability)
원인의 가능성인 P(A) or P(A^c)
사건 B가 관측되기 이전의 확률 - 사례-대조연구 (case-control study)
결과를 얻은 상태에서 결과가 발생하게 된 원인을 역으로 추정하는 후향적 연구(retrospective study)
이 때 결과 B를 관측했을 때 원인이 A일 사건의 확률을 P(A|B)로 나타낼 수 있다. - 사후확률 (posterior probability)
사건 B가 관측된 후 A의 확률
ex) 암진단
암에 걸렸을 때 양성 나올 확률 P(+|A) = 0.96
암에 걸리지 않았을 때 양성 나올 확률 P(+|A^c) = 0.05
이 때 양성반응이 나왔을 때 암에 걸렸을 확률 P(A|+)을 알기 위해서는 베이즈 정리가 필요!
- 베이즈 정리 (Bayes' theorem)
원인과 결과 형태의 문제에서 결과에 대한 원인을 분석할 때 사용하며, 공식은 다음과 같다.
다시 위의 예제로 돌아가보면,
베이즈 정리를 이용하기 위해서는 P(A), 즉 표본에서 암에 걸릴 확률에 대한 사전정보가 있으면 된다.
만약 P(A)=0.001이라면, P(A|+) = 0.001*0.96 / (0.001*0.96+0.999*0.05) = 0.01886으로
암일 가능성은 양성 결과가 나오기 전보다 약 19배 정도 더 높아진다.
반응형
'MATH & STATS > STATISTICS' 카테고리의 다른 글
[통계학] 7-2. 확률변수와 확률분포 - 이산확률변수와 확률질량함수 (0) | 2020.03.06 |
---|---|
[통계학] 7-1. 확률변수와 확률분포 - 확률변수 (0) | 2020.03.05 |
[통계학] 6-3. 조건부 확률 - 독립사건 (0) | 2020.03.04 |
[통계학] 6-2. 조건부 확률 - 조건부 확률 (0) | 2020.03.04 |
[통계학] 6-1. 조건부 확률 - 확률의 정리 (0) | 2020.03.04 |