본문 바로가기

MATH & STATS/STATISTICS

[통계학] 9-2. 주요 이산확률분포 - 이항분포

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

이번 시간에는 베르누이 확률분포를 이용해서 파생되는, 이산형분포의 대표적인 분포인 이항분포의 성질에 대해 알아보자.

이항분포 (Binomial distribution)

성공할 확률이 p인 베르누이 실험을 n번 반복했을 때, 성공 횟수(X)의 분포
Xi~B(p)라고 할 때, 성공 횟수 X는 n개의 베르누이 확률변수 합으로 표시한다.

이항분포 예시

이항분포의 기댓값과 분산을 나타내면 다음과 같다.
이 때 이항분포에서 베르누이 시행은 서로 독립적으로 일어난다는 성질을 기억해야 한다.

이항분포의 기댓값, 분산, 표준편차

ex) 주사위 세 번 던질 때(n=3), X=1이 나온 횟수 구하기 (1이면 S, 아니면 F)

주사위 3번 던질 때 X=1이 나올 확률

위의 예제와 같이, 시행횟수가 n번이고 성공확률이 p인 이항분포의 확률질량함수는 다음과 같이 나타난다.
시행횟수 n과 성공확률 p에 따라 확률이 달라지며 분포의 형태를 바꾼다.
이렇게 분포의 특성을 결정하는 값을 모수(parameter)라고 부른다.

이항분포 확률질량함수

그렇다면 어떻게 n과 p에 따라 달라지는지 아래 예시 그림을 통해 알아보자.
또한 통상적으로 통계에서는 데이터를 통해 추론하여 p가 얼마일지 구하는 식의 문제가 나온다.

n, p 값에 따라 달라지는 분포 형태

ex) 어떤 항암제 완치율 p = 0.5, 임상시험 환자 수 n = 15

p=0.5, n=15의 예시 문제

이제 여러 확률변수가 더해진 이항분포에 대해 살펴보자.
X~B(p), Y~B(p)이고 X와 Y가 독립이면 X+Y는 n=2번 실행한 이항분포로 X+Y~B(2,p)가 된다.
마찬가지로 X~B(n,p), Y~B(n,p)이고 X와 Y가 독립이면 X+Y~B(m+n,p)로 나타낼 수 있다.

ex) 윷이 젖혀질 확률 p = 0.4, A는 4번 던지고 B는 6번 던질 때 두 사람이 던진 윷 중 2개 이하가 젖혀질 확률은?
A가 던진 윷 중 젖혀진 윷의 수 : X~B(4, 0.4), B가 던진 윷 중 젖혀진 윷의 수 : Y~B(6, 0.4) --> W = X+Y ~ B(10, 0.4)

만약 큰 n의 값에 비해 x이 상대적으로 작다면?
이 경우, 비복원효과가 적게 나타난다. 따라서 이항분포를 베르누이 실험으로 근사하여 계산해도 무방하다.

 

반응형