본문 바로가기

MATH & STATS/STATISTICS

[통계학] 10-2-1. 주요 이산확률분포 - 기하분포

이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다.

이번에는 베르누이 실행의 또 다른 응용 형태인 기하분포에 대해 알아보고자 한다.

기하분포 (Geometric Distribution)

성공 확률이 p인 베르누이 시행을 성공할 때까지 시행하는 경우 실패횟수(또는 시행횟수)에 대한 분포
표본공간 = {S, FS, FFS, FFFS, ... }이며, X~Geo(p)로 나타낸다.
확률질량함수는 다음과 같으며, 제 1항이 p이고 공비가 1-p인 등비급수 형태이다.
또한 분포 값에 1을 더하면(X+1) 시행횟수가 되며, 이에 대한 확률질량함수는 아래와 같다.

기하분포에서의 확률을 다루려면 우선 등비급수의 합에 대해 알아야 한다.
등비급수의 합은 다음과 같이 구할 수 있다.

등비급수의 합

이제 기하분포 확률에 대해 알아보자.
x+1번째 이전에 성공할 확률은 P(X x)로 나타내며, 등비급수의 합을 이용해 다음과 같이 구할 수 있다.
그리고 x+1번째 시행 이후에 성공할 확률, 즉 x번째까지 실패할 확률 P(X ≥ x)도 구할 수 있다.

기하분포 확률 (실패횟수 관점)

이를 통해 기하분포의 성질인 무기억성(memoryless)에 대해 알아보자.
x번째까지 실패했다고 할 때, 다음 시행(x+1번째)에서의 성공확률은 아래와 같이 계산할 수 있으며, 결과적으로 원래 확률인 p가 나온다.
즉, 이전에 해왔던 일을 기억하지 않는다고 하여 무기억성을 지닌다고 한다.
예를 들어, 동전 던지기를 할 때 5번 연속으로 뒷면이 나왔다고 해도 6번째가 앞면일 확률은 그대로 0.5인 것이다.
이러한 무기억성은 이산형 분포에서는 기하분포가, 연속형 분포에서는 지수분포가 지니고 있다. 이를 통해 여러 현상을 모델링할 때 사용할 수 있다.

무기억성의 성질 : 성공확률은 항상 동일

이제 실패횟수가 아닌 시행횟수 Y(=X+1)의 확률에 대해 알아보자.
x번째 실험 이전에 성공할 확률은 P(Y ≤ x)로 나타낼 수 있으며, 이는 P(X  x-1)로 나타낼 수 있다.
이를 y에 대해 표현하면 아래와 같이 정리할 수 있다.
또한 y+1번째 시행 이후에 성공할 확률은 P(Y > y)이며 계산하는 과정은 다음과 같다.

기하분포 확률 (시행횟수 관점)

기하분포의 기댓값은 다음과 같이 계산할 수 있다.

기하분포 기댓값

반응형