본문 바로가기

[통계학] 8-2. 확률벡터 - 결합분포와 주변분포 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이제 우리가 다룰 확률변수가 2개 있다고 가정을 하고, 두 확률변수의 확률구조를 알아볼 것이다. 결합분포 (joint distribution) 두 개 이상의 확률변수들을 동시에 고려한 확률분포 확률변수 사이의 , 는 교집합을 의미 연속확률변수의 경우, 결합확률밀도함수 f(x, y)는 x, y에서의 밀도를 나타낸다. 예를 들어, X와 Y가 균일분포라면 다음과 같이 결합확률밀도함수가 구해진다. 주변분포 (marginal distribution) 표본공간(Ω)이 사건 B1, ... , Bn으로 분할될 때 사건 A의 확률은 다음과 같이 나타낼 수 있다. 이산확률변수의 주변확률질량함수는 다음과 같다. 연속확률변수의..
[통계학] 8-1. 확률벡터 - 분산과 표준편차 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 모집단의 분산과 표준편차를 계산하는 방법에 대해 알아보도록 한다. 우선 표본에서의 분산을 어떻게 구하는지 다시 살펴보자. 표본크기가 n이고 표본이 가질 수 있는 값 x_i와 그 값을 가지는 표본 수를 n_i이라고 하면 표본분산 s^2는 다음과 같이 나타낼 수 있다. 여기에서 n을 계속 크게 만들면 아래와 같이 값들이 변할 것이며, 표본분산은 모분산으로 될 것이다. 따라서 모분산은 다음과 같이 나타낼 수 있다. 또한 모표준편차의 경우 모분산에 루트를 씌워 다음과 같이 표현한다. 이제 확률변수의 분산 Var(X)에 대해 알아보자. 먼저 이산확률변수의 경우 다음과 같이 나타낼 수 있다. 연속확률변수의 ..
[통계학] 7-4. 확률변수와 확률분포 - 확률변수의 기댓값 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 확률변수의 대표값이며 다양한 확률 및 통계 문제와 관련있는 기댓값에 대해 알아보고자 한다. 우리는 지금까지 표본평균을 구할 때 관측값에 그 값이 차지하는 비율을 곱해서 더하는 식으로 구했다. 이 때 표본 크기가 무한대로 커지면 표본은 모집단이 되고, 표본평균은 모평균이 된다. 이 모평균(population mean)은 확률변수의 기댓값(expectation, expected value)을 의미하는데, 확률변수에 대해 평균적으로 기대하는 값이며, 확률분포(or 모집단)의 무게중심이다. 앞에서 본 변환된 확률변수의 기댓값은 다음과 같이 나타낼 수 있다. 예를 들어 2X의 기댓값은 기존의 xf(x) 위..
[통계학] 7-3. 확률변수와 확률분포 - 연속확률변수와 확률밀도함수 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 확률밀도함수 (probability density function) 확률을 함수 형태를 표시한 것으로, 연속확률변수에 대해 확률 구조를 나타낸다. (확률변수의 치역이 실수로 표현된다.) 우리는 히스토그램을 다룰 때 밀도에 대해 얘기를 한 적이 있었다. 히스토그램에서의 밀도란 히스토그램의 높이를 의미하며, 이 밀도들이 모여 전체 면적이 1이 된다. 이와 같은 히스토그램을 연속자료로 이뤄진 모집단에서 n을 무한대로 추출한 표본에 대해 그릴 때, 즉, 모집단에 대해서 히스토그램을 그릴 때 x에서의 높이(밀도)를 f(x)라고 하고 이를 확률밀도함수라고 부른다. 확률밀도에서의 확률 = 확률밀도함수의 면적 (해당 구..
[통계학] 7-2. 확률변수와 확률분포 - 이산확률변수와 확률질량함수 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 이산확률변수와 이산확률변수의 확률 구조를 나타내는 확률질량함수에 대해 알아보자. 확률질량함수 (probability mass function) 확률을 함수 형태를 표시한 것으로, 이산확률변수에 대해 확률 구조를 나타낸다. 확률질량함수 성질은 다음과 같다. 이제 예시를 통해 보다 더 자세히 알아보자. ex) 젖혀진 윷이 나올 때까지 던지기 (X : 던진 횟수, p : 젖혀질 확률) 기하 분포(geometric distribution) 곱해지는 값으로 인해 기하급수적으로 작게 만들어지는 분포 누적분포함수 (cumulative distribution function) 확률변수 X가 어떤 상수 x보다 작..
[통계학] 7-1. 확률변수와 확률분포 - 확률변수 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 확률변수와 확률분포에 대해 알아보고, 이를 통해 통계학에서 세상을 어떤 시각으로 보는지 이해하고자 한다. 더보기 통계학은 불확실성을 제거하는 것이 아니라, 불확실성을 수학적으로 모델링하는 학문이다. 이 말이 무엇인지에 대해 알아가보자. 확률 변수 (random variable) 표본공간에서 정의된 실함수(real-valued function)로, 정의역이 표본공간이고 공역이 실수인 함수 불확실한 현상을 수학적 모형으로 만들어 구체적으로 계량화된 분석을 하게 해주는 것 (불확실성을 가지는 사회적, 자연적 현상 = 확률실험으로 이해하는 것으로, 불확실성을 제거하는 것은 아니다.) 표본공간 값을 숫자로..
[통계학] 6-4. 조건부 확률 - 베이즈 정리 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 조건부 확률의 주요 이론인 베이즈정리(Bayes' theorem)에 대해 알아보고자 한다. 우선, 지금까지 다룬 내용은 다음과 같다. 코호트 연구 (Cohort Study) P(B|A)를 순서적으로 생각하면 사건 A가 먼저 발생한 뒤 B가 이어서 발생할 확률을 말한다. 즉, A가 원인이고 B가 결과인 전향적 연구(prospective study) 형태 사전확률 (prior probability) 원인의 가능성인 P(A) or P(A^c) 사건 B가 관측되기 이전의 확률 사례-대조연구 (case-control study) 결과를 얻은 상태에서 결과가 발생하게 된 원인을 역으로 추정하는 후향적 연구(..
[통계학] 6-3. 조건부 확률 - 독립사건 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 조건부확률의 특별한 형태, 독립사건에 대해 알아보고자 한다. 독립 사건 (independent events) 사건 A와 B가 서로 영향을 주지 않을 경우 표본공간, 공집합은 임의의 사건 A와 독립이다. 독립과 배반사건은 서로 연관이 있을까? 정답은 NO. 배반사건일 경우 A∩B = ∮ 이 되고, 독립일 경우 P(A∩B) = P(A) * P(B) 가 되는데 배반사건에 의해 P(A∩B) = P(∮) = 0 이 되므로 항상 성립되지는 않는다. 즉, 만약 A와 B의 사건이 0보다 크다면 배반사건과 독립은 전혀 연관이 없는 배반적인 것이다. ex) 전기전달 시스템 아래 그림과 같이 3개의 독립된 스위치로 ..