본문 바로가기

[통계학] 8-3. 확률벡터 - 공분산과 상관계수 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 두 확률변수의 주변분포와 결합분포를 통해 두 개 이상의 확률변수의 기댓값을 계산하는 방법과 모집단에서의 직선 관계를 나타내는 공분산과 상관계수, 그리고 두 변수의 선형결합과 관련된 평균과 분산의 성질을 알아보고자 한다. 기댓값 우선 기본적으로 확률변수에 대한 기댓값은 다음과 같이 주변분포를 통해 나타낸다. 그렇다면 두 확률변수 X, Y에 대해 X+Y 또는 XY의 기댓값은 어떻게 나타낼까? 우선 두 변수를 고려한다는 것은, 두 변수에 대한 결합분포가 있다는 것을 전제로 한다. 따라서 결합확률질량함수나 결합확률밀도함수를 이용하여 다음과 같이 구하게 된다. 이 때 X, Y가 서로 독립이라면 f(x,y)..
[통계학] 8-2. 확률벡터 - 결합분포와 주변분포 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이제 우리가 다룰 확률변수가 2개 있다고 가정을 하고, 두 확률변수의 확률구조를 알아볼 것이다. 결합분포 (joint distribution) 두 개 이상의 확률변수들을 동시에 고려한 확률분포 확률변수 사이의 , 는 교집합을 의미 연속확률변수의 경우, 결합확률밀도함수 f(x, y)는 x, y에서의 밀도를 나타낸다. 예를 들어, X와 Y가 균일분포라면 다음과 같이 결합확률밀도함수가 구해진다. 주변분포 (marginal distribution) 표본공간(Ω)이 사건 B1, ... , Bn으로 분할될 때 사건 A의 확률은 다음과 같이 나타낼 수 있다. 이산확률변수의 주변확률질량함수는 다음과 같다. 연속확률변수의..
[통계학] 7-1. 확률변수와 확률분포 - 확률변수 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 확률변수와 확률분포에 대해 알아보고, 이를 통해 통계학에서 세상을 어떤 시각으로 보는지 이해하고자 한다. 더보기 통계학은 불확실성을 제거하는 것이 아니라, 불확실성을 수학적으로 모델링하는 학문이다. 이 말이 무엇인지에 대해 알아가보자. 확률 변수 (random variable) 표본공간에서 정의된 실함수(real-valued function)로, 정의역이 표본공간이고 공역이 실수인 함수 불확실한 현상을 수학적 모형으로 만들어 구체적으로 계량화된 분석을 하게 해주는 것 (불확실성을 가지는 사회적, 자연적 현상 = 확률실험으로 이해하는 것으로, 불확실성을 제거하는 것은 아니다.) 표본공간 값을 숫자로..