본문 바로가기

[통계학] 12-2. 표집분포 - 중심극한정리 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 지난 글에서 표본평균의 표집분포를 다루며 지수족이 아닐 때 분포를 구하는 방법 중 근사분포를 유도하는 방법이 있다는 것을 배웠다. 이번에는 그 근사모형을 통해 확률표본의 표본평균 또는 표본합에 대한 통계적 성질을 알아보고자 한다. 그리고 이 때 나오는 중요한 정리인 중심극한정리에 대해 알아볼 것이다. 큰수의 법칙 (law of large numbers, 대수의 법칙) X1, ... , Xn은 평균이 μ이고 분산이 σ^2인 모집단에서 추출된 확률표본이다. 이들의 평균인 표본평균과 기댓값, 분산은 다음과 같이 나타낼 수 있다. 즉, 표본평균은 μ를 중심으로 분포되어 있다는 것이다. 여기에서 분산의 분모에 n이..
[통계학] 12-1. 표집분포 - 표본평균의 표집분포 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번 시간에는 통계량의 확률분포인 표집분포와 표본평균의 통계적 성질에 대해 알아보고자 한다. 표집분포 (sampling distribution) 표집분포란 지난 시간에 배운 통계량의 확률분포이다. 통계량이란 측정가능한 확률표본의 함수로 표본평균, 표본분산, 극한값, 범위, 순위(Xi 크기 순서) 등이 있다. 이러한 통계량은 우리가 주로 관심을 가지는 모수와 연관되어 있기 때문에 이 통계량이 어떤 통계적 성질을 알고 있는지 파악하는 것은 중요하다. ex) 어떤 확률분포 두 확률표본을 추출한 경우, 두 표본평균의 분포는? 위의 예시를 일반화한 표본평균의 기댓값, 분산 등을 구하면 다음과 같다. 그리고 이러한 ..
[Android] 안드로이드 스튜디오 설치 및 기본 설정 이 포스트는 edwith 부스트코스 안드로이드 프로그래밍 강의를 기반으로 작성되었습니다. 오늘은 안드로이드 앱 개발을 위한 필수 프로그램, 안드로이드 스튜디오를 어떻게 설치하는지 알아보고자 한다. 1. 안드로이드 스튜디오 다운로드 우선 https://developer.android.com/studio/index.html 홈페이지에서 다운로드 버튼을 눌러 설치를 진행한다. 설치하는 과정은 캡쳐하지 못했으나, default 내용 그대로 아무것도 건드리지 않고 계속 Next를 눌러주면 된다. 설치가 되면 여러 아이콘이 있는 화면이 뜨는데, 여기에서도 Next를 클릭한다. 2. 최신버전 여부 확인 아래 톱니바퀴 아이콘 옆 Configure > Check for Updates을 누르면 현재 다운받아져 있는 것이 ..
[통계학] 11-3. 정규분포 - 확률표본과 통계량 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 통계학으로 가기 바로 전 단계인 확률표본과 이의 성질에 대해 알아보고자 한다. 확률표본 (random sample) 확률표본이란 모집단에서 무작위로 선택된 관측값으로 서로 독립이고 동일한 분포를 가진다는 성질(independent and identically distributed, iid)을 만족해야 한다. 즉, 독립이고 동일한 분포를 따르는 것을 복원추출한 표본이다. 예를 들어 정규분포에서 추출한 경우 아래와 같은 형태로 표시한다. 이는 서로 독립이기 때문에 결합분포는 각 주변분포의 곱으로 나타낸다. 그러나 이는 동일한 분포를 따르기에 X_i에서 i값에 관계없이 동일한 확률질량(밀도)함수를 가진다. 통계..
[통계학] 11-2. 정규분포 - 정규분포의 성질 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 일반적인 정규분포의 성질과 확률, 분위수 등을 계산하는 방법에 대해 알아보고자 한다. 지난 포스트에서는 표준화된 표준정규분포로 확률과 분위수 등을 구하는 방법을 배웠었다. 이제 평균이 0이 아니거나 분산이 1이 아닌 일반적인 경우에 대해 살펴볼 건데, 이를 위해서는 확률변수의 선형변환 특성에 대해 알아야 한다. 즉, 어떤 정규분포를 따르는 확률변수는 선형변환이 되어도 정규분포를 따른다는 것이다. 그렇다면 이 선형변환된 정규분포의 평균과 분산은 어떻게 될까? 아래 그림을 살펴보자. ex) X~N(60,16) → Z=(X-60)/4 P(55≤X
[통계학] 11-1. 정규분포 - 정규분포와 확률계산 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 통계학 분야에서 가장 중요한 분포인 정규분포에서 확률과 분위수 등을 어떻게 계산하는지 알아보고자 한다. 수학과 통계학에 큰 기여를 한 가우스(C. F. Gauss)는 1809년 최소제곱법이라는 개념을 소개했다. 최소제곱법이란 퍼져 있는 정도를 나타내는 분산을 구할 때 나온 것으로, Σ(x_i-a)^2를 최소로 만드는 것이 산술평균이라는 것이다. 즉, 이 과정에서 위치모수의 추정값으로 산술평균이 적절하다는 오차의 정규법칙을 보이는데 이 때 아래와 같은 정규분포의 확률밀도함수를 유도했다. 이는 종모양으로 나타나져 있으며, 가우스가 발견했다고 하여 가우시안 분포(Gaussian distribution)..
[통계학] 10-3. 주요 이산확률분포 - 다항분포 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 이항분포의 확장된 형태인 다항분포에 대해 알아보고자 한다. 이전에 범주화된 자료를 정리하는 도수분포표를 배울 때, 도수와 상대도수에 대해 배운 적이 있다. (링크 참고) 해당 범주에 속해 있는 자료의 비율을 나타내는 상대도수는 표본을 계속 뽑으면 해당 범주가 모집단에서 차지하는 비율, 즉 확률로 수렴하게 된다. 다항분포 (Multinomial Distribution) 지난번에 다룬 이항분포의 경우 발생 가능한 결과가 2가지(ex: 성공과 실패)만 나왔다. 이제는 발생 가능한 결과가 2가지 이상인 경우를 살펴보고자 한다. 다항분포란, 각 시행에서 발생 가능한 결과가 k가지로, 각 독립적인 시행에서 ..
[통계학] 10-2-2. 주요 이산확률분포 - 음이항분포 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 베르누이 실행의 또 다른 응용 형태인 음이항분포에 대해 알아보고자 한다. 음이항분포 (Negative Binomial Distribution) 성공할 확률이 p인 베르누이 시행을 r번 성공할 때까지 시행하는 경우 실패횟수(또는 시행횟수)의 분포 먼저 시행횟수를 기준으로 설명해보자. 실패횟수 X에 r을 더하면 시행횟수 Y(=X+r)가 되는데 이는 y-1번째까진 r-1번의 성공과 y-r번의 실패가 있었다는 것이다. Y~NB(r,p)로 나타내며, 확률질량함수는 아래와 같다. 이제 실패횟수를 기준으로 설명해보자면, r번 성공할 때까지 시행하는 것이기에 실패횟수가 x번일 때 성공횟수는 r-1번일 것이며, ..