본문 바로가기

[통계학] 12-4. 표본분표 - 기타통계량의 표집분포 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이전까지는 표본평균을 중심으로 통계량의 표집분포에 대해 알아봤는데, 이번에는 다른 형태의 통계량, 특히 표본분산과 최댓값이 가지는 표집분포에 대해 알아보고자 한다. 표본분산의 표집분포 X1, ... , Xn ~ N(0, 5^2)의 분포를 따를 때, 표본분산/실제분산에 대한 분포는 다음과 같다. 이를 통해 예를 들어 n=5일 때 10보다 클 확률을 면적으로 추정할 수 있다. n이 커지면 자유도가 n-1인 카이제곱분포를 따르며, 아래 그래프의 빨간 선을 따르게 된다. (카이제곱분포의 경우 뒤에서 자세히 다룰 예정이다.) 최댓값의 표집분포 모든 관측값 중 가장 큰 값을 가리키는 최댓값이 x보다 작거나 같다면, ..
[통계학] 12-3. 표본분표 - 이항분포의 정규근사 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 포아송분포가 아닌 정규분포를 이용해서 이항분포 확률을 계산하는 원리에 대해 알아보고, 이를 통해 비율에 대한 통계적 추론의 이론적 근거를 마련해보자. 이전에 이항분포에서 n이 크고 p가 작거나 크면 포아송분포로 이항분포 확률을 계산할 수 있다고 했었다. 그러나 p가 0.5에 가까운 값이라면 어떻게 해야할까? 이 경우에는 정규분포로 계산해야 한다. 이제 직접 계산을 해보자. X~B(n,p)라고 할 때, Xi는 i번째 베르누이 확률변수이고 X는 이러한 Xi들의 합이다. 그리고 이 X를 n으로 나눈 것을 표본비율이라고 하며, 이는 n이 클 때 중심극한정리에 의해 정규분포로 근사한다. 이를 표준화해서 나..
[통계학] 12-2. 표집분포 - 중심극한정리 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 지난 글에서 표본평균의 표집분포를 다루며 지수족이 아닐 때 분포를 구하는 방법 중 근사분포를 유도하는 방법이 있다는 것을 배웠다. 이번에는 그 근사모형을 통해 확률표본의 표본평균 또는 표본합에 대한 통계적 성질을 알아보고자 한다. 그리고 이 때 나오는 중요한 정리인 중심극한정리에 대해 알아볼 것이다. 큰수의 법칙 (law of large numbers, 대수의 법칙) X1, ... , Xn은 평균이 μ이고 분산이 σ^2인 모집단에서 추출된 확률표본이다. 이들의 평균인 표본평균과 기댓값, 분산은 다음과 같이 나타낼 수 있다. 즉, 표본평균은 μ를 중심으로 분포되어 있다는 것이다. 여기에서 분산의 분모에 n이..
[통계학] 12-1. 표집분포 - 표본평균의 표집분포 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번 시간에는 통계량의 확률분포인 표집분포와 표본평균의 통계적 성질에 대해 알아보고자 한다. 표집분포 (sampling distribution) 표집분포란 지난 시간에 배운 통계량의 확률분포이다. 통계량이란 측정가능한 확률표본의 함수로 표본평균, 표본분산, 극한값, 범위, 순위(Xi 크기 순서) 등이 있다. 이러한 통계량은 우리가 주로 관심을 가지는 모수와 연관되어 있기 때문에 이 통계량이 어떤 통계적 성질을 알고 있는지 파악하는 것은 중요하다. ex) 어떤 확률분포 두 확률표본을 추출한 경우, 두 표본평균의 분포는? 위의 예시를 일반화한 표본평균의 기댓값, 분산 등을 구하면 다음과 같다. 그리고 이러한 ..
[Android] 안드로이드 스튜디오 설치 및 기본 설정 이 포스트는 edwith 부스트코스 안드로이드 프로그래밍 강의를 기반으로 작성되었습니다. 오늘은 안드로이드 앱 개발을 위한 필수 프로그램, 안드로이드 스튜디오를 어떻게 설치하는지 알아보고자 한다. 1. 안드로이드 스튜디오 다운로드 우선 https://developer.android.com/studio/index.html 홈페이지에서 다운로드 버튼을 눌러 설치를 진행한다. 설치하는 과정은 캡쳐하지 못했으나, default 내용 그대로 아무것도 건드리지 않고 계속 Next를 눌러주면 된다. 설치가 되면 여러 아이콘이 있는 화면이 뜨는데, 여기에서도 Next를 클릭한다. 2. 최신버전 여부 확인 아래 톱니바퀴 아이콘 옆 Configure > Check for Updates을 누르면 현재 다운받아져 있는 것이 ..
[통계학] 11-3. 정규분포 - 확률표본과 통계량 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 통계학으로 가기 바로 전 단계인 확률표본과 이의 성질에 대해 알아보고자 한다. 확률표본 (random sample) 확률표본이란 모집단에서 무작위로 선택된 관측값으로 서로 독립이고 동일한 분포를 가진다는 성질(independent and identically distributed, iid)을 만족해야 한다. 즉, 독립이고 동일한 분포를 따르는 것을 복원추출한 표본이다. 예를 들어 정규분포에서 추출한 경우 아래와 같은 형태로 표시한다. 이는 서로 독립이기 때문에 결합분포는 각 주변분포의 곱으로 나타낸다. 그러나 이는 동일한 분포를 따르기에 X_i에서 i값에 관계없이 동일한 확률질량(밀도)함수를 가진다. 통계..
[통계학] 11-2. 정규분포 - 정규분포의 성질 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 일반적인 정규분포의 성질과 확률, 분위수 등을 계산하는 방법에 대해 알아보고자 한다. 지난 포스트에서는 표준화된 표준정규분포로 확률과 분위수 등을 구하는 방법을 배웠었다. 이제 평균이 0이 아니거나 분산이 1이 아닌 일반적인 경우에 대해 살펴볼 건데, 이를 위해서는 확률변수의 선형변환 특성에 대해 알아야 한다. 즉, 어떤 정규분포를 따르는 확률변수는 선형변환이 되어도 정규분포를 따른다는 것이다. 그렇다면 이 선형변환된 정규분포의 평균과 분산은 어떻게 될까? 아래 그림을 살펴보자. ex) X~N(60,16) → Z=(X-60)/4 P(55≤X
[통계학] 11-1. 정규분포 - 정규분포와 확률계산 이 포스트는 K-MOOC 숙명여대 여인권 교수님의 통계학의 이해 Ⅰ 강의를 기반으로 작성되었습니다. 이번에는 통계학 분야에서 가장 중요한 분포인 정규분포에서 확률과 분위수 등을 어떻게 계산하는지 알아보고자 한다. 수학과 통계학에 큰 기여를 한 가우스(C. F. Gauss)는 1809년 최소제곱법이라는 개념을 소개했다. 최소제곱법이란 퍼져 있는 정도를 나타내는 분산을 구할 때 나온 것으로, Σ(x_i-a)^2를 최소로 만드는 것이 산술평균이라는 것이다. 즉, 이 과정에서 위치모수의 추정값으로 산술평균이 적절하다는 오차의 정규법칙을 보이는데 이 때 아래와 같은 정규분포의 확률밀도함수를 유도했다. 이는 종모양으로 나타나져 있으며, 가우스가 발견했다고 하여 가우시안 분포(Gaussian distribution)..