Statistic Study/Mathematical Statistics(수리통계학)
[수리통계학] [2.X] 표본 분산에 n-1을 나눠주는 이유
23학번이수현
2025. 3. 2. 23:34
1. Introduction
- [2.8] 에서 example에서 sample variance를 N-1로 나눠주는 이유에 대해서 나온다.
- 이건 되게 중요한 내용이니, 따로 정리하고자 하였다.
- 우선, sample variance를 구할 때 n-1로 나눠주는 이유는 unbiased estimator를 만들기 위해서라고 보면된다.
- 이를 엄밀히 증명해보자.
2. Difinition of Sample Variance
- 우선 모집단 분산은 다음과 같이 정의된다.

- 우리는 모집단을 직접 관측할 수 업시 때문에, 크기가 n인 표본을 이용해 분산을 추정하게 된다.
- 표본 평균은 다음과 같다.

- 이를 이용해 우리가 기존에 알고 있던, 분산을 정의하면 다음과 같을 것이다.

- 해당 식이 모집단 분산을 과소 추정하는지 확인해보고, unbiased estimator를 만들기 위해 n-1로 나누어야 하는 이유를 증명해보자.
3. 표본 분산의 기대값 계산
- unbiased를 확인하기 위해 S^2의 Expectation을 계산해보자.

- 우선, 분산을 다음과 같이 식을 변형을 해줄 것이다.

- 완전 제곱식을 전개하여 다음과 같이 정리해보자.

- 이제 양변에 기대값을 취해주자.


- S^2의 기대값을 구하면, 다음과 같아진다.


