답변:
분산을 모집단 분산과 비슷하지만 표본 평균이이면 두 표본의 분산이 동일합니다.
따라서 차이는 순전히 표본 분산에 대한 일반적인 공식 의 Bessel 보정 으로 인해 발생합니다 ( ,표본평균이 모집단 평균보다 데이터에 더 가깝다는 사실을 조정하여 편향되지 않도록합니다 (올바른 값을 " 평균").
n - 1 과 같이 샘플 크기가 증가함에 따라 효과는 점차 사라집니다. 은로 1로 이동합니다.
편차에 대해 편향 추정량을 사용해야하는 특별한 이유는 없습니다. 은 완벽하게 유효한 추정량이며, 경우에 따라 더 일반적인 형태에 비해 이점이있을 수 있습니다 (편견이 반드시 큰 것은 아닙니다) 거래).
분산 자체는 직접 스프레드의 척도가 아닙니다. 데이터 세트의 모든 값을 두 배로 늘리면 두 배의 값이 "확산 됨"이라고 주장합니다. 그러나 분산은 4 배 증가합니다. 따라서 분산보다는 표준 편차가 확산의 척도라고합니다.
물론 표준 편차 (보통 버전)에서 분산 과 동일한 문제가 발생합니다. 분산에서와 같은 이유로 표준 편차가 점을 두 배로 늘리면 표준 편차가 변경됩니다.
작은 샘플에서 베셀 보정은 그 영향 (샘플을 복제 할 때 값이 변경됨)으로 인해 확산의 척도로서 표준 편차를 다소 덜 직관적으로 만듭니다. 그러나 샘플을 복제 할 때 많은 스프레드 측정 값이 동일한 값을 유지합니다. 몇 가지를 언급하겠습니다.
(물론)
평균과의 평균 (절대) 편차
중앙값으로부터의 중앙값 (절대) 편차
사 분위수 범위 (적어도 표본 사 분위수의 일부 정의의 경우)
{3, 5}
자체 의 분산은 첫 번째 공식에 따라 1입니다. 지적한 바와 같이, 질문자는 표본으로 추정되는 인구 집단의 분산을 추정하려고 시도했지만 그 여부를 아는 사람은 누구입니까?