답변:
짧은 대답 : 참조 (일반적으로 표준 정규) 분포의 Quantile에 따라 다릅니다.
긴 대답 : 특정 인구 매개 변수를 추정하고 있습니다 (예 : 빨간 머리를 가진 사람들의 비율; 그것은 로지스틱 회귀 매개 변수에서 성과 점수의 75 번째 백분위 수에 이르기까지 훨씬 더 복잡 할 수 있습니다). 데이터를 수집하고, 추정 절차를 실행하며, 가장 먼저 보는 것은 인구에 대해 배우고 자하는 대략적인 수치 인 점 추정치입니다 (빨간 머리의 표본 비율은 7 %입니다). 이것은 표본 통계량이므로 랜덤 변수입니다. 랜덤 변수는 평균, 분산, 분포 함수 등으로 특징 지을 수있는 (샘플링) 분포를 갖습니다. 점 추정치는 모집단 모수, 표준 오차에 대한 최선의 추측입니다.추정기의 표준 편차 (또는 경우에 따라 평균 제곱 오차의 제곱근, MSE = 치우침 2 + 분산) 에 관한 최선의 추측 입니다.
크기가 인 표본의 경우 비례 추정치 의 표준 오차 는 입니다. 오차 마진은 IS연관된 신뢰 구간의 절반 폭이므로, 95 % 신뢰 수준, 당신이 가진 것,오차 결과.
이것은 비율에 중점을 둔 질문에 대한 확장 (또는 @StasK 답변의 주석 확장) 시도 입니다.
표준 에러:
비율 p 의 샘플링 분포 의 표준 오차 ( SE ) 는 다음과 같이 정의됩니다.
. 이는비율π의샘플링 분포의표준 편차 (SD)와대조 될 수 있습니다. σp=√ .
신뢰 구간:
신뢰 구간 모수 추정 통상 근사있게 샘플링 분포 중심 극한 정리 (CLT)에 기초한다. 따라서 SE와 비율이 95 % 인 경우 신뢰 구간은 다음과 같이 계산됩니다.
점을 감안 의 CI가 될 것입니다 :
.
이것은 모집단 SD를 실제로 모르는 경우에도 정규 분포의 활용에 대한 의문을 제기합니다. 평균에 대한 신뢰 구간을 추정 할 때 SE 대신 SD를 사용하는 경우 분포는 일반적으로 더 두꺼운 꼬리 때문에 더 나은 선택. 그러나, 비율의 경우, 단지 하나 개의 파라미터가 P가 위한 화학식 때문에, 예상되는 베르누이 분산은 에 전적으로 의존 P 등의 P
오류의 여백 :
오차 범위는 단지이 경우, 샘플 비율은 특정 통계에 대한 신뢰 구간의 "반경"(또는 절반 폭)이다 :
그래픽으로
표본 추출 오차는 표본 통계량이 다른 한편으로 추정되는 모수와 다른 정도를 측정합니다. 표준 오차는 동일한 모집단에서 추출한 표본 통계량 간의 변동을 정량화하려고 시도합니다.