전체 모집단의 데이터를 사용할 수있을 때 신뢰 구간을 계산하고 가설을 테스트하는 것이 합리적입니까? 내 의견으로는, 우리는 매개 변수의 실제 값을 정확하게 계산할 수 있기 때문에 대답은 아니오입니다. 그러나 앞서 언급 한 기술을 사용할 수있는 최초 모집단의 최대 데이터 비율은 얼마입니까?
전체 모집단의 데이터를 사용할 수있을 때 신뢰 구간을 계산하고 가설을 테스트하는 것이 합리적입니까? 내 의견으로는, 우리는 매개 변수의 실제 값을 정확하게 계산할 수 있기 때문에 대답은 아니오입니다. 그러나 앞서 언급 한 기술을 사용할 수있는 최초 모집단의 최대 데이터 비율은 얼마입니까?
답변:
첫 번째 질문은 일반적으로 답변에 동의하지 않은 질문입니다. 내 자신의 견해는 당신과 같지만 다른 사람들은 인구가 상황에 따라 달라지는 '슈퍼-인구'의 표본으로 볼 수 있다고 주장했습니다. 건물은 비슷한 건물에 사는 모든 사람들의 표본으로 볼 수 있습니다. 미국 인구의 인구 조사 (정확히 완성 될 수는 없음)는 언젠가 존재하는 미국인 집단 (또는 그와 비슷한 것)의 표본으로 볼 수 있습니다. 나는 이것이 종종 p- 값을 사용하는 변명이라고 생각합니다. 실질적인 분야의 많은 과학자들은 p- 값이 없다면 편안하지 않습니다. (그러나 그것은 나의 견해입니다).
두 번째 질문은 일반적인 방식으로 대답하기에는 약간 이상합니다. 모집단의 절반 이상인 표본을 언제 얻습니까?
더 큰 문제는 편견입니다. 미국 인구 조사로 돌아가서 문제는 단순히 사람들을 그리워한다는 것이 아니라 그리워하는 사람들이 전체 인구의 무작위 표본이 아니라는 것입니다. 따라서 인구 조사가 모든 사람의 95 %로부터 답변을 얻더라도 (남은 수를 선택하기 위해) 남은 5 %가 상당히 다른 경우 결과는 편향됩니다.
12 명 중 2 명만이 여성이라고 가정합니다.
또는 선발 과정의 재산 인위원회에 여자가 선발 될 확률을 추정 할 수 있습니다. 신뢰 구간을두고 절반 (또는 다른 관련 귀무 가설)과 크게 다른지 여부 등을 테스트 할 수 있습니다. 아마도 공정을 공정하게하기 위해 프로세스를 변경해야 할 수도 있습니다.
서술적이고 유추적인 두 가지 견해는 모순이 아니라 매우 뚜렷합니다.
두 번째 질문에 대한 답은 단일 개인이 표본 추출되지 않은 경우에도 모집단 모수에 대한 신뢰 구간을 계산하고 검정 가설을 계산하는 것이 합리적이라는 것입니다. CI와 테스트는 표본 추출되는 인구의 상당 부분을 고려해야 합니다. 유한 모집단 수정을 참조하십시오 .