답변:
이에 대한 의견이 다양 할 수 있지만 모집단 데이터를 표본으로 취급하고 가상의 모집단을 가정 한 다음 일반적인 방식으로 추론합니다. 이것을 생각하는 한 가지 방법은 수집 된 데이터 인 "인구"분포를 담당하는 기본 데이터 생성 프로세스가 있다는 것입니다.
특별한 경우에는 앞으로 코호트가 있기 때문에 더욱 의미가있을 수 있습니다. 그렇다면 당신의 인구는 미래에도 시험을 치르는 코호트입니다. 이런 식으로 1 년 이상의 데이터가있는 경우 시간 기반 변형을 설명하거나 오류 모델을 통해 잠재적 요인을 설명 할 수 있습니다. 요컨대, 설명력이 큰 풍부한 모델을 개발할 수 있습니다.
사실, 당신이 정말로 긍정적이라면 전체 인구가 있고 통계에 들어갈 필요조차 없습니다. 그런 다음 그 차이가 얼마나 큰지 정확히 알고 있으므로 더 이상 테스트 할 이유가 없습니다. 고전적인 실수는 통계적 의미를 "관련"의미로 사용하는 것입니다. 모집단을 표본 추출한 경우 그 차이가 무엇입니까?
반면, 가설을 재구성하면 후보는 가능한 후보의 표본으로 간주되어 통계 테스트가 가능합니다. 이 경우 일반적으로 테스트에서 남성과 여성이 다른지 테스트합니다.
ars가 말했듯이 여러 해의 테스트를 사용하고 임의의 요소로 시간을 추가 할 수 있습니다. 그러나이 특정 테스트에서 이러한 후보 간의 차이점에 관심이 있다면 일반화를 사용할 수 없으며 테스트는 의미가 없습니다.
전통적으로, 통계적 추론은 확률 샘플과 샘플링 오류의 특성과 관련하여 진행됩니다. 이 모형은 유의성 검정의 기초입니다. 그러나 우연히 체계적인 이탈을 모델링하는 다른 방법이 있으며 파라 메트릭 (샘플링 기반) 테스트는 이러한 대안에 대한 근사치 인 경향이 있습니다.
가설의 모수 검정은 추정 이론에 의존하여 가능한 오차의 추정치를 생성합니다. 주어진 크기의 표본을 모집단에서 채취하면 표본 추출의 체계적인 특성에 대한 지식이 테스트와 신뢰 구간을 의미있게 만듭니다. 모집단의 경우 샘플링 이론은 단순히 관련이 없으며 테스트는 전통적인 의미에서 의미가 없습니다. 추론은 쓸모없고, 추론 할 것이 없으며, 매개 변수 자체가 있습니다.
일부는 현재 인구 조사가 나타내는 슈퍼 인구에 호소하여이 문제를 해결합니다. 이러한 호소력은 설득력이 없습니다. 매개 변수 검정은 확률 표본 추출과 그 특성을 전제로합니다. 주어진 시간의 인구는 시간과 장소에 따른 더 큰 인구의 표본 일 수 있습니다. 그러나 이것이 무작위 (또는 일반적으로 모든 형태의 확률) 샘플이라고 합법적으로 주장 할 수있는 방법은 없습니다. 확률 표본이 없으면 표본 추출 이론과 전통적인 테스트 논리는 적용되지 않습니다. 편의 샘플을 기반으로 테스트 할 수도 있습니다.
분명히 모집단을 사용할 때 테스트를 수락하려면 샘플링 절차에서 해당 테스트의 기초를 제거해야합니다. 이를 수행하는 한 가지 방법은 표본 이론적 테스트 (예 : t, Z 및 F)와 무작위 화 절차 사이의 밀접한 연관성을 인식하는 것입니다. 무작위 배정 테스트는 샘플을 기반으로합니다. 남성과 여성의 소득에 대한 데이터를 수집하면 확률 모델과 오류 추정치의 기초가 실제 데이터 값의 무작위 할당으로 반복됩니다. 이 무작위 화를 기반으로 그룹 간 관찰 된 차이를 분포와 비교할 수 있습니다. (우리는 모집단 모델의 무작위 샘플링이 거의 적합하지 않은 실험에서 항상 수행합니다).
이제 샘플 이론적 테스트는 종종 무작위 화 테스트의 근사치입니다. 따라서 궁극적으로 모집단의 테스트는이 프레임 워크 내에서 유용하고 의미가 있으며 샘플 기반 테스트와 마찬가지로 확률 변동과 체계적인 차이를 구분하는 데 도움이 될 수 있습니다. 거기에 도달하는 데 사용되는 논리는 약간 다르지만 테스트의 실제 의미와 사용에는 큰 영향을 미치지 않습니다. 물론 현대의 모든 컴퓨팅 기능에서 쉽게 사용할 수있는 경우 무작위 추출 및 순열 테스트를 사용하는 것이 좋습니다.
결과는 후보자가 성별에 따라 다르다고 가정합니다. 예를 들어, 시험을 완료 한 사람들의 비율은 다음과 같습니다 : 여성 40 % 및 남성 60 %. 명백하게 말하면 40 %는 60 %와 다릅니다. 이제 중요한 것은 다음을 결정하는 것입니다. 1) 관심있는 인구; 2) 귀하의 관찰이 관심 인구와 어떤 관련이 있는지. 이 두 가지 문제에 대한 자세한 내용은 다음과 같습니다.
관심있는 인구가 관찰 한 후보자 (예 : 2016 년에 대학교에 지원 한 100 명의 후보자) 인 경우 통계적 유의성 검정을보고 할 필요가 없습니다. 관심있는 모집단이 완전히 샘플링 되었기 때문에 완전한 데이터를 보유한 100 명의 후보자 만 관심이 있습니다. 즉, 60 %는 완전 정지이며 40 %와 다릅니다. 이 질문에 대한 답은 프로그램에 적용한 인구 100 명에 성별 차이가 있었습니까? 이것은 설명적인 질문이며 대답은 '예'입니다.
그러나 여러 가지 중요한 질문은 다른 설정에서 어떤 일이 일어날 지에 관한 것입니다. 즉, 많은 연구자들이 미래를 예측하고 계획하는 데 도움이되는 과거에 대한 경향을 생각해 내고자합니다. 이와 관련하여 질문의 예는 다음과 같습니다. 후보자의 향후 시험은 성별에 따라 어떻게 다를 가능성이 있습니까? 관심있는 인구는 위의 시나리오 # 1보다 더 넓습니다. 이 시점에서 중요한 질문은 다음과 같습니다. 관찰 된 데이터가 향후 추세를 나타낼 가능성이 있습니까? 이것은 추론적인 질문이며, 원래 포스터가 제공 한 정보를 바탕으로 답은 : 우리는 모른다.
요약하면보고하려는 통계는 답변하려는 질문 유형에 따라 다릅니다.
기본 연구 설계에 대한 생각이 가장 도움이 될 수 있습니다 ( http://www.socialresearchmethods.net/kb/design.php ). 더 많은 정보를 원한다면 수퍼 인구를 생각하는 것이 도움이 될 수 있습니다 ( http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 ).
임의의 프로세스로 측정한다고 생각되는 경우 통계 테스트가 적합합니다. 예를 들어, 동전을 10 번 뒤집어 공평한 지 확인하십시오. 당신은 6 개의 머리와 4 개의 꼬리를 얻습니다-당신은 무엇을 결론 지나요?