표본이 모집 단일 때의 통계적 추론


47

매년 특정 시험을 보는 응시자 수를보고해야한다고 상상해보십시오. 예를 들어, 대상 집단의 특이성으로 인해 더 넓은 집단에서 성공률의 관찰 된 비율을 추론하기는 다소 어려워 보입니다. 따라서이 데이터가 전체 인구를 나타내는 것으로 간주 할 수 있습니다.

테스트 결과 남성과 여성의 비율이 실제로 다른 것으로 나타 났습니까? 전체 모집단 (샘플이 아님)을 고려하기 때문에 관찰 된 비율과 이론적 비율을 비교 한 검정이 올바른 것으로 나타 납니까?

답변:


31

이에 대한 의견이 다양 할 수 있지만 모집단 데이터를 표본으로 취급하고 가상의 모집단을 가정 한 다음 일반적인 방식으로 추론합니다. 이것을 생각하는 한 가지 방법은 수집 된 데이터 인 "인구"분포를 담당하는 기본 데이터 생성 프로세스가 있다는 것입니다.

특별한 경우에는 앞으로 코호트가 있기 때문에 더욱 의미가있을 수 있습니다. 그렇다면 당신의 인구는 미래에도 시험을 치르는 코호트입니다. 이런 식으로 1 년 이상의 데이터가있는 경우 시간 기반 변형을 설명하거나 오류 모델을 통해 잠재적 요인을 설명 할 수 있습니다. 요컨대, 설명력이 큰 풍부한 모델을 개발할 수 있습니다.


4
A Gelman의이 게시물을 보았습니다 . 샘플이 아닌 전체 모집단을 분석 할 때 통계 분석이 어떻게 다른가요? , j.mp/cZ1WSI . "슈퍼 인구"의 개념에 대한 의견을 나누는 좋은 출발점.
chl

2
@chl : 흥미 롭다 -Gelman이 ANOVA에 관한 그의 논문에서 고정 / 무작위 효과와 비교할 수있는 유한 / 슈퍼 모집단 추론에 대한 논의가 있음을 상기시킨다 [ stat.columbia.edu/~gelman/research/published/econanova3.pdf ].
ars

+1 방금 다시 구글로 돌아 왔습니다. 귀하의 답변이 제자리에 있다고 생각합니다.
Shane

25

사실, 당신이 정말로 긍정적이라면 전체 인구가 있고 통계에 들어갈 필요조차 없습니다. 그런 다음 그 차이가 얼마나 큰지 정확히 알고 있으므로 더 이상 테스트 할 이유가 없습니다. 고전적인 실수는 통계적 의미를 "관련"의미로 사용하는 것입니다. 모집단을 표본 추출한 경우 그 차이가 무엇입니까?

반면, 가설을 재구성하면 후보는 가능한 후보의 표본으로 간주되어 통계 테스트가 가능합니다. 이 경우 일반적으로 테스트에서 남성과 여성이 다른지 테스트합니다.

ars가 말했듯이 여러 해의 테스트를 사용하고 임의의 요소로 시간을 추가 할 수 있습니다. 그러나이 특정 테스트에서 이러한 후보 간의 차이점에 관심이 있다면 일반화를 사용할 수 없으며 테스트는 의미가 없습니다.


15

전통적으로, 통계적 추론은 확률 샘플과 샘플링 오류의 특성과 관련하여 진행됩니다. 이 모형은 유의성 검정의 기초입니다. 그러나 우연히 체계적인 이탈을 모델링하는 다른 방법이 있으며 파라 메트릭 (샘플링 기반) 테스트는 이러한 대안에 대한 근사치 인 경향이 있습니다.

가설의 모수 검정은 추정 이론에 의존하여 가능한 오차의 추정치를 생성합니다. 주어진 크기의 표본을 모집단에서 채취하면 표본 추출의 체계적인 특성에 대한 지식이 테스트와 신뢰 구간을 의미있게 만듭니다. 모집단의 경우 샘플링 이론은 단순히 관련이 없으며 테스트는 전통적인 의미에서 의미가 없습니다. 추론은 쓸모없고, 추론 할 것이 없으며, 매개 변수 자체가 있습니다.

일부는 현재 인구 조사가 나타내는 슈퍼 인구에 호소하여이 문제를 해결합니다. 이러한 호소력은 설득력이 없습니다. 매개 변수 검정은 확률 표본 추출과 그 특성을 전제로합니다. 주어진 시간의 인구는 시간과 장소에 따른 더 큰 인구의 표본 일 수 있습니다. 그러나 이것이 무작위 (또는 일반적으로 모든 형태의 확률) 샘플이라고 합법적으로 주장 할 수있는 방법은 없습니다. 확률 표본이 없으면 표본 추출 이론과 전통적인 테스트 논리는 적용되지 않습니다. 편의 샘플을 기반으로 테스트 할 수도 있습니다.

분명히 모집단을 사용할 때 테스트를 수락하려면 샘플링 절차에서 해당 테스트의 기초를 제거해야합니다. 이를 수행하는 한 가지 방법은 표본 이론적 테스트 (예 : t, Z 및 F)와 무작위 화 절차 사이의 밀접한 연관성을 인식하는 것입니다. 무작위 배정 테스트는 샘플을 기반으로합니다. 남성과 여성의 소득에 대한 데이터를 수집하면 확률 모델과 오류 추정치의 기초가 실제 데이터 값의 무작위 할당으로 반복됩니다. 이 무작위 화를 기반으로 그룹 간 관찰 된 차이를 분포와 비교할 수 있습니다. (우리는 모집단 모델의 무작위 샘플링이 거의 적합하지 않은 실험에서 항상 수행합니다).

이제 샘플 이론적 테스트는 종종 무작위 화 테스트의 근사치입니다. 따라서 궁극적으로 모집단의 테스트는이 프레임 워크 내에서 유용하고 의미가 있으며 샘플 기반 테스트와 마찬가지로 확률 변동과 체계적인 차이를 구분하는 데 도움이 될 수 있습니다. 거기에 도달하는 데 사용되는 논리는 약간 다르지만 테스트의 실제 의미와 사용에는 큰 영향을 미치지 않습니다. 물론 현대의 모든 컴퓨팅 기능에서 쉽게 사용할 수있는 경우 무작위 추출 및 순열 테스트를 사용하는 것이 좋습니다.


3
현명한 토론에 +1; 그래도 몇 가지 포인트. 추론 기계는 모집단 분석에 사용할 수 없지만 많은 모델링 사례 에서 모집단 데이터를 가지고 있는지 여부에 대해 의문을 제기 했습니다. 따라서 추론을 배포하는 수단으로 항상 슈퍼 인구에게 호소하는 것은 아닙니다 . "슈퍼 모집단"이 아닌, 더 나은 방법은 데이터 생성 프로세스 (예 : 코호트를 대상으로하는 매년 테스트)를 생성하는 것으로 가정하는 것입니다. 그것이 확률 적 구성 요소가 발생하는 곳입니다.
ars

2
인구 분석을위한 추론 적 메커니즘이 없다는 점을 제외하고는 여기에 의견 차이가 없다고 생각합니다. 무작위 화 테스트는 모집단에 적용 할 수 있으며 데이터 생성 프로세스가 무작위 생성 프로세스와 시스템 생성 프로세스로 인한 것일 수 있는지 여부를 합리적으로 테스트 할 수 있습니다. 이들은 무작위 표본 추출을 가정하지 않으며 확률 대비 체계적 변동에 대한 직접적인 테스트입니다. 우리의 전통적인 테스트는 그들에게 꽤 잘 맞습니다.
Brett

다시 말하면 "열등한 기계의 부족"입니다. 특히 당신이 당신의 대답에서 무작위 배정 테스트에 대해 지적한 점을 좋아했기 때문에 부주의 한 표현.
ars

죄송합니다. 순열을 계산하는 방법과 그에 대한 결론을 이해하는 데 어려움이 있습니다.
pbneau

부트 스트랩이 유효한 대안이 아닙니까? 부트 스트랩은 이러한 가정 중 하나를 수행 할 필요성을 어떻게 해결하지 못합니까?
Chernoff

3

결과는 후보자가 성별에 따라 다르다고 가정합니다. 예를 들어, 시험을 완료 한 사람들의 비율은 다음과 같습니다 : 여성 40 % 및 남성 60 %. 명백하게 말하면 40 %는 60 %와 다릅니다. 이제 중요한 것은 다음을 결정하는 것입니다. 1) 관심있는 인구; 2) 귀하의 관찰이 관심 인구와 어떤 관련이 있는지. 이 두 가지 문제에 대한 자세한 내용은 다음과 같습니다.

  1. 관심있는 인구가 관찰 한 후보자 (예 : 2016 년에 대학교에 지원 한 100 명의 후보자) 인 경우 통계적 유의성 검정을보고 할 필요가 없습니다. 관심있는 모집단이 완전히 샘플링 되었기 때문에 완전한 데이터를 보유한 100 명의 후보자 만 관심이 있습니다. 즉, 60 %는 완전 정지이며 40 %와 다릅니다. 이 질문에 대한 답은 프로그램에 적용한 인구 100 명에 성별 차이가 있었습니까? 이것은 설명적인 질문이며 대답은 '예'입니다.

  2. 그러나 여러 가지 중요한 질문은 다른 설정에서 어떤 일이 일어날 지에 관한 것입니다. 즉, 많은 연구자들이 미래를 예측하고 계획하는 데 도움이되는 과거에 대한 경향을 생각해 내고자합니다. 이와 관련하여 질문의 예는 다음과 같습니다. 후보자의 향후 시험은 성별에 따라 어떻게 다를 가능성이 있습니까? 관심있는 인구는 위의 시나리오 # 1보다 더 넓습니다. 이 시점에서 중요한 질문은 다음과 같습니다. 관찰 된 데이터가 향후 추세를 나타낼 가능성이 있습니까? 이것은 추론적인 질문이며, 원래 포스터가 제공 한 정보를 바탕으로 답은 : 우리는 모른다.

요약하면보고하려는 통계는 답변하려는 질문 유형에 따라 다릅니다.

기본 연구 설계에 대한 생각이 가장 도움이 될 수 있습니다 ( http://www.socialresearchmethods.net/kb/design.php ). 더 많은 정보를 원한다면 수퍼 인구를 생각하는 것이 도움이 될 수 있습니다 ( http://projecteuclid.org/euclid.ss/1023798999#ui-tabs-1 ).


2

임의의 프로세스로 측정한다고 생각되는 경우 통계 테스트가 적합합니다. 예를 들어, 동전을 10 번 뒤집어 공평한 지 확인하십시오. 당신은 6 개의 머리와 4 개의 꼬리를 얻습니다-당신은 무엇을 결론 지나요?


1
동전 던지기 문제에 대한 당신의 결론이 질문과 관련이 있다는 것을 정말로 이해하지 못합니다. 그 시점에서 조금 확장 할 수 있습니까? 통계적 테스트는 기준 집단이든 일반 집단이든 더 많은 집단에게 관찰 된 결과를 추론하는 데 도움이되는 정도와 관련이있는 것으로 보입니다. 여기서의 질문은 다음과 같습니다. 표본이 일정 기간 (여기서는 1 년) 동안 응시자의 모집단에 가깝다는 것을 고려할 때 고전적 추론이 개별 수준에서 가능한 차이에 대한 결정에 도달하는 올바른 방법입니까?
chl

1
@chl 네, 그러나 OP는 근본적인 성공 확률을 추론하려고합니다. 검정은 관측 된 비율을 이론적 분포와 비교하여 주어진 신뢰 수준에 차이가 있는지 확인합니다. 샘플링 오류 임의성이 아니라 임의의 형태의 임의성을 테스트하고 있습니다.
제임스
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.