비정규 샘플을 표준 통계 테스트를 사용하여 분석 할 수 있습니까?


24

많은 임상 연구는 비임의 샘플을 기반으로합니다. 그러나 대부분의 표준 검정 (예 : t- 검정, 분산 분석, 선형 회귀, 로지스틱 회귀)은 표본에 "임의의 숫자"가 포함되어 있다는 가정을 기반으로합니다. 이러한 비 랜덤 샘플이 표준 테스트로 분석 된 경우 결과가 유효합니까? 고맙습니다.

답변:


20

테스트에는 두 가지 일반적인 모델이 있습니다. 모집단의 무작위 표본 추출 가정을 기반으로 한 첫 번째 항목을 일반적으로 "인구 모델"이라고합니다.

예를 들어, 두 개의 독립 표본 t- 검정의 경우, 비교하려는 두 그룹이 각 모집단의 랜덤 표본이라고 가정합니다. 두 그룹 내의 점수 분포가 일반적으로 모집단에 분포되어 있다고 가정하면 검정 통계량 (예 : t- 통계량)의 샘플링 분포를 분석적으로 도출 할 수 있습니다. 아이디어는 만약 우리가이 과정을 반복한다면 (각각의 모집단에서 무작위로 두 개의 표본을 뽑아서) 무한정 횟수 (물론 실제로 그렇게하지는 않는다)라면, 검정 통계량에 대한이 표본 분포를 얻을 것입니다.

테스트를위한 대체 모델은 "랜덤 화 모델"입니다. 여기서는 무작위 샘플링에 호소 할 필요가 없습니다. 대신, 우리는 샘플의 순열을 통해 무작위 배정 분포를 얻습니다.

예를 들어, t- 검정의 경우 두 개의 표본이 있습니다 (임의의 표본 추출을 통해 얻을 필요는 없음). 실제로이 두 그룹간에 차이가 없다면, 특정 개인이 실제로 그룹 1에 속하는지 또는 그룹 2에 속하는지는 임의적입니다. 그래서 우리가 할 수있는 일은 두 그룹의 평균이 얼마나 멀리 떨어져 있는지를 주목할 때마다 그룹 할당을 계속해서 바꾸는 것입니다. 이런 식으로 우리는 경험적으로 샘플링 분포를 얻습니다. 그런 다음 그룹 멤버십을 재구성하기 전에 원래 샘플에서 두 평균이 얼마나 멀리 떨어져 있는지 비교하고 그 차이가 "극단적"인 경우 (즉, 경험적으로 파생 된 샘플링 분포의 꼬리에 해당) 결론을 내립니다. 그 그룹 멤버쉽은 임의적이지 않으며 실제로 두 그룹간에 차이가 있습니다.

많은 상황에서 두 가지 접근 방식은 실제로 동일한 결론으로 ​​이어집니다. 어떤 방식으로 모집단 모델을 기반으로 한 접근 방식은 무작위 테스트에 대한 근사치로 볼 수 있습니다. 흥미롭게도 Fisher는 무작위 배정 모델을 제안했고 이것이 우리의 추론의 기초가되어야한다고 제안했습니다 (대부분의 샘플은 무작위 샘플링을 통해 얻지 않기 때문에).

두 접근 방식의 차이점을 설명하는 좋은 기사는 다음과 같습니다.

Ernst, MD (2004). 순열 방법 : 정확한 추론의 기초. 통계 과학, 19 (4), 676-685 (링크) .

좋은 요약을 제공하고 무작위 화 접근법이 우리의 추론의 기초가되어야한다고 제안하는 다른 기사 :

Ludbrook, J., & Dudley, H. (1998). 왜 생체 의학 연구에서 순열 테스트가 t 및 F 테스트보다 우수합니까? American Statistician, 52 (2), 127-132 (링크) .

편집 : 또한 모집단 모델에서와 같이 무작위 접근 방식을 사용할 때 동일한 테스트 통계를 계산하는 것이 일반적이라고 덧붙여 야합니다. 예를 들어, 두 그룹 간의 평균 차이를 검정하기 위해 그룹 멤버쉽의 모든 가능한 순열에 대한 일반적인 t- 통계량을 계산하고 (널 (null) 가정 하에서 경험적으로 파생 된 샘플링 분포를 나타냄) 얼마나 극단적인지 확인합니다. 원래 그룹 멤버쉽에 대한 t- 통계량은 해당 배포에 있습니다.


8

귀하의 질문은 매우 좋지만 직접적인 대답은 없습니다.

언급 한 것과 같은 대부분의 테스트는 임의 표본이 표본 모집단을 대표 할 가능성이 있기 때문에 표본이 임의 표본이라는 가정을 기반으로합니다. 가정이 유효하지 않은 경우 결과 해석시이를 고려해야합니다. 표본이 모집단을 대표하지 않는 경우 결과가 잘못 될 수 있습니다. 무작위가 아니더라도 표본이 대표적이면 결과는 완벽하게 정상입니다.

질문의 다음 단계는 어떤 경우에 비 랜덤 성이 중요한지 어떻게 판단 할 수 있는지를 묻는 것입니다. 나는 그것에 대답 할 수 없다 ;-)


5

매우 일반적인 질문이므로 답변이 모든 경우에 적합한 것은 아닙니다. 그러나 나는 명확히 할 수 있습니다. 통계 테스트는 일반적으로 관찰 된 분포 대 가상 분포 (소위 귀무 분포 또는 귀무 가설 또는 경우에 따라 대체 분포)와 관련이 있습니다. 샘플은 무작위가 아닐 수 있지만, 투여되는 테스트는 샘플에서 얻은 일부 값에 적용됩니다. 해당 변수에 확률 적 특성이있을 수있는 경우 분포가 대체 분포와 비교됩니다. 중요한 것은 표본의 검정 통계량이 다른 관심 모집단에 적용되는지 여부와 대안 또는 널 분포에 대한 가정이 다른 관심 모집단과 관련이 있는지 여부입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.