Z, t 및 기타 여러 테스트는 데이터가 랜덤 샘플링을 기반으로하는 것으로 가정합니다. 왜?
실험적 연구를하고 있는데, 외부 연구보다 내부 타당성을 훨씬 더 중요하게 생각합니다. 따라서 전체 모집단에 대한 가설을 추론하지 않기로 동의했기 때문에 샘플이 약간 편향되어있을 수 있습니다. 그룹화는 여전히 임의적입니다. 즉, 편의를 위해 샘플 참가자를 선택하지만 무작위로 다른 그룹에 할당합니다.
왜이 가정을 무시할 수 없습니까?
Z, t 및 기타 여러 테스트는 데이터가 랜덤 샘플링을 기반으로하는 것으로 가정합니다. 왜?
실험적 연구를하고 있는데, 외부 연구보다 내부 타당성을 훨씬 더 중요하게 생각합니다. 따라서 전체 모집단에 대한 가설을 추론하지 않기로 동의했기 때문에 샘플이 약간 편향되어있을 수 있습니다. 그룹화는 여전히 임의적입니다. 즉, 편의를 위해 샘플 참가자를 선택하지만 무작위로 다른 그룹에 할당합니다.
왜이 가정을 무시할 수 없습니까?
답변:
실제 표본보다 더 넓은 그룹에 대해 어떤 추론을하지 않으면 우선 통계 테스트를 적용하지 않으며 "바이어스"에 대한 질문은 발생하지 않습니다. 이 경우 샘플의 기술 통계량 만 계산하면됩니다. 마찬가지로이 경우 모델 "유효성"에 대한 의문의 여지가 없습니다. 변수를 관찰하고 해당 값을 기록하고 해당 값의 측면에 대한 설명 만하면됩니다.
더 큰 그룹에 대해 추론하기 위해 표본을 넘어서기로 결정한 경우 통계가 필요하고 표본 치우침 등과 같은 문제를 고려해야합니다.이 응용 프로그램에서 무작위 표본 추출은 신뢰할 수있는 정보를 얻는 데 유용한 속성이됩니다. 더 넓은 관심 그룹의 추론. 무작위 표본 추출이없고 (집단을 기반으로 한 표본의 확률을 모르는 경우) 모집단에 대해 신뢰할만한 추론을하는 것은 어렵거나 불가능합니다.
실제 과학 연구에서 진정한 무작위 샘플링에서 나온 데이터를 갖는 것은 매우 드 rare니다. 데이터는 거의 항상 편의 샘플입니다. 이것은 주로 일반화 할 수있는 인구에 영향을줍니다. 즉, 그들이 편의 샘플이더라도 어딘가에서 왔을 때, 당신은 그 위치와 한계를 암시해야합니다. 데이터가 아무 것도 대표하지 않는다고 생각한다면, 연구는 어떤 수준에서도 가치가 없을 것이지만 아마도 사실이 아닐 것입니다 1 . 따라서, 샘플을 어딘가에서 추출한 것으로 간주하고 이러한 표준 테스트를 적어도 헤지 또는 검증 된 의미로 사용하는 것이 합리적입니다.
그러나 다른 테스트 철학이 있는데, 우리는 그러한 가정과 그에 의존하는 테스트에서 벗어나야한다고 주장합니다. Tukey 는 이것을 옹호했습니다. 대신 연구 단위 (예 : 환자)가 무기에 무작위로 할당 되었기 때문에 대부분의 실험 연구는 (내부적으로) 유효한 것으로 간주됩니다. 이 경우 순열 테스트를 사용할 수 있으며 대부분 무작위 화가 올바르게 수행되었다고 가정합니다. 이것에 대해 너무 걱정하는 반론은 순열 테스트는 일반적으로 해당 클래식 테스트와 동일한 것을 나타내며 더 많은 작업을 수행한다는 것입니다. 다시 한번, 표준 테스트가 허용 될 수 있습니다.
1. 이러한 내용을 더 자세히 보려면 여기에서 나의 대답을 읽는 것이 도움이 될 것 입니다. 연구에서 모집단 및 표본 식별 .