여러 가지 (모두는 아님) 모수 적 가설 검정에서 랜덤 샘플링을 가정하는 이유는 무엇입니까?


12

Z, t 및 기타 여러 테스트는 데이터가 랜덤 샘플링을 기반으로하는 것으로 가정합니다. 왜?

실험적 연구를하고 있는데, 외부 연구보다 내부 타당성을 훨씬 더 중요하게 생각합니다. 따라서 전체 모집단에 대한 가설을 추론하지 않기로 동의했기 때문에 샘플이 약간 편향되어있을 수 있습니다. 그룹화는 여전히 임의적입니다. 즉, 편의를 위해 샘플 참가자를 선택하지만 무작위로 다른 그룹에 할당합니다.

왜이 가정을 무시할 수 없습니까?


샘플링 기술에 편향이 발생하면 이는 '무작위'가 아닙니다. 그것이 어떤 편견을 도입하지 않으면 그것은 무작위입니다 (임의의 일부 정의의 경우-;). 나는 매 7 번째 샘플마다 카운터 샘플과 일치하는 샘플 크기를 만들기 위해 샘플링 기법을 사용했습니다. 그러나 나는 그 선택에 특별한 측면이 없다는 것을 알았으므로 비 무작위 샘플링 프로세스로 생각할 수있는 것은 여전히 ​​사실상 무작위였습니다. 추첨에서 볼 1,2,3,4,5,6을 선택하는 것과 같습니다. 다른 시퀀스와 마찬가지로 무작위입니다.
Philip Oakley

1
@PhilipOakley : 추첨에서 볼 1,2,3,4,5,6을 선택하면 다른 선택과 동일한 기회를 얻을 수 있지만 다른 사람과 상금을 공유해야 할 가능성이 높아 예상되는 승리를 줄입니다. 같은 생각을 가졌다
Henry

1
@Philip에 의해 기술 된 것과 같은 체계적인 샘플링은 종종 단순한 무작위 샘플을 생성하는 것처럼 분석되지만 함정이 있습니다. 예를 들어 매일 제조 공정을 측정하고 7 번째 측정을 샘플링하는 경우 같은 날에 샘플링 할 것이기 때문에 결과를 요일 효과와 혼동 할 수 있습니다. 매주. 비임의 샘플을 처리 할 때 이러한 미묘한 부분을 생각하고 해결하려면 더 열심히 노력해야합니다.
whuber

1
@whuber, 물론입니다. 이런 것들에 대해 열심히 (그리고 넓게) 생각해야합니다 !! 제 경우에는 수백 가지의 이벤트와 수백 개의 이벤트가있는 시간 간격이 있었기 때문에 간단한 로지스틱 회귀 (각 프레임은 독립적으로 간주되고 프레임 간에는 약간의 변화가 있음)를 위해 비 이벤트 세트의 데이터 크기를 줄여야했습니다. 비 이벤트 프레임을 많이 삭제하는 것이 합리적이었습니다. 시간 순서 측면은 별도로 고려되었다.
Philip Oakley

1
@Philip 흥미롭게도, 당신이 존재하지 않는 무작위성에 대한 논평을 거의 동시에 썼을 때, NIST는 그것을 주장 하는 보도 자료를 발표 했습니다 . 오늘 (2018 년 4 월 4 일) Nature에 계정이 나타납니다 .
whuber

답변:


18

실제 표본보다 더 넓은 그룹에 대해 어떤 추론을하지 않으면 우선 통계 테스트를 적용하지 않으며 "바이어스"에 대한 질문은 발생하지 않습니다. 이 경우 샘플의 기술 통계량 만 계산하면됩니다. 마찬가지로이 경우 모델 "유효성"에 대한 의문의 여지가 없습니다. 변수를 관찰하고 해당 값을 기록하고 해당 값의 측면에 대한 설명 만하면됩니다.

더 큰 그룹에 대해 추론하기 위해 표본을 넘어서기로 결정한 경우 통계가 필요하고 표본 치우침 등과 같은 문제를 고려해야합니다.이 응용 프로그램에서 무작위 표본 추출은 신뢰할 수있는 정보를 얻는 데 유용한 속성이됩니다. 더 넓은 관심 그룹의 추론. 무작위 표본 추출이없고 (집단을 기반으로 한 표본의 확률을 모르는 경우) 모집단에 대해 신뢰할만한 추론을하는 것은 어렵거나 불가능합니다.


5

실제 과학 연구에서 진정한 무작위 샘플링에서 나온 데이터를 갖는 것은 매우 드 rare니다. 데이터는 거의 항상 편의 샘플입니다. 이것은 주로 일반화 할 수있는 인구에 영향을줍니다. 즉, 그들이 편의 샘플이더라도 어딘가에서 왔을 때, 당신은 그 위치와 한계를 암시해야합니다. 데이터가 아무 것도 대표하지 않는다고 생각한다면, 연구는 어떤 수준에서도 가치가 없을 것이지만 아마도 사실이 아닐 것입니다 1 . 따라서, 샘플을 어딘가에서 추출한 것으로 간주하고 이러한 표준 테스트를 적어도 헤지 또는 검증 된 의미로 사용하는 것이 합리적입니다.

그러나 다른 테스트 철학이 있는데, 우리는 그러한 가정과 그에 의존하는 테스트에서 벗어나야한다고 주장합니다. Tukey 는 이것을 옹호했습니다. 대신 연구 단위 (예 : 환자)가 무기에 무작위로 할당 되었기 때문에 대부분의 실험 연구는 (내부적으로) 유효한 것으로 간주됩니다. 이 경우 순열 테스트를 사용할 수 있으며 대부분 무작위 화가 올바르게 수행되었다고 가정합니다. 이것에 대해 너무 걱정하는 반론은 순열 테스트는 일반적으로 해당 클래식 테스트와 동일한 것을 나타내며 더 많은 작업을 수행한다는 것입니다. 다시 한번, 표준 테스트가 허용 될 수 있습니다.

1. 이러한 내용을 더 자세히 보려면 ​​여기에서 나의 대답을 읽는 것이 도움이 될 것 입니다. 연구에서 모집단 및 표본 식별 .


3

Z, t 및 기타 여러 테스트는 관련 통계의 알려진 샘플링 분포를 기반으로합니다. 일반적으로 사용되는 샘플링 분포는 랜덤 ​​샘플에서 계산 된 통계에 대해 정의됩니다.

때때로 비임의 샘플링에 대한 관련 샘플링 분포를 고안하는 것이 가능할 수도 있지만 일반적으로는 불가능합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.