답변:
Kubinger, Rasch 및 Moder (2009) 의 논문 (독일어)을 기반으로 한 다른 두 가지 대답에 반대하고 싶습니다 .
그들은 t- 검정에 의해 부과 된 가정을 충족 시키거나 충족시키지 않는 분포의 "확장"시뮬레이션을 기반으로 가정이 충족 될 때 웰치 검정이 동등하게 잘 수행된다는 것 (즉, 기본적으로 동일 함) 알파 및 베타 오류 발생 가능성), 특히 전력 측면에서 가정이 충족되지 않으면 t- 테스트보다 성능이 우수합니다. 따라서 표본 크기가 30을 초과하는 경우 항상 웰치 테스트를 사용하는 것이 좋습니다.
메타 주석 : 통계에 관심이있는 사람들 (나나 다른 대부분의 경우와 같은)의 경우, 데이터를 기반으로 한 논거 (내 것과 같은)는 이론적 근거를 바탕으로 한 논거와 동일하게 계산해야합니다.
업데이트 :
이 주제에 대해 다시 생각한 후 새로운 제안이 내 요점을 보조하는 두 가지 추가 권장 사항을 발견했습니다. 이러한 권장 사항으로 이어지는 논증에 대한 원본 논문 (적어도 나에게도 무료로 제공됨)을보십시오.
첫 번째 권장 사항은 2006 년 Graeme D. Ruxton에서 발췌 한 것입니다. " 관련없는 데이터 샘플을 기준으로 두 모집단의 중심 경향을 비교하려면 불균형 분산 t- 검정을 항상 학생의 t- 검정보다 우선적으로 사용해야합니다. 또는 Mann-Whitney U 테스트. "
In :
Ruxton, GD, 2006. 동일하지 않은 분산 t- 검정은 Student 's t-test 및 Mann-Whitney U 검정에 대한 사용되지 않은 대안 입니다.
행동. ECOL . 17, 688–690.
두 번째 (구) 권장 사항은 Coombs et al. (1996, P 148). " . 충분히 큰 동일한 크기의 샘플 요약 독립 샘플 t 시험은 동일한 모집단 분산 가정을 위반하는 경우에도, 설치 타입 I 에러 레이트 제어의 관점에서 일반적으로 허용되는 불균등 들어 그러나 크기가 동일한 표본은 모집단 분산이 같지 않은 대안이 바람직합니다 분포가 짧은 꼬리 대칭이거나 정규 인 경우 James 2 차 검정을 사용하십시오. 유망한 대안으로는 Wilcox H 및 Yuen trimmed mean test가 있습니다. Welch 테스트 나 James 테스트보다 Type I 오류율을 더 광범위하게 제어하고 데이터가 긴꼬리 일 때 더 큰 성능을 발휘합니다. " (강조 첨가)
에서 :
Coombs WT, Algina J, Oltman D. 1996. 모집단 분산이 반드시 같지 않을 때 제 1 종 오류율을 제어하기 위해 선택된 일 변량 및 다변량 옴니버스 가설 검정 . Rev Educ Res 66 : 137–79.
물론 두 테스트를 모두 버리고 불균형 및 불균등 분산을 설명 할 수있는 베이지안 t- 검정 (Savage-Dickey ratio test)을 사용하여 시작할 수 있습니다. 귀무 가설 (이전의 "거부 실패"대화가 더 이상 없음)
이 테스트는 구현하기가 매우 간단하고 빠르며 베이지안 통계에 익숙하지 않은 독자에게 R 스크립트와 함께 사용 방법을 명확하게 설명하는 논문이 있습니다. 기본적으로 데이터를 삽입하여 명령을 R 콘솔에 보낼 수 있습니다.
예제 데이터와 함께이 모든 것에 대한 자습서도 있습니다.
http://www.ruudwetzels.com/index.php?src=SDtest
나는 이것이 요청 된 것에 대한 직접적인 반응이 아니라는 것을 알고 있지만 독자는이 훌륭한 대안을 가질 수 있다고 생각했습니다
건배
정확한 결과는 근사치보다 선호되므로 근사치가 정확한 방법과 다른 결과를 초래할 수있는 이상한 경우를 피하십시오.
Welch 방법은 오래된 t- 검정을 수행하는 더 빠른 방법이 아니며, 매우 어려운 문제에 대한 다루기 쉬운 근사치입니다. 등분 산의 경우는 이해하기 쉽고 단순하며 정확하므로 가능하면 항상 사용해야합니다.
내가 생각할 수있는 두 가지 이유 :
정규 학생의 T는 표본 크기가 같으면 이분산성에 상당히 강합니다.
당신이 강하게 생각되면 사전 데이터가 homoscedastic 것을, 당신은 아무것도 잃지 않고 Studen'ts T 대신 웰치의 T.를 사용하여 소량의 전력을 얻을 수있다
내가주지 않을 한 가지 이유 는 Student 's T가 정확하고 Welch 's T가 정확하지 않기 때문입니다. IMHO의 정확성은 정규 분포 데이터에 대해서만 정확하고 실제 데이터는 정확하게 정규 분포 되지 않기 때문에 학문적 입니다. 나는 사람들이 실제로 분포가 모든 실수를지지 할 수있는 곳에서 통계적으로 측정하고 분석하는 단일 수량을 생각할 수 없다. 예를 들어, 우주에는 원자가 너무 많으며 일부 양은 음수가 될 수 없습니다. 따라서 실제 데이터에 대해 모든 종류의 T- 검정을 사용하면 어쨌든 근사치입니다.
나는 여기서 반대 견해를 취할 것입니다. 표준 짝을 이루지 않은 학생 시험이 거의 동일한 결과를 제공 할 때 왜 Welch 시험을 방해합니까? 나는이 문제를 잠시 뒤 연구하고 t 테스트를 분석하고 Welch 테스트를 선호하기 위해 다양한 시나리오를 탐색했습니다. 그렇게하기 위해 한 그룹에서 다른 그룹에 대해 최대 5 배 더 큰 표본 크기를 사용했습니다. 그리고 한 그룹에서 다른 그룹에 대해 최대 25 배 더 큰 분산을 탐색했습니다. 그리고 그것은 실제로 물질적 차이를 만들지 않았습니다. 짝을 이루지 않은 t 테스트는 여전히 웰치 테스트와 거의 동일한 p 값 범위를 생성했습니다.
다음 링크에서 내 작품을 볼 수 있으며 특히 슬라이드 5와 6에 중점을 둡니다.
Welch 교정 시험의 빈번한 특성이 적어도 오류의 경우 일반 Student 's T보다 낫다는 것은 사실입니다. 나는 홀 치가 웰치 테스트에서 꽤 좋은 주장이라는 데 동의합니다. 그러나 나는 보통 Welch 보정을 권장하지 않습니다. 시험 자체에 대한 비판은 아닙니다.
Welch 보정을 권장하지 않는 이유는 자유도 및 p- 값이 도출되는 후속 이론적 분포를 변경하지 않기 때문입니다. 테스트를 비모수로 만듭니다. Welch 수정 t- 검정을 수행하려면 등분 산을 가정 할 수있는 것처럼 여전히 분산을 풀링하지만 등분 산을 가정 할 수 없거나 표본 분산 만 신경 써야한다는 최종 테스트 절차를 변경합니다. 풀링 된 분산이 모집단을 대표하지 않는 것으로 간주되고 관찰 된 값만 테스트한다는 점을 인정했기 때문에 비모수 검정이됩니다.
그 자체로는 특별히 문제가 없습니다. 그러나 a) 일반적으로 충분한 특이성으로보고되지 않기 때문에 기만적입니다. 그리고 b) 그것을 사용하는 사람들은 그것을 t- 테스트와 상호 교환 적으로 생각하는 경향이있다. 내가 출판 한 논문에서 그것이 끝났다는 것을 아는 유일한 방법은 t- 분포에 대해 홀수 DF를 보는 것입니다. 그것은 또한 Rexton (Henrik 답변에서 언급 된)이 리뷰에서 말할 수있는 유일한 방법이었습니다. 불행히도, Welch 보정 테스트의 비모수 적 특성은 자유도가 변경되었는지 여부에 관계없이 발생합니다 (예 : 표본 분산이 동일한 경우에도). 그러나이보고 문제는 Welch 수정을 사용하는 대부분의 사람들이이 테스트 변경을 인식하지 못한다는 사실의 증상입니다.
따라서이 때문에 비모수 적 테스트를 권장하려는 경우 종종 모수 적이거나 최소한 현재하고있는 일에 대해 매우 명확한 테스트를 사용하지 않는 것이 좋습니다. 테스트의 공식 이름은 비모수 적 웰치 수정 T- 테스트 여야합니다. 사람들이 그런 식으로 그것을보고하면 Henrik의 추천에 훨씬 만족할 것입니다.