t- 검정에 대한“대략 정상”의 평가

Welch의 t- 검정을 사용하여 평균의 동등성을 테스트하고 있습니다. 근본적인 분포는 정상과는 거리가 멀다 ( 여기서는 관련 토론의 예보다 비뚤어 짐 ). 더 많은 데이터를 얻을 수 있지만 어느 정도까지 결정하는 원칙적인 방법을 원합니다.

표본 분포가 수용 가능하다는 평가를 내리는 데 좋은 휴리스틱이 있습니까? 정규 성과의 편차는 가장 중요합니까?
표본 통계에 대한 부트 스트랩 신뢰 구간에 의존하는 다른 접근 방법이 더 적합합니까?

— 코 호즈
소스

이것은 좋은 질문입니다. 이외에도 정규성 테스트는 "필수적으로 쓸모가 없습니까?" (이미 연결되어 있음) 두 가지 더 관련된 질문은 t- 테스트 또는 비모수 테스트 중에서 선택하는 방법입니다 (예 : 작은 샘플의 Wilcoxon)? 그리고 때 N> 50 비정규 대한 T 테스트? 이 질문에 대한 정답은이 두 가지 관련 질문을 읽는 독자에게 유용 할 것입니다.

— Silverfish

내가 아는 한 분포가 "정상"이되기 위해 필요한 데이터 양을 결정하는 원칙적인 방법은 없습니다. 이는 "정규 충분"은 정의하기 어렵고 정규 분포에서 벗어나는 특정 방법 외에 기본 분포가 얼마나 비정규인지에 달려 있기 때문입니다. 비정규 데이터가 심각하면 비모수 테스트를 대신 사용하십시오. 단점은 혼자 가설 검정보다 유용한 신뢰 구간을 얻을 수 없다는 것입니다.

— dsaxton

나는 "정상적"이라고 정의하기 어렵다는 것에 동의하지만, 모든 실무자는 경험적 데이터에 대해 추론하기 전에 평가를해야하는데, 이것이 내가 알 수없는 토론이 얼마나 적 었는지 놀랄만 한 이유입니다 (아마도 잘못된 곳을보고있을 것입니다) . 유스 케이스의 경우, 여기서는 "충분히 일반적인"샘플링 분포를 보장하기 위해 더 많은 데이터를 수집하는 것과 비교하여 비모수 테스트는 만족스럽지 않습니다.

— cohoz

는 AS t의 테스트가 정상을 가정하고 기본 분포가 정상 아닌, 샘플 분포는 받아 들일 수 있다고 결정하는 원칙적인 방법이 될 수 없다. 그러나 표본 크기가 "대형"이되면 중앙 한계 정리가 시작되고 큰 표본 z 검정을 사용할 수 있습니다 . t 는 정규 분포에 접근 하기 때문에 t 검정 과 본질적으로 동일한 답을 제공합니다. 큰 샘플.

통계 서적 / 코스는 종종 25 또는 30 CLT의 샘플 크기에서 유용한 방식으로 작동 함을 암시합니다. 그러나 내 경험에 따르면 수백 개의 큰 샘플 z- 테스트에서 샘플 크기가 있어도 여전히 (예를 들어 카운트 데이터) 상당히 열악 할 수 있습니다.

제 생각에 순열 테스트는 문제에 적합합니다. 미리 작성된 비모수 적 테스트 (예 : Mann-Whitney)와 같거나 더 나은 성능을 가져야하며 정규성 문제에 대해 걱정할 필요가 없습니다. 그리고 그들은 재미있게 쓸 수 있습니다.

— 팀
소스