분산 검정 분석에서 단측 검정을 사용하는 이유를 설명 할 수 있습니까?
왜 ANOVA에서 단측 검정 (F- 검정)을 사용합니까?
분산 검정 분석에서 단측 검정을 사용하는 이유를 설명 할 수 있습니까?
왜 ANOVA에서 단측 검정 (F- 검정)을 사용합니까?
답변:
F 테스트는 두 가지 목적으로 가장 일반적으로 사용됩니다.
평균의 평등 (및 다양한 유사한 분석)을 테스트하기 위해 ANOVA에서; 과
분산의 동등성을 테스트 할 때
각각을 차례로 고려해 봅시다.
1) ANOVA에서의 F 검정 (및 유사하게 카운트 데이터에 대한 일반적인 종류의 카이-제곱 검정)은 데이터가 대립 가설과 일치할수록 검정 통계량은 커지는 반면 표본의 배열은 커지도록 구성됩니다. 널과 가장 일관되게 보이는 데이터는 검정 통계량의 가장 작은 값에 해당합니다.
동일한 표본 분산을 갖는 크기가 10 인 세 개의 표본을 고려하여 동일한 표본 평균을 갖도록 정렬 한 다음 평균을 다른 패턴으로 이동하십시오. 표본 평균의 변동이 0에서 증가함에 따라 F 통계량은 커집니다.
검은 선 (
귀무 가설 (인구 평균의 평등)이 true 인 경우 표본 평균에 약간의 차이가있을 것으로 예상되며 일반적으로 약 1 정도의 F 비율을 볼 것으로 예상됩니다. 작은 F 통계량은 일반적으로 비교 한 표본보다 더 가까운 표본에서 비롯됩니다. 기대 ... 그래서 당신은 인구 평균이 다르다는 결론을 내리지 않을 것입니다.
즉, 비정상적으로 큰 F-값을 얻을 때 ANOVA를 들어, 수단의 평등의 가설을 기각 것, 그리고 당신이 비정상적으로 작은 값 (이 나타낼 수 있습니다 얻을 때 당신은 수단의 평등의 가설을 기각하지 않습니다 뭔가를 하지만,하지를 인구가 다르다는 것을 의미합니다).
다음은 F가 위쪽 꼬리에있을 때만 거부하고 싶다는 것을 보여주는 그림입니다.
2) F의 분산이 동일한 지 검정합니다 (분산 비율을 기준으로 함). 여기에서 분자 표본 분산이 분모의 분산보다 훨씬 크면 두 표본 분산 추정치의 비율이 커지고 분모 표본 분산이 분자의 분산보다 훨씬 크면 비율이 작아집니다.
즉, 모집단 분산의 비율이 1과 다른지 테스트하기 위해 F의 크거나 작은 값 모두에 대해 null을 거부하려고합니다.
* (이 테스트의 분포 가정에 대한 높은 민감성 문제를 제외하고 (더 나은 대안이 있음) ANOVA 등분 산 가정의 적합성에 관심이 있다면 최선의 전략이 아닐 수도 있습니다 공식 시험.)
분산 분석의 목적은 평균의 불평등이 있는지 여부를 확인하는 것입니다 ... 샘플 내의 변동과 비교할 때 표본 간의 큰 변동 (및 변동이 평균에서 계산되는 평균)에 관심이 있음을 의미합니다. (다시 개별 표본 평균에서 계산). 샘플들 사이의 변동이 적을 때 (F 값이 왼쪽에 있음),이 차이는 중요하지 않으므로 중요하지 않습니다. 내부 편차보다 유의하게 높은 경우 샘플 간 편차가 중요하며,이 경우 F 값이 1보다 커서 오른쪽 꼬리가됩니다.
유일하게 남아있는 유일한 질문은 왜 전체 꼬리의 중요성을 오른쪽 꼬리에두고 답이 다시 비슷한 지에 대한 것입니다. 거부는 F 비율이 오른쪽에있을 때만 발생하고 F 비율이 왼쪽에있을 때는 절대 발생하지 않습니다. 유의 수준은 통계적 한계로 인한 오차 측정입니다. 거부가 오른쪽에서만 발생하기 때문에 전체 의미 수준 (오해 결론의 오류 위험)이 오른쪽에 유지됩니다. `
처리 내 평균 제곱 (MS)에 대한 예상 값은 모집단 분산이고, 처리 간 MS에 대한 예상 값은 모집단 분산에 처리 분산을 더한 값입니다. 따라서 F = MSbetween / MSwithin의 비율은 항상 1보다 크고 1보다 작지 않습니다.
단측 테스트의 정확도는 양측 테스트보다 낫기 때문에 단측 테스트를 사용하는 것이 좋습니다.