나는 SPSS에서 일반화 선형 모델을 사용하여 16 개의 다른 종의 식물에서 평균 애벌레 수 (비정규, Tweedie 분포 사용)의 차이를 살펴보고 있습니다.
여러 비교를 실행하고 싶지만 Sidak 또는 Bonferroni 수정 테스트를 사용해야하는지 잘 모르겠습니다. 두 테스트의 차이점은 무엇입니까? 하나는 다른 것보다 낫습니까?
나는 SPSS에서 일반화 선형 모델을 사용하여 16 개의 다른 종의 식물에서 평균 애벌레 수 (비정규, Tweedie 분포 사용)의 차이를 살펴보고 있습니다.
여러 비교를 실행하고 싶지만 Sidak 또는 Bonferroni 수정 테스트를 사용해야하는지 잘 모르겠습니다. 두 테스트의 차이점은 무엇입니까? 하나는 다른 것보다 낫습니까?
답변:
를 유의 수준으로 사용하여 독립 통계 검정 을 실행 하고 모든 경우에 null을 얻는 경우 '유의성'을 찾을 수 있는지 여부는 단순히 임의 변수에서 도출됩니다. 특히 및 이항 분포에서 가져옵니다 . 예를 들어, 사용하여 3 개의 테스트를 실행 하려고하는데 실제로는 차이가없는 경우 5 %의 확률로 각 테스트에서 중요한 결과를 찾을 수 있습니다. 이런 식으로 제 1 종 오류율은 유지됩니다.α (P) = α N = K α = .05 α α α α O α n 개의 전자 w테스트는 개별적으로 수행되지만 3 가지 테스트 세트에서 장기 유형 I 오류율이 높아집니다. 이 세 가지 테스트를 함께 그룹화 / 생각하는 것이 의미가 있다고 생각되면, 유형 I 오류율을 개별적으로가 아니라 전체에 대해 로 설정 하는 것이 좋습니다. 어떻게해야합니까? 원래의 (즉, )에서 새로운 값 (예 : )으로 이동하는 데 두 가지 접근 방식이 있습니다 .
Bonferroni : '중요도'를 평가하는 데 사용되는 조정하여
Dunn-Sidak : 다음을 사용하여 조정
Dunn-Sidak은 세트 내의 모든 테스트가 서로 독립적이며 해당 가정이 유지되지 않는 경우 가족 단위의 제 1 종 오류 인플레이션을 초래할 수 있다고 가정합니다.
이 테스트를 수행 할 때, 거기 것이 중요합니다 오류의 두 종류 I (즉,이 말을 입력하면 피하고 싶은 것이 있다 가 일하지 않을 때 차이) 및 II를 입력합니다 (즉, 말씀이 아닙니다 실제로있을 때의 차이). 일반적으로 사람들이이 주제에 대해 토론 할 때, 제 1 종 오류에 대해서만 논의하고 알고있는 것 같습니다. 또한 사람들은 계산 된 오류율이 모든 null이 참인 경우에만 유지된다고 언급하지 않는 경우가 많습니다 . 귀무 가설이 거짓이면 제 1 종 오류를 만들 수 없다는 것이 명백하지만,이 문제를 논의 할 때 그 사실을 명심해야합니다.
나는 종종 고려되지 않는 것처럼 보이는 이러한 사실의 의미가 있기 때문에 이것을 제기합니다. 먼저 인 경우 Dunn-Sidak 방식은 더 높은 전력을 제공하지만 (차이가 작은 경우 가 작을 수 있지만 ) 항상 선호해야합니다 (해당되는 경우). 둘째, '강압' 접근법을 사용해야합니다. 즉, 가장 큰 효과를 먼저 테스트하십시오. 이 경우 널이 확보되지 않는다고 확신하는 경우 가능한 최대 유형 I 오류 수는 이므로 다음 테스트는 그에 따라 조정되어야합니다. (이것은 종종 불편한 사람과 낚시 같은 외모를 만들지 만, 그것은 것입니다 하지k k - 1 α테스트는 독립적이므로 낚시는 데이터를보기 전에 수행하려고했습니다. 이것은 최적으로 조정하는 방법입니다 .)
위의 내용은 유형 II 오류와 관련하여 유형 I의 가치를 어떻게 평가하든 관계없이 적용됩니다. 그러나 사전 에 제 1 종 오류가 제 2 종보다 나쁘다고 믿을 이유가 없습니다 (모든 사람이 그렇게 가정하는 것임에도 불구하고). 대신, 이것은 연구원이 내린 결정이며 해당 상황에 따라 달라져야합니다. 개인적으로, 이론적으로 제안 된, 선험적 , 직교 대비를 실행하는 경우 일반적으로 조정하지 않습니다 .
(그리고 이것을 다시 말하면, 위의 모든 것이 테스트가 독립적이라고 가정합니다. 대비가 독립적이지 않은 경우, 예를 들어 여러 처리를 동일한 제어와 비교할 때와 같이 독립적이지 않은 경우, 조정 과는 다른 접근법 Dunnett의 테스트와 같은을 사용해야합니다.)
수정 된 유의 수준 을 하면 Bonferroni는 다음과 같이 작동합니다. 유의 수준 를 테스트 수 으로 나눕니다 (예 : . Sidak은 다음과 같이 작동합니다 (테스트가 독립적 인 경우) : . α n α ∗ = α / n α ∗ = 1 − ( 1 − α ) 1 / n
때문에 의 Sidak 보정이 좀 더 강력한 (즉, 당신은 더 쉽게 의미있는 결과를 얻을 수)하지만 페로 니는 핸들에 조금 더 간단합니다.
보다 강력한 절차가 필요한 경우 Bonferroni-Holm 절차를 사용할 수 있습니다.
Sidak 보정은 개별 테스트가 통계적으로 독립적이라고 가정합니다. Bonferroni 수정은 이것을 가정하지 않습니다.
Sidak과 Bonferroni는 매우 유사하므로 사용하는 절차에 관계없이 동일한 결과를 얻을 수 있습니다. Bonferroni는 Sidak보다 조금 더 보수적입니다. 예를 들어 2 번의 비교와 .05의 가족 별 알파의 경우 Sidak은 .0253에서 각 테스트를 수행하고 Bonferroni는 .0250에서 각 테스트를 수행합니다.
이 사이트의 많은 의견 제시 자들은 Sidak은 비교 테스트 통계가 독립적 일 때만 유효하다고 말했습니다. 그건 사실이 아니야. Sidak은 테스트 통계가 거의 종속적이지 않을 때 패밀리 단위 오류율의 약간의 인플레이션을 허용하지만, 양면 테스트를 수행하는 경우 부정적인 의존성은 일반적으로 문제가되지 않습니다. 음이 아닌 의존성에서 Sidak은 실제로 가족 별 오류율의 상한을 제공합니다. 즉, 그러한 경계를 제공하고 Sidak보다 더 많은 통계적 힘을 유지하는 다른 절차가 있습니다. 따라서 Sidak은 최선의 선택이 아닐 것입니다.
Bonferroni 절차에서 제공하는 것 (Sidak이 제공하지 않음)은 예상되는 제 1 종 오류 수 (가족 별 오류율보다 소위 "가족당 오류율")를 엄격하게 제어하는 것입니다. 자세한 내용은 Frane, AV (2015) "가족당 유형 I 오류율이 사회 및 행동 과학과 관련이 있습니까?"를 참조하십시오. 현대 응용 통계 방법의 전표 14 (1), 12-23.