이 질문은 분명히 균형이 잡히지 않은 양방향 설계를 가진 연구에서 나 왔으며, aov()
함수 와 함께 R로 분석되었습니다 . 이 페이지 는이 문제에 대한보다 최근의 자세한 예를 제공합니다.
이 질문에 대한 일반적인 답변은 "많이있다"입니다. 여기서는 설계의 균형이 맞는지 여부와 그렇지 않은 경우 어떤 ANOVA의 풍미가 선택되는지에 달려 있습니다.
첫째, 디자인의 균형이 맞는지 여부에 달려 있습니다. 요인 설계의 모든 셀에서 동일한 수의 사례를 사용하여 가능한 모든 세계에서 최선을 다하면 ANOVA 수행 방식에 관계없이 모형에 요인을 입력하는 순서로 인해 차이가 없습니다. * 해당 사례 아마도 후 향적 임상 코호트에서 비롯된 것은 그러한 균형이 발견되지 않은 실제 세계에서 온 것으로 보인다. 따라서 순서 가 중요 할 수 있습니다 .
둘째, 분석이 어떻게 수행되는지에 달려 있는데, 이는 다소 논쟁의 여지가있는 문제입니다. 불균형 설계의 분산 분석 유형은 주요 효과 및 상호 작용을 평가하는 순서가 다릅니다. 상호 작용을 평가하는 것은 양방향 및 고차 분산 분석의 기본이므로 최상의 진행 방법에 대한 분쟁이 있습니다. 한 가지 설명과 토론 은 이 교차 검증 페이지 를 참조하십시오 . 다른보기 를 위해 패키지Anova()
의 매뉴얼car
에서 (대문자 "A") 기능에 대한 세부 사항 및 경고를 참조하십시오 .
요소의 순서는 않습니다 기본에서 불균형 설계에 문제 aov()
라고 어떤 용도 유형-I는 테스트 R에. 이것들은 본 질문이 구상 한 바와 같이, 모델 진입 순서에 따라 요인들에 대한 분산의 순차적 속성이다. 순서 는 R 패키지 의 Anova()
기능에 의해 제공되는 type-II 또는 type-III 테스트와 관련 이 없습니다car
. 그러나 이러한 대안은 위 링크에 언급 된 자체 잠재적 인 단점이 있습니다.
마지막으로, lm()
R에서 와 같이 다중 선형 회귀와의 관계를 고려하십시오 . 이는 상호 작용 항을 포함하는 경우 본질적으로 동일한 유형의 모형입니다. 변수의 입력 순서는로 보고 된 lm()
회귀 계수 및 p- 값의 관점에서 중요하지 않습니다 summary(lm())
. 여기서 k 수준 범주 형 요인은 (k-1) 이진 더미 변수로 코딩되고 회귀 계수는 각 더미에 대해보고됩니다 .
그러나 lm()
출력을 anova()
R stats
패키지의 소문자 "a" 로 랩핑 하거나 Anova()
기존 ANOVA에서 예상하는대로 모든 레벨에 대한 각 요인의 영향을 요약 할 수 있습니다. 그런 요인의 순서로 중요합니다 anova()
경우와 aov()
,와 함께 문제가되지 않습니다 Anova()
. 마찬가지로 어떤 유형의 분산 분석을 사용해야하는지에 대한 분쟁이 다시 발생합니다. 따라서 lm()
모델의 모든 다운 스트림 사용에서 요인 입력의 순서 독립성을 가정하는 것은 안전하지 않습니다 .
* 모든 세포에서 동일한 수의 관측 값을 갖는 것으로 충분하지만, 내가 알기로는 요인의 순서가 관련이 없을 필요는 없습니다. 덜 까다로운 유형의 잔고는 주문 독립성을 허용 할 수 있습니다.