1978 년 옥스퍼드에서 석사 과정을 밟았을 때 ANOVA를 처음 접했습니다. 다중 회귀 모델에서 연속적이고 범주 형 변수를 함께 가르치는 현대적인 접근 방식은 젊은 통계학자가 진행 상황을 이해하기 어렵게 만듭니다. 따라서 더 간단한 시간으로 돌아가는 것이 도움이 될 수 있습니다.
ANOVA는 원래 형태로 산술 연습으로 전체 제곱합을 처리, 블록, 상호 작용 등과 관련된 조각으로 나눕니다. 균형 잡힌 설정에서 SSB 및 SST와 같은 직관적 인 의미의 제곱합은 조정 된 총 제곱합에 합산됩니다. 이 모든 것은 Cochran의 정리 덕분에 작동합니다 . Cochran을 사용하면 일반적인 귀무 가설 하에서 이러한 항의 예상 값을 계산할 수 있으며 여기에서 F 통계가 흐릅니다.
보너스로 Cochran과 제곱합에 대해 생각하기 시작하면 직교 대비를 사용하여 치료 제곱합을 자르고 잘라내는 것이 좋습니다. 분산 분석표의 모든 항목은 통계학자가 관심을 갖고 해석해야하며 검증 가능한 가설을 산출해야합니다.
최근 에 MOM과 ML 방법의 차이가 발생 하는 대답을 썼습니다 . 이 질문은 랜덤 효과 모델 추정을 켰습니다. 이 시점에서 기존의 분산 분석법은 최대 가능성 추정을 통해 전체 부품 회사에 접근하며 효과의 추정치가 더 이상 동일하지 않습니다. 설계의 균형이 맞지 않으면 동일한 F 통계도 얻지 못합니다.
σ2피σ2σ2+ n 개의 σ2피엔σ2비^. 분산 분석은 랜덤 효과 분산에 대한 모멘트 추정 방법을 제공합니다. 이제 우리는 혼합 효과 모델로 이러한 문제를 해결하는 경향이 있으며 분산 성분은 최대 우도 추정 또는 REML을 통해 얻습니다.
이와 같은 분산 분석은 모멘트 방법이 아닙니다. 제곱의 합 (보다 일반적으로 2 차 반응의 형태)을 의미있는 가설을 도출하는 구성 요소로 분할합니다. F 검정이 작동하기 위해 제곱합이 카이 제곱 분포를 갖기를 원하기 때문에 정규성에 크게 의존합니다.
최대 우도 프레임 워크는보다 일반적이며 제곱합이 적용되지 않는 일반화 된 선형 모형과 같은 상황에 적용됩니다. R과 같은 일부 소프트웨어는 점근 카이 제곱 분포를 사용하여 가능성 비율 테스트에 대한 anova 방법을 지정하여 혼란을 불러옵니다. "anova"라는 용어의 사용을 정당화 할 수 있지만, 엄밀히 말하면, 그것의 배후에있는 이론은 다르다.