MANOVA의 귀무 가설은 무엇입니까?


11

배경

서로 다른 그룹 사이의 일부 연속 변수의 차이 (범주 형 변수에 의해 제공됨)를 분석하기 위해 일원 분산 분석을 수행 할 수 있습니다. 설명 적 (범주 형) 변수가 여러 개인 경우 요인 분산 분석을 수행 할 수 있습니다. 여러 연속 변수 (즉, 여러 반응 변수)에서 그룹 간 차이를 분석하려면 다변량 분산 분석 (MANOVA)을 수행해야합니다.

질문

여러 응답 변수에 대해 ANOVA와 유사한 테스트를 수행하는 방법을 거의 이해하지 못하며, 더 중요하게는 귀무 가설이 무엇인지 이해할 수 없습니다. 귀무 가설입니다.

  • "각 반응 변수에 대해 모든 그룹의 평균이 동일합니다",

아니면

  • "적어도 하나의 반응 변수의 경우 모든 그룹의 평균이 같습니다",

아니면 다른 인가?H0


나는 말할 수 없다. 당신은 또한 ANOVA가 어떻게 작동하는지 묻는가? 표준 오류가 무엇인지 논의하는 맥락에서 나는 분산 분석의 기본 개념을 본질적으로 설명합니다. 표준 오류는 어떻게 작동합니까?
gung-복직 모니카

두 진술 중 어느 것도 아닙니다. 다변량 공간H0 에는 차이가 없다는 것입니다 . 다변량 사례는 분산 만이 아니라 공분산을 다루어야하기 때문에 단 변량보다 훨씬 더 복잡합니다. MANOVA 에서 가설 을 공식화하는 방법에는 여러 가지가 있습니다 . Wikipedia를 읽으십시오. H0-H1
ttnphns 2016 년

@ttnphns : 왜 둘 다? 분산 분석 의 은 모든 그룹의 평균이 동일하다는 것입니다. MANOVA 의 는 모든 그룹의 다변량 평균이 동일하다는 것입니다. 이것은 OP의 대안 1입니다. 공분산 등은 입력 가정 하고 계산 MANOVA 아닌 귀무 가설의를. H0H0
amoeba

@amoeba는 싫었습니다 For each response variable. 나에게 그것은 "각각의 테스트가 일관되게 수행된다"고 들린다.
ttnphns

답변:


9

일원 분산 분석 의 귀무 가설 은 모든 그룹의 평균이 동일하다는 것입니다.단방향 MANOVA 의 귀무 가설 은 모든 그룹의 [다변량] 평균이 동일하다는 것입니다.이는 평균이 각 반응 변수에 대해 동일하다는 것, 즉 첫 번째 옵션이 정확 하다는 것을 말하는 것과 같습니다 .H0

H0:μ1=μ2=...=μk.
H0
H0:μ1=μ2=...=μk.

두 경우 모두 대립 가설 은 널 (NULL)의 부정입니다. 두 경우 모두 가정은 (a) 그룹 내 가우시안 분포 및 (b) 그룹 간 등분 산 (ANOVA) / 공분산 행렬 (MANOVA)입니다.H1

MANOVA와 ANOVA의 차이점

약간 혼란 스러울 수 있습니다. MANOVA 의 귀무 가설은 일 변량 분산 분석 모음에 대한 귀무 가설 조합 과 정확히 동일 하지만 동시에 MANOVA를 수행하는 것은 일 변량 분산 분석을 수행하는 것과 동등하지 않다는 것을 알고 있습니다. 결합 "결과 (다양한 조합 방법을 제시 할 수 있음). 왜 안돼?

답은 모든 일 변량 분산 분석을 실행하면 동일한 귀무 가설을 검정하더라도 검정력이 떨어집니다. 일 변량 분산 분석 중 어느 것도 유의하지 않은 경우 MANOVA가 어떻게 유의미한 차이를보고 할 수 있습니까? "결합"의 순진한 방법 (적어도 하나의 ANOVA가 널을 거부하는 경우 전역 널을 거부 함)은 제 1 종 오류율의 거대한 인플레이션을 초래합니다. 그러나 올바른 오류율을 유지하기 위해 현명한 "결합"방법을 선택하더라도 전력이 손실됩니다.

테스트 작동 방식

ANOVA 는 되도록 총 제곱합 를 그룹 간 합산 와 그룹 내 합산 분해합니다 . 그런 다음 비율을 계산합니다 . 귀무 가설 하에서이 비율은 작아야합니다 (약 ). 귀무 가설 하에서 예상되는이 비율의 정확한 분포를 계산할 수 있습니다 ( 과 그룹 수에 따라 다름). 이 분포와 관측 값 를 비교하면 p- 값이 산출됩니다.TBWT=B+WB/W1nB/W

MANOVA는 총 산란 행렬 를 그룹 간 산란 행렬 와 그룹 내 산란 행렬 분해 하여 됩니다. 그런 다음 행렬 를 계산합니다 . 귀무 가설 하에서이 행렬은 "작은"이어야합니다 (약 ). "작은"양을 어떻게 정량화합니까? MANOVA는 이 행렬 의 고유 값 를 확인합니다 (모두 긍정적 임). 다시, 귀무 가설 하에서 이러한 고유 값은 "작은"이어야합니다 (모두 약TBWT=B+WW1BIλi1). 그러나 p- 값을 계산하려면 null 아래의 예상 분포와 비교할 수 있으려면 하나의 숫자 ( "통계")가 필요합니다. 여러 가지 방법이 있습니다 : 모든 고유 값의 합을 취하십시오 ; 최대 고유 값 등을 취하십시오 . 각 경우에이 숫자는 널 (null) 아래에 예상되는이 수량의 분포와 비교되어 p- 값이됩니다.λimax{λi}

검정 통계량을 다르게 선택하면 p- 값이 약간 달라 지지만 각 경우에 동일한 귀무 가설이 검정되고 있음을 인식해야합니다.


또한 다중 검정을 수정하지 않으면 모든 일 변량 분산 분석법에 따라 유형 I 오류 인플레이션이 발생합니다.
gung-복직 모니카

1
@ gung : 그렇습니다. 그러나 하나 이상의 ANOVA가 널을 거부하자마자 널을 거부하는 것보다 "결합"하는 것이 더 현명 할 수 있습니다. 내 요점은 똑똑한 사람이 "결합"하려고 시도했지만 MANOVA와 비교할 때 여전히 오류가 발생하지 않고 테스트 크기를 유지하더라도 전력이 손실된다는 것입니다.
amoeba

그러나 이제 그 "힘"이 공분산의 개념과 직접 관련이 있습니까? 도덕은 (일련의) 일 변량 테스트를 통해 SSdifference/SSerror스칼라 인 한계 효과에 대해서만 테스트한다는 것 입니다. MANOVA에서 다변량 효과는 SSCPerror^(-1)SSCPdifference행렬입니다 (총 공분산 및 그룹 내에서 설명 함). 그러나 검정 통계량에 단일 방식이 아닌 "결합"될 수있는 몇 개의 고유 값이 있기 때문에 몇 가지 가능한 대안 가설이 존재합니다. 더 많은 힘-더 이론적 인 복잡성.
ttnphns

@ttnphns, 그렇습니다. 이것은 모두 정확하지만 귀무 가설이 내가 쓴 것과 같은 사실을 바꾸지 않는다고 생각합니다 (그리고 그것이 질문에 관한 것입니다). 사용 된 검정 통계량 (Wilks / Roy / Pillai-Bartlett / Lawley-Hotelling)은 동일한 귀무 가설을 검정하려고합니다. 이에 대한 자세한 내용은 나중에 답변을 확장 할 수 있습니다.
amoeba

1
@gung은 나에게 차임하도록 요청했다. (왜 그런지 모르겠다. 나는 약 7 년 전에 MANOVA를 가르쳤고 그것을 적용한 적이 없다.)-나는 이 널 완전히 부정 한다고 말하는 데 amoeba가 옳다고 말할 것이다 , 이는 매개 변수의 차원 공간에 있는 차원 초 공간입니다 ( 가 지금까지 정의를 방해하지 않는 차원 인 경우 ) . OP에서 제공하는 옵션 1입니다. 옵션 2는 테스트하기가 훨씬 더 어렵습니다. H1H0:μgroup 1==μgroup kpkpp
StasK

8

전자입니다.

그러나 그렇게하는 방식은 문자 그대로 각 원래 변수의 평균을 차례로 비교하는 것이 아닙니다. 대신 반응 변수는 주성분 분석 과 매우 유사한 방식으로 선형 변환됩니다 . (PCA에는 훌륭한 스레드가 있습니다. 주요 구성 요소 분석, 고유 벡터 및 고유 값 이해 ) PCA는 최대 변동 방향에 맞춰 축 방향을 조정하는 반면 MANOVA는 축을 회전하는 방향으로 축을 회전시킵니다. 그룹의 분리를 극대화하십시오.

분명히 말하면, MANOVA와 관련된 테스트 중 어느 것도 원래 공간 또는 변환 된 공간의 수단을 사용하여 직접적인 의미로 모든 수단을 차례로 테스트하지 않습니다. 각기 약간 다른 방식으로 작동하는 몇 가지 테스트 통계가 있지만 그럼에도 불구하고 공간을 변형시키는 분해의 고유 값에 대해 작동하는 경향이 있습니다. 그러나 귀무 가설의 특성상 모든 그룹의 모든 수단은 각 반응 변수에서 동일하지만 일부 변수에서는 다를 수 있지만 적어도 하나에서는 동일합니다.


O .... 그래서 Manova는 선형 판별 분석을 수행하고 (그룹 평균 간의 거리를 최대화하기 위해) 응답 변수로 첫 번째 축을 사용하여 표준 anova를 실행합니까? 그래서 는 "PC1의 관점에서 모든 그룹의 수단은 동일하다"입니다. 맞습니까? Ho
Remi.b

여러 가지 가능한 테스트가 있습니다. 첫 번째 축만 테스트하는 것은 기본적으로 Roy의 가장 큰 루트를 테스트로 사용합니다. 이것은 종종 가장 강력한 테스트이지만 더 제한적입니다. 어떤 테스트가 '최고'인지에 대한 지속적인 토론이 있습니다.
gung-복직 모니카

여러 테스트 문제를 피하기 위해 여러 분산 분석 대신 MANOVA를 사용한다고 생각합니다. 그러나 MANOVA를 수행하여 LDR의 PC1에서 ANOVA를 만드는 경우 에도 Pvalue를 볼 때 고려해야 할 여러 테스트 문제가 있습니다. 이게 옳은 거니? (더 이해가
되길 바랍니다.

이는 통찰력있는 요점이지만 두 가지 문제가 있습니다. 1) 축이 이제 직교하고 있으며 여러 테스트를 통해 문제를 변경할 수 있습니다. 2) MANOVA 테스트 통계의 샘플링 분포는 여러 축을 고려합니다.
gung-복직 모니카

1
@ Remi.b : 이것들은 좋은 질문이지만 분명합니다 : MANOVA는 LDA의 첫 번째 판별 축에 대한 분산과 동일 하지 않습니다 ! MANOVA와 LDA의 관계는 여기를 참조하십시오. MANOVA는
amoeba
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.