Tukey의 절차와 유의 한 전체 분산을 얻을 수 있지만 쌍별 차이는없는 방법은 무엇입니까?


18

R AN ANOVA로 수행 한 결과 상당한 차이가있었습니다. 그러나 Tukey의 절차를 사용하여 어떤 쌍이 크게 다른지 확인할 때 나는 그중 하나를 얻지 못했습니다. 이것이 어떻게 가능합니까?

코드는 다음과 같습니다.

fit5_snow<- lm(Response ~ Stimulus, data=audio_snow)
anova(fit5_snow)

> anova(fit5_snow)
Analysis of Variance Table

Response: Response
          Df Sum Sq Mean Sq F value  Pr(>F)  
Stimulus   5  73.79 14.7578  2.6308 0.02929 *
Residuals 84 471.20  5.6095                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

df<-df.residual(fit5_snow)
MSerror<-deviance(fit5_snow)/df

comparison <-  HSD.test(audio_snow$Response, audio_snow$Stimulus, df, MSerror, group=FALSE)

> comparison <-  HSD.test(audio_snow$Response, audio_snow$Stimulus, df, MSerror, group=FALSE)

Study:

HSD Test for audio_snow$Response 

Mean Square Error:  5.609524 

audio_snow$Stimulus,  means

                audio_snow.Response   std.err replication
snow_dry_leaves            4.933333 0.6208034          15
snow_gravel                6.866667 0.5679258          15
snow_metal                 6.333333 0.5662463          15
snow_sand                  6.733333 0.5114561          15
snow_snow                  7.333333 0.5989409          15
snow_wood                  5.066667 0.7713110          15

alpha: 0.05 ; Df Error: 84 
Critical Value of Studentized Range: 4.124617 

Comparison between treatments means

                              Difference   pvalue sig        LCL      UCL
snow_gravel - snow_dry_leaves  1.9333333 0.232848     -0.5889913 4.455658
snow_metal - snow_dry_leaves   1.4000000 0.588616     -1.1223246 3.922325
snow_sand - snow_dry_leaves    1.8000000 0.307012     -0.7223246 4.322325
snow_snow - snow_dry_leaves    2.4000000 0.071587   . -0.1223246 4.922325
snow_wood - snow_dry_leaves    0.1333333 0.999987     -2.3889913 2.655658
snow_gravel - snow_metal       0.5333333 0.989528     -1.9889913 3.055658
snow_gravel - snow_sand        0.1333333 0.999987     -2.3889913 2.655658
snow_snow - snow_gravel        0.4666667 0.994348     -2.0556579 2.988991
snow_gravel - snow_wood        1.8000000 0.307012     -0.7223246 4.322325
snow_sand - snow_metal         0.4000000 0.997266     -2.1223246 2.922325
snow_snow - snow_metal         1.0000000 0.855987     -1.5223246 3.522325
snow_metal - snow_wood         1.2666667 0.687424     -1.2556579 3.788991
snow_snow - snow_sand          0.6000000 0.982179     -1.9223246 3.122325
snow_sand - snow_wood          1.6666667 0.393171     -0.8556579 4.188991
snow_snow - snow_wood          2.2666667 0.103505     -0.2556579 4.788991

데이터를 줄 수 있습니까?
ttnphns

1
이 질문에 대한 답변 stats.stackexchange.com/questions/74174/… (이 스레드를 복제하는 것으로 표시됨)가 특히 도움이 된다는 것을 알았습니다 .
amoeba는 Reinstate Monica

답변:


2

왜 가능하지 않아야합니까?

전체 테스트와 쌍별 테스트는 다른 질문을하므로 서로 다른 답변을 얻을 수 있습니다.


1
더 말씀해 주시겠습니까?
rolando2

2
전체 분산 분석은 전체 독립 변수와 종속 변수와의 관계 (또는 그 부족)에 대해 질문합니다. 쌍별 비교는 쌍 간의 차이에 대해 묻습니다. 그런 다음 p- 값은 통계적 시그마를 살펴 봅니다. 여러 비교 (이 경우 Tukey의 HSD 방법 사용)에 대해 쌍으로 조정 된 각 항목의
Peter Flom-Monica Monica 복원

1
고마워, 피터 어쩌면 "다른 질문"을하는 것이 적고 다른 결과를 설명하는 여러 비교에 대한 조정이 더 많을 수도 있습니다.
rolando2

17

이것은 주로 ANOVA의 감도 (페어 와이즈 테스트 감도보다 큼) 때문입니다. 그런 다음, 쌍별 검정이 쌍의 평균을 거의 구별하지 못하는 경우 ANOVA는 평균 주변의 낮은 변동성을 감지합니다. 분석은 차이에 중점을 두어야하며 평균에 차이가 있음을 방금 알게 된 후 사후 분석에 더 유연 할 수 있습니다. 분산 분석 가정을 확인하십시오.

한편, 분산 분석을 사용하지 않고 페어 와이즈 테스트를 사용하는 것과 관련된 몇 가지 주제가 있습니다. 사후 테스트 전에 글로벌 테스트가 필요합니까?


hsd가 Type I 오류율을 제어하므로 Tukey hsd 비교를 수행하기 전에 글로벌 테스트가 필요하지 않습니다. 나는 그들이 선험적으로 계획되어야하기 때문에 사후 포스트라고 부르는 것을 싫어합니다.
David Lane
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.