다른 사람들이 지적했듯이, 이것은 상호 작용으로 선형으로 모델링 될 수 있습니다. 두 개의 인형과 상호 작용하고 있으며 이것에 대해 비선형은 없습니다. 주어진 모델 :
'성별'한계 효과는 부분 미분입니다.
w t = α + b1ge + b2지e n de r + b삼ge ※ ge n der+ϵ
∂승 t∂지e n de r= b2+ b삼g이자형
성별과 연령이 0 또는 1의 값만 가질 수 있다면 어떻게 4 개의 다른 그룹의 평균 차이 만보고 있습니까? 즉, 우리는 단지 우리는 상기 식에 연결할 수 네 개의 서로 다른 조합이있다 : (1) 및지e nde r = 0 , (2) g e n d e r = 1 및 a g e = 1 , (3) g e n d e r = 0 및 a g eㅏge = 0지e n der=1age=1gender=0 이고 (4) g e n d e r = 1 이고 a g e = 0 입니다. 따라서 특정 예는 4 개의 그룹 평균을 비교하는 것과 같습니다.age=1gender=1age=0
보는 것도 도움이 될 것입니다 위의 이 두 개의 상호 작용 된 명목 변수가있는 분산 분석과 어떻게 동일한 지 이해 이 토론 . 특정 예를 사용하여 (연령과 성별의 조합이 4 개뿐이므로) 명시 적 상호 작용 항없이 다음과 같은 모델을 지정할 수도 있습니다.
wt=α+b1young.male+b2old.male+b3young.female+ϵ
여기서 는 참조 범주로 생략되며 계수 b 1 은 o l d 간의 평균 차이가됩니다 .o l d. 에프e m a l e비1 및 y o u n g . m a l e . 여기서 인터셉트 α 는 o l d 내의평균 w t와 같습니다 . f를 전자o l d. 에프전자 ma l e와이o u n g. m a l eα승 t (다시 말해서 참조 범주).o l d. 에프e m a l e
자신의 데이터로 사용해보십시오. 교호 작용이있는 선형 모델, 교호 작용이있는 분산 분석 또는 교호 작용이없는 각 그룹에 더미를 사용하면 동일한 결과를 얻을 수 있습니다. 멋지다, 응? 통계 책은이 장들 각각에 대해 다른 장에서 다룰 것입니다 그러나 모든 길은 로마로 연결됩니다. 실제로 이것이 자신의 데이터와 어떻게 작동하는지 보는 것이 배우는 가장 좋은 방법 중 하나입니다. …
따라서 위의 예는이 결론에 도달하기에는 너무 복잡한 방법이지만 (실제로 네 가지 그룹 평균을 비교하고 있음) 상호 작용이 작동하는 방식을 배우는 데 도움이된다고 생각합니다. CV에는 연속 변수를 공칭 변수와 상호 작용하거나 두 개의 연속 변수를 상호 작용하는 방법에 대한 다른 좋은 게시물이 있습니다. 비모수 적 검정을 지정하기 위해 귀하의 질문을 편집했지만 가설 검정에 대한 대부분의 비모수 적 접근 방식은 논리가 동일하지만 일반적으로 특정 분포에 대한 가정이 적습니다.
승 t
o l d. m e n와이o u n g. w o m e n
"중요한"상호 작용에 대한 간단한 설명
엑스1엑스2엑스1엑스2그러나 0 또는 1의 값만 가질 수있는 두 개의 공변량 만 있다면, 우리는 본질적으로 4 개의 그룹 평균을보고 있음을 의미합니다.
작동 예
상호 작용 모델의 결과와 Dunn의 테스트 결과를 비교해 보겠습니다. 먼저 (a) 남성의 체중이 (b) 젊은 남성의 체중이 남성보다 적으며 (c) 젊은 여성과 노인 여성간에 차이가없는 데이터를 생성 해 보겠습니다.
set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))
승 t
mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)
model: wt ~ age * gender
age*gender effect
gender
age male female
old 80.61897 57.70635
young 67.78351 56.01228
한계 효과에 대한 표준 오차 또는 신뢰 구간을 계산해야합니까? 위에서 언급 한 '효과'패키지가이를 수행 할 수 있지만 Aiken and West (1991)는 훨씬 복잡한 상호 작용 모델에 대해서도 공식을 제공합니다. 그들의 테이블은 Matt Golder의 훌륭한 주석과 함께 여기 에 편리하게 인쇄되어 있습니다 .
이제 Dunn의 테스트를 구현합니다.
#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")
Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0
Comparison of x by group
(Benjamini-Hochberg)
Col Mean-|
Row Mean | old.men young.me young.wo
---------+---------------------------------
young.me | 3.662802
| 0.0002*
|
young.wo | 7.185657 3.522855
| 0.0000* 0.0003*
|
old.wome | 6.705346 3.042544 -0.480310
| 0.0000* 0.0014* 0.3155
Kruskal-Wallis 카이 제곱 검정 결과의 p- 값은 우리 그룹 중 하나 이상이 '다른 인구에서 온'것으로 나타냅니다. 그룹 별 비교의 경우 상위 숫자는 Dunn의 z- 검정 통계량이고 하위 숫자는 p- 값이며 다중 비교를 위해 조정되었습니다. 예제 데이터가 다소 인공적인 것이 었으므로 작은 p- 값이 너무 많은 것은 놀라운 일이 아닙니다. 그러나 젊은 여성과 노인 여성의 오른쪽 아래 비교에 유의하십시오. 검정은이 두 그룹간에 차이가 없다는 귀무 가설을 올바르게 지원합니다.
…
업데이트 : 다른 답변이 주어지면이 답변은 어떤 형태의 비선형 모델링이 필요하다는 아이디어 또는 두 개의 이진 공변량 (예 : 네 개의 그룹)에 대한 OP의 특정 예를 감안할 때 이를 비모수 적으로 평가하기위한 부호 변경. 예를 들어 나이가 계속되면이 문제에 접근 할 수있는 다른 방법이있을 수 있지만 OP가 제시 한 예는 아닙니다.