내 모든 변수는 연속적입니다. 레벨이 없습니다. 심지어 수 있는가 가 변수 사이의 상호 작용을?
내 모든 변수는 연속적입니다. 레벨이 없습니다. 심지어 수 있는가 가 변수 사이의 상호 작용을?
답변:
예, 왜 안되나요? 이 경우 범주 형 변수와 동일한 고려 사항이 적용됩니다 . 결과 Y 에 대한 의 효과 는 X 2 값에 따라 동일하지 않습니다 . 도움말을 시각화, 당신이 취한 값 생각할 수 X 1 X 2가 높거나 낮은 값을 사용합니다. 범주 형 변수와 달리 여기에서 상호 작용은 X 1 과 X 2 의 곱으로 표현됩니다 . 참고로 두 변수를 먼저 중심에 두는 것이 좋습니다 ( X 1에 대한 계수 는 X 일 때 X 1 의 영향으로 읽습니다) 는 표본 평균에 있습니다).
친절 @whuber 의해 제안 된 바와 같이, 쉽게 어떻게 볼 에 따라 변화 Y를 함수로서 X 2 상호 작용 기간이 포함되고하면, 모델 적어 인 E ( Y | X ) = β 0 + β 1 X를 1 + β 2 X 2 + β 3 X 1 X 2 .
그리고, 1 단위 증가의 효과가있는 것을 알 수있다 때 X 2 유지 상수는 다음과 같이 표현 될 수있다 :
마찬가지로, X 1을 일정하게 유지하면서 가 1 단위 증가 할 때의 효과 는 β 2 + β 3 X 1 입니다. 이것은 X 1 ( β 1 )과 X 2 ( β 2 )의 영향을 분리 하여 해석하기 어려운 이유를 보여줍니다 . 두 예측 변수가 서로 밀접하게 관련되어 있으면 더욱 복잡해집니다. 그러한 선형 모델에서 만들어지는 선형성 가정을 명심해야합니다.
당신은 한 번 봐 가질 수 테스트 및 해석 상호 작용 : 다중 회귀 분석 다중 회귀 분석에서 상호 작용 효과의 다른 종류의 개요, 레오나 S. 에이 킨, 스티븐 G. 웨스트, 그리고 레이몬드 R. 리노 (세이지 간행물, 1996)에 의해을 . (이 책은 아마도 최고의 책은 아니지만 Google을 통해 구할 수 있습니다)
R의 장난감 예제는 다음과 같습니다.
library(mvtnorm)
set.seed(101)
n <- 300 # sample size
S <- matrix(c(1,.2,.8,0,.2,1,.6,0,.8,.6,1,-.2,0,0,-.2,1),
nr=4, byrow=TRUE) # cor matrix
X <- as.data.frame(rmvnorm(n, mean=rep(0, 4), sigma=S))
colnames(X) <- c("x1","x2","y","x1x2")
summary(lm(y~x1+x2+x1x2, data=X))
pairs(X)
출력이 실제로 읽는 위치 :
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.01050 0.01860 -0.565 0.573
x1 0.71498 0.01999 35.758 <2e-16 ***
x2 0.43706 0.01969 22.201 <2e-16 ***
x1x2 -0.17626 0.01801 -9.789 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3206 on 296 degrees of freedom
Multiple R-squared: 0.8828, Adjusted R-squared: 0.8816
F-statistic: 743.2 on 3 and 296 DF, p-value: < 2.2e-16
시뮬레이션 된 데이터는 다음과 같습니다.
@ whuber의 두 번째 주석을 설명하기 위해 항상 X 1 의 다른 값 (예를 들어, terciles 또는 decile) 에서 X 2 의 함수로 의 변형을 볼 수 있습니다 . 이 경우 격자 표시가 유용합니다. 위의 데이터를 사용하여 다음과 같이 진행합니다.
library(Hmisc)
X$x1b <- cut2(X$x1, g=5) # consider 5 quantiles (60 obs. per group)
coplot(y~x2|x1b, data=X, panel = panel.smooth)
n
(11K)이고 MiniTab을 사용하여 상호 작용 그림을 사용하고 있으며 계산 하는 데 영원히 걸리지 만 아무것도 표시하지 않는다는 것입니다. 이 데이터 세트와 상호 작용이 있는지 어떻게 알 수 있는지 잘 모르겠습니다 .