두 변수 ( 과 ) 사이의 상호 작용을 조사 하고 있습니다. 와 이러한 변수 사이에는 많은 선형 상관 관계가 있습니다. 문제의 본질에서 인과 관계에 대해 아무 말도 할 수 없습니다 ( 이 유발 하는지 또는 다른 방법으로). 특이 치를 탐지하기 위해 회귀선과의 편차를 연구하고 싶습니다. 이를 위해 의 함수로 의 선형 회귀를 만들 거나 다른 방법으로 만들 수 있습니다. 가변 순서 선택이 결과에 영향을 줄 수 있습니까?
두 변수 ( 과 ) 사이의 상호 작용을 조사 하고 있습니다. 와 이러한 변수 사이에는 많은 선형 상관 관계가 있습니다. 문제의 본질에서 인과 관계에 대해 아무 말도 할 수 없습니다 ( 이 유발 하는지 또는 다른 방법으로). 특이 치를 탐지하기 위해 회귀선과의 편차를 연구하고 싶습니다. 이를 위해 의 함수로 의 선형 회귀를 만들 거나 다른 방법으로 만들 수 있습니다. 가변 순서 선택이 결과에 영향을 줄 수 있습니까?
답변:
표준 회귀는 점과 선 사이의 수직 거리를 최소화하므로 두 변수를 전환하면 수평 거리가 최소화됩니다 (같은 산점도 제공). 다른 옵션 (여러 이름으로 표시)은 수직 거리를 최소화하는 것입니다. 이는 기본 구성 요소를 사용하여 수행 할 수 있습니다.
차이점을 보여주는 R 코드는 다음과 같습니다.
library(MASS)
tmp <- mvrnorm(100, c(0,0), rbind( c(1,.9),c(.9,1)) )
plot(tmp, asp=1)
fit1 <- lm(tmp[,1] ~ tmp[,2]) # horizontal residuals
segments( tmp[,1], tmp[,2], fitted(fit1),tmp[,2], col='blue' )
o <- order(tmp[,2])
lines( fitted(fit1)[o], tmp[o,2], col='blue' )
fit2 <- lm(tmp[,2] ~ tmp[,1]) # vertical residuals
segments( tmp[,1], tmp[,2], tmp[,1], fitted(fit2), col='green' )
o <- order(tmp[,1])
lines( tmp[o,1], fitted(fit2)[o], col='green' )
fit3 <- prcomp(tmp)
b <- -fit3$rotation[1,2]/fit3$rotation[2,2]
a <- fit3$center[2] - b*fit3$center[1]
abline(a,b, col='red')
segments(tmp[,1], tmp[,2], tmp[,1]-fit3$x[,2]*fit3$rotation[1,2], tmp[,2]-fit3$x[,2]*fit3$rotation[2,2], col='red')
legend('bottomright', legend=c('Horizontal','Vertical','Perpendicular'), lty=1, col=c('blue','green','red'))
특이 치를 찾으려면 기본 성분 분석 결과를 플롯하면됩니다.
당신은 또한 볼 수 있습니다 :
Bland and Altman (1986), 두 가지 측정 방법 사이의 합의를 평가하기위한 통계 방법. 란셋, 307-310 페이지