선형 회귀에서는 종종 여러 개의 R과 R이 제곱됩니다. 그들 사이의 차이점은 무엇입니까?
선형 회귀에서는 종종 여러 개의 R과 R이 제곱됩니다. 그들 사이의 차이점은 무엇입니까?
답변:
와 반대로 대문자 는 일반적으로 다중 회귀 모델에서 다중 이어야합니다 . 변량 선형 회귀 어떠한 다중 없다 , 및 . 따라서 "다중 "은 다중 회귀자를 의미하지만 " "는 반드시 그런 것은 아닙니다.
또 다른 간단한 차이점은 해석입니다. 다중 회귀 분석에서 다중 은 다중 상관 계수 이고, 제곱은 결정 계수입니다 . 은 이변 량 상관 계수처럼 다소 해석 될 수 있는데, 주된 차이점은 다중 상관이 예측 변수의 의존성 변수와 선형 조합 사이에 있다는 것입니다. 는 예측 변수로 설명 할 수있는 종속 변수의 분산 백분율로 해석 할 수 있습니다 . 위와 같이 예측 변수가 하나 뿐인 경우에도 마찬가지입니다.
실제로 다중 R은 반응 값과 적합치 간의 상관 관계로 볼 수 있습니다. 따라서 항상 긍정적입니다. 다중 R 제곱은 제곱 버전입니다.
작은 예를 사용하여 설명하겠습니다.
set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)
fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared: 0.2347
(R <- cor(y, fitted(fit))) # 0.4845068
R^2 # 0.2347469