다중 R과 R 제곱의 차이점은 무엇입니까?


14

선형 회귀에서는 종종 여러 개의 R과 R이 제곱됩니다. 그들 사이의 차이점은 무엇입니까?

답변:


15

와 반대로 대문자 는 일반적으로 다중 회귀 모델에서 다중 이어야합니다 . 변량 선형 회귀 어떠한 다중 없다 , 및 . 따라서 "다중 "은 다중 회귀자를 의미하지만 " "는 반드시 그런 것은 아닙니다.R2r2R2RR2=r2RR2

또 다른 간단한 차이점은 해석입니다. 다중 회귀 분석에서 다중 은 다중 상관 계수 이고, 제곱은 결정 계수입니다 . 은 이변 량 상관 계수처럼 다소 해석 될 수 있는데, 주된 차이점은 다중 상관이 예측 변수의 의존성 변수와 선형 조합 사이에 있다는 것입니다. 는 예측 변수로 설명 할 수있는 종속 변수의 분산 백분율로 해석 할 수 있습니다 . 위와 같이 예측 변수가 하나 뿐인 경우에도 마찬가지입니다.RR아르 자형2


5
따라서 다중 회귀 분석에서 R ^ 2가 .76이면 모형이 종속 변수의 분산의 76 %를 설명한다고 말할 수있는 반면 r ^ 2가 .86이면 모형이 86 %의 종속 변수의 분산? 해석의 차이점은 무엇입니까?
wizlog

대답에서 알 수 있듯이 "다중 R"은 여러 회귀자를 의미합니다. 단일 회귀 모형에서 여러 개의 R 값을 가질 수 있습니까?
Abrar

2

실제로 다중 R은 반응 값과 적합치 간의 상관 관계로 볼 수 있습니다. 따라서 항상 긍정적입니다. 다중 R 제곱은 제곱 버전입니다.

작은 예를 사용하여 설명하겠습니다.

set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)

fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared:  0.2347

(R <- cor(y, fitted(fit))) # 0.4845068
R^2                        # 0.2347469

엑스엑스


0

나는 단순히 학생들에게 다음과 같이 설명합니다.

  1. 다중 R은 상관 계수의 절대 값 (또는 음의 부호가없는 상관 계수)으로 간주됩니다!

  2. R- 제곱은 단순히 다중 R의 제곱입니다. 독립 변수 (들)에 의해 유발 된 변동의 백분율로 표시 될 수 있습니다.

이런 방식으로 개념과 차이점을 쉽게 파악할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.