관계


39

하자 내가 두 개의 1 차원 배열이 있다고 12 . 각 데이터 포인트는 100 개입니다. 1 실제 데이터이며 2 모델 예측이다. 이 경우 R 2 값은 다음과 같습니다. R 2 = 1 S S r e sa1a2a1a2R2

R2=1SSresSStot  (1).
한편, 이것은 상관 계수의 제곱 값
R2=(Correlation Coefficient)2(2).
이제 바꿀 경우 2 : 2는 실제 데이터이며 1 모델 예측이다. 식 ( 2 )로부터 , 상관 계수는 어느 것이 먼저 오는지를 신경 쓰지 않기 때문에, R 2 값은 동일 할 것이다. 그러나, 식 ( 1 ) , S S t O t = Σ I ( Y I - ˉ Y가 ) (2) R (2) 값이 변경되고 있기 때문에 S Sa2a1(2)R2(1)SStot=i(yiy¯)2R2SStot 우리 전환하면 변경된y으로부터 1 2 ; 그동안S S의 연구에 E S =는 σ ( f를 - ˉ Y ) (2)가 변경되지 않는다.a1a2SSres=i(fiy¯)2

내 질문은 : 어떻게 서로 모순 될 수 있습니까?

편집 :

  1. 나는 Eq.의 관계가 궁금합니다. (2) 단순한 선형 회귀가 아닌 경우, 즉 IV와 DV의 관계가 선형이 아닌 경우에도 여전히 서 있습니까 (지수 / 로그 일 수 있음)?

  2. 예측 오차의 합이 0이 아닌 경우이 관계는 여전히 유효합니까?


나는이 프리젠 테이션이 매우 유용하고 기술적
이지 않다는

답변:


19

이것은 사실이다 변경됩니다 ...하지만 당신은 사각형의 회귀 합이뿐만 아니라 변경됩니다 사실을 잊어 버렸습니다. 간단한 회귀 모형을 고려하고 상관 계수를 r 2 x y = S 2 x y 로 표시하겠습니다.SStot , 하위 인덱스xy를사용하여x가 독립 변수이고y가 종속 변수라는 사실을 강조했습니다. 물론,R2 , X , Y는 당신이 교환하는 경우 변경되지 않습니다X를함께Y. 우리는SSRxy=Syy(R2 x y )를 쉽게 보여줄 수 있습니다. 여기서SSRxyrxy2=Sxy2SxxSyyxyxyrxy2xySSRxy=Syy(Rxy2)SSRxy x 가 독립적이고 y 가 종속 변수인총 제곱합입니다. 따라서 : R 2 x y = S S R x ySyyxy여기서SSExyx가 독립적이고y가 종속 변수인제곱의 해당 잔차 합입니다. 이 경우SSExy=b2 x y Sxxb=Sxy가 있습니다.

Rxy2=SSRxySyy=SyySSExySyy,
SSExyxySSExy=bxy2Sxx (예를 들어 여기에서 식 (34)-(41)참조) 따라서 :R2 x y =Syy- S 2 x yb=SxySxx분명히 위의 방정식은xy에대해 대칭입니다. 즉,R2 x y =R2 y x 입니다. 변경할 때 요약X를가진Y단순 회귀 모형에서, 두 분자와 분모R2 , X , Y =SSR을X(Y)를
Rxy2=SyySxy2Sxx2.SxxSyy=SyySxxSxy2Sxx.Syy.
xy
Rxy2=Ryx2.
xyR2 x y =R2 y x 와 같은 방식으로 변경됩니다.Rxy2=SSRxySyyRxy2=Ryx2.

R2=r2

1
R2=SSreg/SStotSSres=i(fiy¯)2SStotR2변경되었습니다.
Shawn Wang

p- 변형 가우스의 일반적인 경우에 이것을 해결하는 방법에 대한 참조가 있습니까?
jmb

26

R2yiy^i

관측 값 yi와 적합치 y ^ i 사이의 제곱 Pearson 상관 계수에서 결정 계수 R2를 도출하는 방법에 대한 완전한 증거는 다음 링크에서 찾을 수 있습니다.

http://economictheoryblog.wordpress.com/2014/11/05/proof/

내 눈에는 이해하기 쉬울 것입니다. 단일 단계를 따르십시오. 두 핵심 인물 간의 현실이 실제로 어떻게 작동하는지 이해하는 것이 필수적이라고 생각합니다.


6

R2=r2=Corr(x,y)2

R2=Corr(yestimated,yobserved)2

반응과 적합 선형 모형 간의 상관의 제곱입니다.


5

rr2

rYXXYr.30

r2r2=(covσxσy)2=|cov|σx2|cov|σy2r2proppropr

covσx2σy2covcovσx2σy2σxσyr2r

rr2Y~XX~Y


R2R2R2

결정 계수 또는 R- 제곱은 단순한 선형 회귀에 관한 r ^ 2보다 넓은 개념입니다. wikipedia en.wikipedia.org/wiki/Coefficient_of_determination을 읽으십시오 .
ttnphns

다시 감사합니다! 이해합니다. 내 질문은 : 더 복잡한 회귀에 대해 여전히 결정 계수를 얻기 위해 r 값을 제곱 할 수 있습니까?
Shawn Wang

1
"복잡한 회귀"의 경우 R- 제곱을 얻지 만 r은 얻지 못합니다.
ttnphns

1

R2=r2R2

x=rnorm(1000); y=rnorm(1000)              # store random data
summary(lm(y~x))                          # fit a linear regression model (a)
summary(lm(x~y))                          # swap variables and fit the opposite model (b)
z=lm(y~x)$fitted.values; summary(lm(y~z)) # substitute predictions for IV in model (a)

R2R2

R2r2R2rρ


1
R2=0.1468SSR>SSTR2R2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.