R의 lm에서 조정 된 R- 제곱 공식은 무엇이며 어떻게 해석해야합니까?

35

조정 된 R- 제곱에 대해 R에서 사용되는 정확한 공식은 무엇입니까 lm() ? 어떻게 해석 할 수 있습니까?

조정 된 R- 제곱 공식

조정 된 R- 제곱을 계산하는 공식이 여러 개있는 것 같습니다.

나룻배의 식 : $1-(1-R^2)\frac{(n-1)}{(n-v)}$
McNemar의 식 : $1-(1-R^2)\frac{(n-1)}{(n-v-1)}$
주님의 공식 : $1-(1-R^2)\frac{(n+v-1)}{(n-v-1)}$
스타 인의 공식 : $1-\big[\frac{(n-1)}{(n-k-1)}\frac{(n-2)}{(n-k-2)}\frac{(n+1)}{n}\big](1-R^2)$

교과서 설명

Field의 교과서에 따르면, R을 사용한 통계 발견 (2012, p. 273) R은 Wherry의 방정식을 사용합니다. "모형이 표본을 추출한 모집단에서 모델이 도출 된 경우 Y의 분산이 얼마나 많이 설명되는지 알려줍니다." 그는 Wherry에 대한 공식을 제시하지 않습니다. 그는 Stein의 공식 (수동)을 사용하여 모델이 얼마나 잘 교차 검증되는지 확인하는 것이 좋습니다.
Kleiber / Zeileis, R이 적용된 응용 계량 경제학 (2008, p. 59)은 "Ther 's 조정 된 R- 제곱"이라고 주장하고 해석이 여러 R- 제곱과 어떻게 다른지 정확하게 말하지 않습니다.
Dalgaard, R의 입문 통계 (2008, p. 113)는 "[조정 된 R- 제곱]에 100 %를 곱하면 '% 분산 감소"로 해석 될 수 있습니다. 그는 이것이 어떤 공식에 해당하는지 말하지 않습니다.

이전에 R- 제곱은 모델에 변수를 추가하는 것에 대해 불이익을받는다고 생각하고 널리 읽었습니다. 이제 이러한 다른 공식을 사용하려면 다른 해석이 필요합니다. 또한 스택 오버플로 ( 단일 변수 최소 제곱 회귀 분석에서 다중 R 제곱과 조정 R 제곱의 차이점은 무엇입니까? ) 및 UPenn의 Wharton 학교 통계 사전에 대한 관련 질문을 살펴 보았습니다 .

질문

R에 의해 조정 된 r- 제곱에 어떤 공식이 사용 lm() 됩니까?
어떻게 해석 할 수 있습니까?

r regression r-squared lm shrinkage

— gung-복직 모니카
소스

8

summary.lm () : ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf), 여기서 ans $ r.squared = R ^ 2; n = n, rdf = 잔차 df, df.int = 가로 채기 df (0 또는 1).

— EDi

여기서는 "어떤 종류의 R ^ 2 ..."가 아닌 실제 문제에 대한 답변을 제공 할 것입니다. 당신과 다른 많은 사람들이 부족한 정보는 이것입니다. 모든 R 패키지, 심지어 핵심은 소스 코드를 사용할 수있게합니다. 배포판에서 컴파일 된 내용도 CRAN 또는 기타 저장소의 {packagenames} .tar.gz에서 사용할 수 있습니다.

— Carl Witthoft

OP : 여기에 큰 도움을 주셔서 감사합니다. 두 번째 질문은 어떻습니까 : 어떻게 해석 할 수 있습니까? 나는 Adj에 대한 많은 다른 해석을 읽었습니다. 때로는 Wherry의 수식이 아닌 수식을 기반으로하는 것처럼 보이는 R 제곱?

29

1. `lm`R에서 조정 된 r- 제곱에 어떤 공식을 사용합니까?

이미 언급했듯이 입력 summary.lm하면 R이 조정 된 R 제곱을 계산하는 데 사용하는 코드가 제공 됩니다 . 가장 관련성이 높은 라인 추출 :

ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)

수학 표기법으로 다음에 해당합니다.

R_{a d j}^{2} = 1 - (1 - R^{2}) \frac{n - 1}{n - p - 1}

$R^2_{adj} = 1 - (1 - R^2) \frac{n-1}{n-p-1}$

df.int=1 $n$ $p$ rdfn-p-1

$n-p$ $n-p-1$

2. 왜 조정 된 r- 제곱 공식이 그렇게 많은가?

$R^2_{adj}$ $\rho^2$ $\rho^2$

$R^2$ $R^2_{adj}$

$R^2_{adj}$

$R^2_{adj}$ $\rho^2$ $\rho^2$ $R^2$

참고 문헌

$R^2$

— 제로미 앵림
소스

9

첫 번째 질문과 관련하여 : 어떻게 계산되는지 모르는 경우 코드를보십시오! summary.lm콘솔에 입력 하면이 기능에 대한 코드가 제공됩니다. 코드를 훑어 보면 줄을 찾을 수 있습니다 : ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf). 이 줄 위의 일부 줄을 보면 다음을 알 수 있습니다.

ans$r.squared $R^2$
n 잔차 수 = 관측치 수
df.int 0 또는 1 (요청이있는 경우에 따라 다름)
rdf 당신의 잔여 df입니까

$R^2$ $R^2$

— EDi
소스