R의 lm에서 조정 된 R- 제곱 공식은 무엇이며 어떻게 해석해야합니까?


35

조정 된 R- 제곱에 대해 R에서 사용되는 정확한 공식은 무엇입니까 lm() ? 어떻게 해석 할 수 있습니까?

조정 된 R- 제곱 공식

조정 된 R- 제곱을 계산하는 공식이 여러 개있는 것 같습니다.

  • 나룻배의 식 : 1(1R2)(n1)(nv)
  • McNemar의 식 : 1(1R2)(n1)(nv1)
  • 주님의 공식 : 1(1R2)(n+v1)(nv1)
  • 스타 인의 공식 : 1[(n1)(nk1)(n2)(nk2)(n+1)n](1R2)

교과서 설명

  • Field의 교과서에 따르면, R을 사용한 통계 발견 (2012, p. 273) R은 Wherry의 방정식을 사용합니다. "모형이 표본을 추출한 모집단에서 모델이 도출 된 경우 Y의 분산이 얼마나 많이 설명되는지 알려줍니다." 그는 Wherry에 대한 공식을 제시하지 않습니다. 그는 Stein의 공식 (수동)을 사용하여 모델이 얼마나 잘 교차 검증되는지 확인하는 것이 좋습니다.
  • Kleiber / Zeileis, R이 적용된 응용 계량 경제학 (2008, p. 59)은 "Ther 's 조정 된 R- 제곱"이라고 주장하고 해석이 여러 R- 제곱과 어떻게 다른지 정확하게 말하지 않습니다.
  • Dalgaard, R의 입문 통계 (2008, p. 113)는 "[조정 된 R- 제곱]에 100 %를 곱하면 '% 분산 감소"로 해석 될 수 있습니다. 그는 이것이 어떤 공식에 해당하는지 말하지 않습니다.

이전에 R- 제곱은 모델에 변수를 추가하는 것에 대해 불이익을받는다고 생각하고 널리 읽었습니다. 이제 이러한 다른 공식을 사용하려면 다른 해석이 필요합니다. 또한 스택 오버플로 ( 단일 변수 최소 제곱 회귀 분석에서 다중 R 제곱과 조정 R 제곱의 차이점은 무엇입니까? ) 및 UPenn의 Wharton 학교 통계 사전에 대한 관련 질문을 살펴 보았습니다 .

질문

  • R에 의해 조정 된 r- 제곱에 어떤 공식이 사용 lm() 됩니까?
  • 어떻게 해석 할 수 있습니까?

8
summary.lm () : ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf), 여기서 ans $ r.squared = R ^ 2; n = n, rdf = 잔차 df, df.int = 가로 채기 df (0 또는 1).
EDi

여기서는 "어떤 종류의 R ^ 2 ..."가 아닌 실제 문제에 대한 답변을 제공 할 것입니다. 당신과 다른 많은 사람들이 부족한 정보는 이것입니다. 모든 R 패키지, 심지어 핵심은 소스 코드를 사용할 수있게합니다. 배포판에서 컴파일 된 내용도 CRAN 또는 기타 저장소의 {packagenames} .tar.gz에서 사용할 수 있습니다.
Carl Witthoft

OP : 여기에 큰 도움을 주셔서 감사합니다. 두 번째 질문은 어떻습니까 : 어떻게 해석 할 수 있습니까? 나는 Adj에 대한 많은 다른 해석을 읽었습니다. 때로는 Wherry의 수식이 아닌 수식을 기반으로하는 것처럼 보이는 R 제곱?

답변:


29

1. lmR에서 조정 된 r- 제곱에 어떤 공식을 사용합니까?

이미 언급했듯이 입력 summary.lm하면 R이 조정 된 R 제곱을 계산하는 데 사용하는 코드가 제공 됩니다 . 가장 관련성이 높은 라인 추출 :

ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)

수학 표기법으로 다음에 해당합니다.

Radj2=1(1R2)n1np1

df.int=1nprdfn-p-1

npnp1

2. 왜 조정 된 r- 제곱 공식이 그렇게 많은가?

Radj2ρ2ρ2

R2Radj2

Radj2

Radj2ρ2ρ2R2

참고 문헌

  • R2

9

첫 번째 질문과 관련하여 : 어떻게 계산되는지 모르는 경우 코드를보십시오! summary.lm콘솔에 입력 하면이 기능에 대한 코드가 제공됩니다. 코드를 훑어 보면 줄을 찾을 수 있습니다 : ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf). 이 줄 위의 일부 줄을 보면 다음을 알 수 있습니다.

  • ans$r.squaredR2
  • n 잔차 수 = 관측치 수
  • df.int 0 또는 1 (요청이있는 경우에 따라 다름)
  • rdf 당신의 잔여 df입니까

R2R2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.