조정 된 R- 제곱에 대해 R에서 사용되는 정확한 공식은 무엇입니까 lm()
? 어떻게 해석 할 수 있습니까?
조정 된 R- 제곱 공식
조정 된 R- 제곱을 계산하는 공식이 여러 개있는 것 같습니다.
- 나룻배의 식 :
- McNemar의 식 :
- 주님의 공식 :
- 스타 인의 공식 :
교과서 설명
- Field의 교과서에 따르면, R을 사용한 통계 발견 (2012, p. 273) R은 Wherry의 방정식을 사용합니다. "모형이 표본을 추출한 모집단에서 모델이 도출 된 경우 Y의 분산이 얼마나 많이 설명되는지 알려줍니다." 그는 Wherry에 대한 공식을 제시하지 않습니다. 그는 Stein의 공식 (수동)을 사용하여 모델이 얼마나 잘 교차 검증되는지 확인하는 것이 좋습니다.
- Kleiber / Zeileis, R이 적용된 응용 계량 경제학 (2008, p. 59)은 "Ther 's 조정 된 R- 제곱"이라고 주장하고 해석이 여러 R- 제곱과 어떻게 다른지 정확하게 말하지 않습니다.
- Dalgaard, R의 입문 통계 (2008, p. 113)는 "[조정 된 R- 제곱]에 100 %를 곱하면 '% 분산 감소"로 해석 될 수 있습니다. 그는 이것이 어떤 공식에 해당하는지 말하지 않습니다.
이전에 R- 제곱은 모델에 변수를 추가하는 것에 대해 불이익을받는다고 생각하고 널리 읽었습니다. 이제 이러한 다른 공식을 사용하려면 다른 해석이 필요합니다. 또한 스택 오버플로 ( 단일 변수 최소 제곱 회귀 분석에서 다중 R 제곱과 조정 R 제곱의 차이점은 무엇입니까? ) 및 UPenn의 Wharton 학교 통계 사전에 대한 관련 질문을 살펴 보았습니다 .
질문
- R에 의해 조정 된 r- 제곱에 어떤 공식이 사용
lm()
됩니까? - 어떻게 해석 할 수 있습니까?
여기서는 "어떤 종류의 R ^ 2 ..."가 아닌 실제 문제에 대한 답변을 제공 할 것입니다. 당신과 다른 많은 사람들이 부족한 정보는 이것입니다. 모든 R 패키지, 심지어 핵심은 소스 코드를 사용할 수있게합니다. 배포판에서 컴파일 된 내용도 CRAN 또는 기타 저장소의 {packagenames} .tar.gz에서 사용할 수 있습니다.
—
Carl Witthoft
ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)
, 여기서 ans $ r.squared = R ^ 2; n = n, rdf = 잔차 df, df.int = 가로 채기 df (0 또는 1).