대한 95 % 신뢰 구간 공식


13

stats.stackexchange에서 Google을 검색하고 검색했지만 선형 회귀 분석 의 값에 대한 95 % 신뢰 구간을 계산하는 공식을 찾을 수 없습니다 . 누구든지 그것을 제공 할 수 있습니까?R2

더 나은 방법으로, R에서 아래의 선형 회귀를 실행했다고 가정 해 봅시다 . R 코드를 사용하여 R 값에 대한 95 % 신뢰 구간을 어떻게 계산합니까 ?R2

lm_mtcars <- lm(mpg ~ wt, mtcars)

1
그럼 당신은 상관 관계 알고 및 당신이 얻을 수있는 상관 계수를 제곱 있다는 것입니다 하는 이유에 대한 신뢰 구간 계산하지 그래서 제곱 한 다음 구간의 하부 및 상부 한계와? R 2 R 2 rrR2R2r

1
@ZERO : 간단한 선형 회귀, 즉 단일 예측 변수와 절편으로 작동합니다. 둘 이상의 예측 변수가있는 다중 선형 회귀에는 작동하지 않습니다.
Stephan Kolassa

@StephanKolassa, 정말 사실입니다! 나는 R하나의 회귀자가있는 그의 코드를 기반으로하고 있었지만 명확하게 설명하는 것이 좋습니다.


예를 들어 비 중앙 F- 분포의 특성에 따라 매우 작은 R 함수 github.com/mayer79/R-confidence-intervals-R-squared 를 사용할 수 있습니다 .
Michael M

답변:


16

항상 부트 스트랩 할 수 있습니다.

> library(boot)
> foo <- boot(mtcars,function(data,indices)
        summary(lm(mpg~wt,data[indices,]))$r.squared,R=10000)

> foo$t0
[1] 0.7528328

> quantile(foo$t,c(0.025,0.975))
     2.5%     97.5% 
0.6303133 0.8584067

Carpenter & Bithell (2000, Statistics in Medicine) 은 에 특별히 초점을 맞추지 않았지만 부트 스트랩 신뢰 구간에 대한 읽기 쉬운 소개를 제공합니다 .R2


1
(+1) 이고 @Durden이 인용 한 근사 공식 에 구간 주어진다는 것이 . 우리 가 그 식에서 SE를 곱하는 의 계수를 떨어 뜨리면 거의 완벽하게 맞을 것입니다 ! k = 1 ( 0.546 , 0.960 ) 2n=32k=1(0.546,0.960)2
whuber

를 사용하여 부트 스트랩 리샘플링 분포에서 다른 유형의 신뢰 구간 (예 : BCa)을 얻을 수 있다는 점도 주목할 가치가 있습니다 boot.ci().
Jeffrey Girard

7

R에서는 심리 측정 패키지가 CI.Rsq()제공 하는 기능 을 사용할 수 있습니다 . 그것이 적용되는 공식에 관해서는, Cohen et al. (2003) , 행동 과학에 대한 다중 회귀 / 상관 분석 적용 , p. 88 :

SER2=4R2(1R2)2(nk1)2(n21)(n+3)

그런 다음 95 % CI는 입니다.R2±2SER2


3
(1) 는 참조에서 제곱입니다. (2) " "는 모집단 값이 아닌 표본 값으로 의도 된다는 점에 유의해야 합니다 ( 혼란의 가능성이있는 경우 질문에서 " " 가 명확하게 나타내는 것임 ). (3) 또한 이것은 " "에 대해 "적절한 근사치"를 제공하는 점근 적 ( "대표 본") 결과 인 것이 중요합니다 . ( 은 인터셉트에 독립 변수의 수를 더한 것으로 계산합니다.)이 간격이 너무 넓어 보이기 때문에 시뮬레이션이 지원하는 실제 예제를 보는 것이 유용합니다. R 2 R 2 n - k - 1 > 60 k + 1(1R2)R2R2nk1>60k+1
whuber

Wishart (1931)에 따르면 공식은 비정규 분포에 적합하지 않습니다.
abukaj
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.