모집단 R- 제곱의 편향 추정치 란 무엇입니까?

다중 선형 회귀 분석에서 편견없는 추정치를 얻는 데 관심이 있습니다. $R^2$

생각해 볼 때, 편견없는 추정치 가 일치하려고 하는 두 가지 다른 값을 생각할 수 있습니다. $R^2$

샘플 중 : $R^2$ 회귀 방정식은 샘플로부터 얻어진 경우에 획득 될 것이다 R 제곱 ) 시료의 외부에 데이터의 무한한 양이지만 동일한 데이터 생성 프로세스에서 적용되었다. $\hat{\beta}$
모집단 : $R^2$ 무한 샘플이 얻어지고 모델이 그 무한 샘플 (즉, )에 적합하거나 대안으로 알려진 데이터 생성 프로세스에 의해 암시 된 R- 제곱 인 경우에 획득 될 r- 제곱 . $\beta$

조정 된 $R^2$ 가 샘플 에서 관찰 된 오버 피팅을 보상하도록 설계 되었음을 이해합니다 . 그럼에도 불구하고, 조정 여부를 명확하지 않다 실제의 불편 추정치 , 그것은 편견 추정치 인 경우 그 중 위의 두 정의의 가 추정하는 것을 목표로한다. $R^2$ $R^2$ $R^2$ $R^2$

따라서 내 질문 :

샘플 위에서 부른 것의 편견이 아닌 추정치는 무엇 입니까? $R^2$
인구 이상이라고 부르는 것에 대한 공정한 추정치는 무엇 입니까? $R^2$
편견에 대한 시뮬레이션 또는 기타 증거를 제공하는 참조가 있습니까?

— 제로미 앵림
소스

adj의 공식은 무엇입니까? R ^ 2는 덜 편향되어 있습니다 (예 : 여기) .

— ttnphns

감사. 나는 당신이 언급 한 참고 문헌을 읽고 있습니다 : Yin, P., & Fan, X. (2001). 다중 회귀 분석에서

수축 추정 : 다양한 분석 방법 비교. 실험 교육 저널, 69 (2), 203-224.

R^{2}

$R^2$

— Jeromy Anglim

R-square에 대한 분석 조정 평가

@ttnphns 추정은 다른 분석 방법 비교 음 및 팬 (2001) 문서 나 함 . 내 질문에 따라 그들은 두 가지 유형의 추정기를 구별합니다. 다음과 같은 용어를 사용합니다. $R^2$

: 제곱 모집단 다중 상관 계수의 추정자 $\rho^2$
: 제곱 모집단 교차 유효성 계수의 추정값 $\rho_c^2$

그들의 결과는 요약으로 요약됩니다 :

저자는 Monte Carlo 실험을 수행하여 4 개의 완전 교차 인자 (제곱 모집단 다중 상관 계수, 예측 변수 수, 샘플 크기 및 다중 공선도)와 각각 500 개의 복제 를 사용하여 수축 을 추정하기위한 분석 공식의 효과를 조사했습니다. 세포. 결과는 가장 널리 사용 된 Wherry 공식 (SAS 및 SPSS 모두)이 아마도 추정에 가장 효과적인 분석 공식이 아님을 나타냅니다 . 대신, Pratt 공식과 Browne 공식은 각각 및 를 추정 할 때 다른 분석 공식보다 성능이 우수 했습니다. $R^2$ $\rho^2$ $\rho^2$ $\rho_c^2$

따라서이 기사는 프랫 공식 (p.209)이 를 추정하기에 좋은 선택임을 암시합니다 . $\rho^2$

{\hat{R}}^{2} = 1 - \frac{(N - 3) (1 - R^{2})}{(N - p - 1)} [1 + \frac{2 (1 - R^{2})}{N - p - 2.3}]

$\hat{R}^2=1 - \frac{(N-3)(1 - R^2)}{(N-p-1)} \left[ 1 + \frac{2(1-R^2)}{N-p-2.3} \right]$

여기서 N은 표본 크기이고 p는 예측 변수 수입니다.

R- 제곱에 대한 조정의 경험적 추정

$R^2$ $\rho^2$ $\rho_c^2$ $\rho^2$

참고 문헌

Kromrey, JD, & Hines, CV (1995). 다중 회귀 분석에서 경험적 수축 축소 사용 :주의. 교육 및 심리 측정, 55 (6), 901-925.
$R^2$

— 제로미 앵림
소스