모집단 R- 제곱의 편향 추정치 란 무엇입니까?


14

다중 선형 회귀 분석에서 편견없는 추정치를 얻는 데 관심이 있습니다.R2

생각해 볼 때, 편견없는 추정치 가 일치하려고 하는 두 가지 다른 값을 생각할 수 있습니다.R2

  1. 샘플 중 :R2 회귀 방정식은 샘플로부터 얻어진 경우에 획득 될 것이다 R 제곱 ) 시료의 외부에 데이터의 무한한 양이지만 동일한 데이터 생성 프로세스에서 적용되었다.β^
  2. 모집단 :R2 무한 샘플이 얻어지고 모델이 그 무한 샘플 (즉, )에 적합하거나 대안으로 알려진 데이터 생성 프로세스에 의해 암시 된 R- 제곱 인 경우에 획득 될 r- 제곱 .β

조정 된 R2 가 샘플 에서 관찰 된 오버 피팅을 보상하도록 설계 되었음을 이해합니다 . 그럼에도 불구하고, 조정 여부를 명확하지 않다 R 2는 실제의 불편 추정치 R 2 , 그것은 편견 추정치 인 경우 그 중 위의 두 정의의 R 2 가 추정하는 것을 목표로한다.R2R2R2R2

따라서 내 질문 :

  • 샘플 위에서 부른 것의 편견이 아닌 추정치는 무엇 입니까?R2
  • 인구 이상이라고 부르는 것에 대한 공정한 추정치는 무엇 입니까?R2
  • 편견에 대한 시뮬레이션 또는 기타 증거를 제공하는 참조가 있습니까?

adj의 공식은 무엇입니까? R ^ 2는 덜 편향되어 있습니다 (예 : 여기) .
ttnphns

감사. 나는 당신이 언급 한 참고 문헌을 읽고 있습니다 : Yin, P., & Fan, X. (2001). 다중 회귀 분석에서 수축 추정 : 다양한 분석 방법 비교. 실험 교육 저널, 69 (2), 203-224. R2
Jeromy Anglim

답변:


14

R-square에 대한 분석 조정 평가

@ttnphns 추정은 다른 분석 방법 비교 음 및 팬 (2001) 문서 나 함 . 내 질문에 따라 그들은 두 가지 유형의 추정기를 구별합니다. 다음과 같은 용어를 사용합니다.R2

  • : 제곱 모집단 다중 상관 계수의 추정자ρ2
  • : 제곱 모집단 교차 유효성 계수의 추정값ρc2

그들의 결과는 요약으로 요약됩니다 :

저자는 Monte Carlo 실험을 수행하여 4 개의 완전 교차 인자 (제곱 모집단 다중 상관 계수, 예측 변수 수, 샘플 크기 및 다중 공선도)와 각각 500 개의 복제 를 사용하여 수축 을 추정하기위한 분석 공식의 효과를 조사했습니다. 세포. 결과는 가장 널리 사용 된 Wherry 공식 (SAS 및 SPSS 모두)이 아마도 ρ 2 추정에 가장 효과적인 분석 공식이 아님을 나타냅니다 . 대신, Pratt 공식과 Browne 공식은 각각 ρ 2ρ 2 c 를 추정 할 때 다른 분석 공식보다 성능이 우수 했습니다.R2ρ2ρ2ρc2

따라서이 기사는 프랫 공식 (p.209)이 를 추정하기에 좋은 선택임을 암시합니다 .ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

여기서 N은 표본 크기이고 p는 예측 변수 수입니다.

R- 제곱에 대한 조정의 경험적 추정

R2ρ2ρc2ρ2

참고 문헌

  • Kromrey, JD, & Hines, CV (1995). 다중 회귀 분석에서 경험적 수축 축소 사용 :주의. 교육 및 심리 측정, 55 (6), 901-925.
  • R2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.