다중 선형 회귀 분석에서 편견없는 추정치를 얻는 데 관심이 있습니다.
생각해 볼 때, 편견없는 추정치 가 일치하려고 하는 두 가지 다른 값을 생각할 수 있습니다.
- 샘플 중 : 회귀 방정식은 샘플로부터 얻어진 경우에 획득 될 것이다 R 제곱 ) 시료의 외부에 데이터의 무한한 양이지만 동일한 데이터 생성 프로세스에서 적용되었다.
- 모집단 : 무한 샘플이 얻어지고 모델이 그 무한 샘플 (즉, )에 적합하거나 대안으로 알려진 데이터 생성 프로세스에 의해 암시 된 R- 제곱 인 경우에 획득 될 r- 제곱 .
조정 된 가 샘플 에서 관찰 된 오버 피팅을 보상하도록 설계 되었음을 이해합니다 . 그럼에도 불구하고, 조정 여부를 명확하지 않다 R 2는 실제의 불편 추정치 R 2 , 그것은 편견 추정치 인 경우 그 중 위의 두 정의의 R 2 가 추정하는 것을 목표로한다.
따라서 내 질문 :
- 샘플 위에서 부른 것의 편견이 아닌 추정치는 무엇 입니까?
- 인구 이상이라고 부르는 것에 대한 공정한 추정치는 무엇 입니까?
- 편견에 대한 시뮬레이션 또는 기타 증거를 제공하는 참조가 있습니까?