Pearson 상관 계수의 모집단 값에 대한 두 가지 유형의 추정기에 대해 머릿속에 약간의 혼란이있었습니다.
A. Fisher (1915) 는 2 변량 정규 모집단의 경우 경험적 이 의 음으로 바이어스 된 추정 인 것으로 나타 났지만, 바이어스는 작은 샘플 크기 ( )에 대해서만 실질적으로 상당한 양일 수 있음을 보여 줍니다. 샘플 은 보다 더 가깝다는 점에서 를 과소 평가 합니다. (후자는 제외 할 때 또는 다음에, 편견이다.) 여러 거의 불편 추정량 의 , 최고의 하나는 아마 인 제안되었다 (1958) Olkin와 프랫에게수정 된 :
B. 회귀에서 가 해당 모집단 R- 제곱을 과대 평가 한다고한다 . 또는 간단한 회귀 분석을 통해 과대 평가 됩니다. 그 사실을 바탕으로, 그 말 많은 텍스트 본 적이 되어 적극적으로 상대 바이어스 에 절대 값을 의미 : 멀리에서입니다 보다 (? 사실 그 진술입니다). 텍스트는 표준 편차 매개 변수를 표본 값으로 과대 평가하는 것과 동일한 문제라고 말합니다. 를 모집단 모수에 더 가깝게 관찰하여 "조정"하는 공식이 많이 있습니다 .Wherry 's (1931) 는 가장 잘 알려져 있지만 가장 좋은 것은 아닙니다. 이러한 조정 된 의 루트를 shrunken 이라고합니다 .
현재 대한 두 가지 다른 추정값이 있습니다. 아주 다른 : 첫 번째 팽창은 , 제 뺐다는 . 화해하는 방법? 하나를 어디에서 사용하고보고합니까?
특히, 그것은 사실 일 수있다 은 "편견"같은,하지만 단지에, 너무 "수축 된"추정은 (거의) 편향 다른 컨텍스트 - 회귀의 비대칭 상황에서. OLS 회귀 분석에서 우리는 한 쪽 (예측 자)의 값을 고정 된 것으로 간주하여 표본마다 임의의 오류없이 참석합니까? 그리고 여기에 회귀 분석에는 이변 량 정규성이 필요하지 않습니다 .