답변:
그것에 대해 생각하는 가장 간단한 방법은 원시 잔차 ( )가 해당 교란의 추정치 ( )라는 것입니다. 그러나 몇 가지 추가 복잡성이 있습니다. 예를 들어 표준 OLS 모델에서 오류 / 방해가 독립적이라고 가정하지만 잔차가 모두 다를 수는 없습니다. 평균 모형을 추정 할 때 자유도를 사용 하고 잔차가 제한 되므로 일반적으로 잔차 만 독립적 일 수 있습니다.. 또한 원시 잔차의 표준 편차는 실제로 일정하지 않습니다. 일반적으로 회귀선은 레버리지가 큰 지점에 평균적으로 더 가깝도록 적합합니다. 결과적으로, 해당 지점에 대한 잔차의 표준 편차는 낮은 레버리지 지점의 표준 편차보다 작습니다. (이에 대한 자세한 내용은 plot.lm () 해석 및 / 또는 here : 선형 회귀 분석에서 이진 / 이분법 독립 예측 변수에 대한 잔차 분석을 수행하는 방법을 읽을 수 있습니다. )
과 의 관계 는 다음 과 같습니다.
여기서 모자 행렬 인 는 입니다.
즉, 는 모든 오류의 선형 조합이지만 일반적으로 대부분의 가중치는 번째 오류에 해당합니다 .
다음 cars
은 R 의 데이터 세트를 사용하는 예 입니다. 자주색으로 표시된 점을 고려하십시오.
그것을 라고하자 . 나머지 (여기서 다른 오류에 대한 는 -0.02의 영역에 있음) :
이를 다음과 같이 다시 작성할 수 있습니다.
또는 더 일반적으로
여기서 는 의 번째 대각선 요소입니다 . 마찬가지로 위 의 는 입니다.
오차가 iid 경우이 예에서 다른 오차의 가중치 합은 번째 관측치 오차가 잔차에 미치는 영향의 약 1/7에 해당하는 표준 편차를 갖습니다. .
다시 말해서, 잘 동작하는 회귀 분석에서 잔차는 대부분 관측 할 수없는 오차 항의 약간 잡음이 많은 추정치처럼 취급 될 수 있습니다. 중심에서 더 멀리 점을 고려할 때 상황이 다소 덜 잘 작동합니다 (잔차가 오차에 덜 가중되고 다른 오차에 대한 가중치가 덜 균일 해짐).
매개 변수가 많거나 잘 분포되어 있지 않으면 잔차가 오류와 훨씬 유사 할 수 있습니다. 몇 가지 예를 시도해 볼 수 있습니다.