“내부적으로 학생 화 된 잔차”는 잠재적 영향력있는 데이터 포인트 진단 측면에서 원시 추정 잔차에 비해 어떤 이점을 제공합니까?


10

내가 묻는 이유는 내부적으로 학생 화 된 잔차가 원시 추정 잔차와 같은 패턴 인 것처럼 보이기 때문입니다. 누군가가 설명을 줄 수 있다면 좋을 것입니다.

답변:


13

가정 회귀 모델 디자인 매트릭스와 X (a 1 하여 예측 하였다 열), 예측 Y = X ( X ' X ) - 1 X ' , Y = H (Y) ( H가 있는 "HAT- 매트릭스 ") 및 잔차 E = Y - Y . 회귀 모형은 실제 오차 ϵ 모두 동일한 분산 (균일 성)을 가정합니다.y=Xβ+ϵX1y^=X(XX)1Xy=HyHe=yy^ϵ

동종 요법

V(e)=σ2(IH)eiσ2(1hii)σ2(IH)Hhii

e/(σ1hii)σ e/(σ^1hii)σ^

ϵ


두 가지 다른 유형의 잔차 (외부 학생 잔차) 간의 정의상의 차이가 분명합니다. 그러나 실제로는 내부적으로 표준화 된 잔차가 추정 잔차와 비교하여 뚜렷한 패턴을 보이는 사례 (적어도 내 자신의 데이터가있는 경우)에 직면했다고 생각하지 않습니다. 반면에 외부 적으로 학생 화 된 잔차는 예상 잔차와 다른 패턴을 나타낼 수 있습니다. * 두 가지 유형의 잔차가 동일하다는 것은 아닙니다. 나는 그들의 일반적인 패턴을 언급하고 있습니다.

@AlexH. 내가 언급 한 언급 된 이점이 이론적 이라는 데 동의합니다 . 원시 잔차가 잘못되고 모의 잔차가 조건부 분포에 대한보다 정확한 그림을 제공하는 시뮬레이션 된 경험적 상황을 구성하는 것이 좋습니다.
caracal

12

어떤 유형의 데이터를 테스트 했습니까? 모든 가정이 유지 될 때 (또는 가까워 질 때) 원시 잔차와 학생 잔차 간의 큰 차이를 기대하지 않을 것입니다. 긍정적 인 선형 추세와 영향력이 큰 특이 치를 가진이 (시뮬레이션 된) 데이터를 고려하십시오.

여기에 이미지 설명을 입력하십시오

다음은 적합치 대 원시 잔차의 도표입니다.

여기에 이미지 설명을 입력하십시오

영향력있는 지점의 잔차 값은 나머지 지점의 최소 및 최대 잔차보다 0에 가깝습니다 (3 개의 가장 극단적 인 원시 잔차는 아님).

이제 표준화 된 (내부적으로 학생 화 된) 잔차가있는 그림이 있습니다.

여기에 이미지 설명을 입력하십시오

이 그림에서 표준화 잔차는 그 영향이 설명 되었기 때문에 두드러집니다.

x

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.