원시 잔차 대 표준화 잔차 대 학생 잔차-언제 무엇을 사용해야합니까?


31

이것은 비슷한 질문처럼 보이며 많은 응답을 얻지 못했습니다.

Cook의 D와 같은 테스트를 생략하고 그룹으로 잔차를 살펴보면 다른 사람들이 적합도를 평가할 때 잔차를 사용하는 방법에 관심이 있습니다. 나는 원시 잔차를 사용합니다.

  1. 정규성을 평가하기 위해 QQ 플롯에서
  2. (a) 이분산성 및 (b) 연속 자기 상관의 안구 검사를 위해 대 잔차 의 산점도에서 .y

특이 치가 발생할 수있는 의 값을 조사하기 위해 대 잔차 를 플로팅 하려면 학생 화 된 잔차 를 사용하는 것이 좋습니다 . 선호하는 이유는 표준화 잔차 가 매우 유사한 결과를 제공 하지만 이 문제가 되는 잔차를 쉽게 볼 수 있기 때문입니다. 사용되는 나의 이론은 그것이 어느 대학에 진학했는지에 달려 있다는 것이다.yyyy

다른 사람들이 잔차를 사용하는 방법과 비슷합니까? 다른 사람들이이 수의 그래프를 요약 통계와 함께 사용합니까?


3
스튜던트 화 된 잔차는 의심 할 여지없이 특이 치를 탐지하는 데 더 좋고, 이분산성 검사에서 약간 더 좋습니다. 다른 목적으로, 어떤 잔차를 사용할 지 나에게 아무런 차이가 없습니다.
ttnphns

Michelle에게 질문에 관심을 갖거나 CW와 같은 상태 변경을 요청하려면 질문 아래의 "플래그"링크를 따르십시오. 모든 중재자에게 자동으로 알립니다. 질문, 의견 또는 답글에 요청을 포함시키는 것은 중재자 (또는 다른 고답 사용자)가 실제로 적절한 시간 내에 요청을 읽을 것이라는 희망에 의존하기 때문에 부적절합니다!
whuber

@ whuber 아, 당신 중 하나가 결국 그것을 읽을 것이라고 생각 참조하십시오. :) 플래그 사용에 대한 팁 감사합니다.
Michelle

1
안녕 @ttnphns 왜 그들이 더 나은 것입니까? 특히 표준화 된 것보다 왜 학생 화가 더 좋을까요? (정말 답을 본 적이 없습니다.)
Peter Flom-Monica Monica

4
@Peter, Studentized 잔차는 OLS 피팅 알고리즘에 의해 "왜곡되지"않으며 이론상 "오류" 개념에 더 가깝습니다 . 맞춤 선의 다른 영역에서 직접 비교할 수 있으므로 점이 이상치 인 경우 결정하는 것이 좋습니다.
ttnphns

답변:


8

이것은 용어에 대한 설명으로 그다지 답이 아닙니다. 귀하의 질문은 원시, 표준화 및 학생 화 잔차에 대해 묻습니다. 그러나 이것은 대부분의 통계 학자들이 사용하는 용어는 아니지만, 수업 노트에는 그 용어가 나와 있습니다.

Raw : 가지고있는 것과 동일합니다.

표준화 됨 : 이것은 실제 잔차를 잔차의 실제 표준 편차로 나눈 값입니다. 실제 표준 편차는 거의 알려져 있지 않으므로 표준화 잔차는 거의 사용되지 않습니다.

내부적으로 학생 화됨 : 잔차의 실제 표준 편차는 일반적으로 알려져 있지 않으므로 추정 표준 편차가 대신 사용됩니다. 이것은 내부적으로 학생 화 된 잔차이며, 당신이 표준화 한 것입니다.

외부 적으로 학생 화 : 잔차의 표준 편차 추정치가 문제의 관찰을 남기지 않는 회귀로 계산된다는 점을 제외하고 내부적으로 학생 화 한 잔차와 동일합니다.

Pearson : 원시 잔차를 잔차가 아닌 응답 변수 (y 변수)의 표준 편차로 나눈 값입니다. 이 목록이 없습니다.

"나가기": 공식적인 이름은 없지만 수업 노트와 동일합니다.

standarized "leave one out": 또한 공식적인 이름은 없지만, 이것은 수업 노트가 학생이라고 부르는 것이 아닙니다.

출처 :

  1. 학생 화 잔차에 대한 동일한 위키 링크 ( "학생 화 잔차는 잔차를 표준 편차의 추정치로 나눈 결과"입니다)

  2. SAS의 잔차 계산에 대한 설명서


2
+1 확실히 어떤 통계 학자들은 OP의 질문에있는 용어를 사용했습니다 (그리고 같은 단어를 사용하는 다른 단어와 항상 완벽하게 일치하는 것은 아닙니다). 나는 당신이 사용하는 용어가 점점 일반화되고 있다고 생각하지만 통계 학자들이 상대적으로 전 세계적으로 사용하는 것에 대해 어떤 근거로 추측 할 수 있는지 잘 모르겠습니다. 출판. 당신은 옳을 지 모르지만 어떻게 알 수 있습니까? [다시 수정하면 끝 부분 근처의 "표준화"를 "표준화"로 바꾸고 싶을 수도 있습니다.]
Glen_b -Reinstate Monica

2

다시 : 음모,

과적 합 (overfitting)과 같은 것이 있지만, 특히 진단 단계에서 과도 플로팅은 실제로 많은 해를 끼치 지 않습니다. 표준화 된 정규 확률도는 QQ 플롯 옆에 해를 끼칠 수 없습니다. 분포 중간을 평가하는 것이 더 좋습니다.

다시 : 잔차,

초안 단계에서 표준화 된 잔차와 학생 화 된 잔차를 모두 실행하고 보통 표준화 된 잔차를 코딩합니다. 온라인에서 찾은 복제 자료에 진단 기능이 실제로 코딩되어 있기 때문에 다른 사람들이 실제로 무엇을 실행하는지 알 수 없습니다.

재 : 진단,

선형 모형의 경우 일반적으로 분산 인플레이션 계수 ( vifStata 의 명령 사용)와 몇 가지 동질성 검정 ( hettestStata 의 명령 사용)과 중첩 된 회귀 분석을 통해 가 의미 가 있는지 확인합니다. .R2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.