표준화에서 분산이 알려져있는 반면, 학생 화에서는 알려지지 않았으므로 추정 되었습니까? 고맙습니다.
표준화에서 분산이 알려져있는 반면, 학생 화에서는 알려지지 않았으므로 추정 되었습니까? 고맙습니다.
답변:
짧은 요약. 주어진 모델 , 여기서 X는 인 N × P , β = ( X ' X ) - 1 X ' , Y 및 Y = X β = X ( X ' X ) - 1 X ' , Y = H y , 여기서 H = X ( X ' X 는 "모자 행렬"입니다. 잔차는 E = Y - Y = Y - H를 Y = ( I - H ) Y 모집단 분산 σ 2 알려지지 의해 추정 될 수 M S E , 평균 제곱 오차.
반 학생 잔차 는 e * i = e i 로 정의됩니다. 하지만, 잔차의 분산 모두에 의존하기 때문에σ2및X들은 추정 분산이다 :V(예I)=MSE(1-HII) 여기서HI난은 ISI번째 대각 원소 모자 매트릭스의.
내부 학생 잔차 라고도하는 표준화 잔차 는 다음과 같습니다.
Kutner et al., Applied Linear Statistical Models , Chapter 10을 참조하십시오.
편집 : rpierce의 답변이 완벽하다고 말해야합니다. 나는 OP가 표준화되고 학생 화 된 잔차 에 관한 것이라고 생각했고 (그리고 표준화 된 잔차를 얻기 위해 인구 표준 편차로 나눈 것은 물론 나에게 이상하게 보였습니다), 나는 틀 렸습니다. OT라도 내 대답이 누군가를 도울 수 있기를 바랍니다.
사회 과학에서 일반적으로 Studentizated 점수는 표본 분산 / 표준 편차에서 모집단 분산 / 표준 편차를 추정하기 위해 Student 's / Gosset의 계산을 사용한다고합니다 (). 대조적으로, 표준화 된 점수 (명사, 특정 유형의 통계, Z 점수)는 모집단 표준 편차? ().
그러나 각 분야마다 약간의 용어 차이가있는 것으로 보입니다 (이 답변에 대한 의견 참조). 따라서 이러한 구분을 할 때주의를 기울여야합니다. 더욱이, 학생 화 된 점수는 거의 그렇게 불려지지 않으며 일반적으로 회귀의 맥락에서 '학생 화 된'값을 보게됩니다. @Sergio는 답변에 학생 유형의 삭제 된 잔차에 대한 세부 정보를 제공합니다.
나는이 질문에 대답하는 데 매우 늦었다!. 그러나 매우 간단한 언어로 답을 찾을 수 없으므로 겸손하게 대답하십시오.
왜 우리는 표준화를합니까? 두 가지 모델이 있는데 하나는 통계를 연구하는 데 소요 된 시간에서 크 래잔을 예측하는 반면 다른 하나는 통계에 대한 시간을 사용하여 로그 (미량)를 예측한다고 가정합니다.
잔차가 모두 다른 단위임을 이해하기 어렵습니다. 그래서 우리는 그것들을 표준화합니다. (Z- 점수와 유사한 이론)
표준화 잔차 :-잔차를 표준 편차의 추정치로 나눈 경우. 일반적으로 절대 값이 3보다 크면 문제의 원인입니다.
이를 사용하여 모델의 특이 치를 조사합니다.
Studentized Residual : 모델의 안정성을 연구하기 위해 사용합니다.
과정은 간단합니다. 모델에서 개별 테스트 사례를 제거하고 새로운 예측값을 찾습니다. 표준 오차를 나누어 새로운 값과 원래의 관찰 값의 차이를 표준화 할 수 있습니다. 이 값은 Studentized Residual입니다
R을 사용하여 정적 정보를 더 알아 보려면 http://www.statisticshell.com/html/dsur.html
Wikipedia의 개요는 https://en.wikipedia.org/wiki/Normalization_(statistics)입니다 .
표준 점수 : 모집단 모수가 알려진 경우 오류 정규화. 정규 분포를 따르는 모집단에 적합
학생의 t- 통계 : 모집단 모수를 알 수없는 경우 잔차 정규화 (추정).