잔차 표준 오차는 무엇입니까?


35

R에서 다중 회귀 모델을 실행할 때 출력 중 하나는 자유도 95,161에서 0.0589의 잔류 표준 오차입니다. 표본의 관측치 수와 모형의 변수 수의 차이로 95,161 자유도가 주어진다는 것을 알고 있습니다. 잔차 표준 오차는 무엇입니까?


2
이 질문과 그 답변이 도움이 될 수 있습니다. 왜 우리는 잔여 표준 오차를 말합니까?
앙투안 베르 넷

빠른 질문 : "잔차 표준 오류"는 "잔여 표준 편차"와 동일합니까? Gelman and Hill (p.41, 2007)은 그것들을 서로 바꾸어 쓰는 것으로 보입니다.
JetLag

답변:


26

적합 회귀 모델은 매개 변수를 사용하여 동일한 값으로 스터디를 무한 횟수로 (및 선형 모델이 참인 경우) 스터디를 복제하는 경우 관측 된 반응의 수단 인 점 추정값 예측을 생성합니다 . 이러한 예측 된 값과 모델을 맞추는 데 사용 된 값의 차이를 "잔여 물"이라고하며, 데이터 수집 프로세스를 복제 할 때 0의 평균을 갖는 임의 변수의 속성을 갖습니다.엑스

관찰 된 잔차는 이후에 이들 값의 변동성을 추정하고 파라미터의 샘플링 분포를 추정하는데 사용된다. 잔차 표준 오차가 정확히 0 인 경우 모형은 데이터를 완벽하게 적합시킵니다 (과잉 적합으로 인해). 잔차 표준 오차가 무조건 응답의 변동성과 크게 다를 수없는 경우 선형 모형에 예측 능력이 있음을 암시하는 증거는 거의 없습니다.


3
이것은 전에 답변되었을 수도 있습니다. 이 질문에 필요한 답변이 있는지 확인하십시오. [R의 lm () 출력 해석] [1] [1] : stats.stackexchange.com/questions/5135/…
doug.numbers

26

다음과 같은 분산 분석 테이블이 있다고 가정하십시오 (R의 example(aov)명령으로 수정).

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

변형의 원천 (모형 또는 잔차)에서 제곱의 합을 해당 자유 도로 나누면 평균 제곱이됩니다. 특히 잔차의 경우 :

306.34=76.57576.57

따라서 76.57은 잔차의 평균 제곱, 즉 반응 변수의 잔 차량 (모델 적용 후) 변화량입니다.

잔류 표준 오류 당신에 대해 요청했습니다는 아무것도 이상의 평균 제곱 오차의 양의 제곱근 . 내 예에서 잔차 표준 오류는 또는 대략 8.75입니다. R은이 정보를 "4 자유도에서 8.75"로 출력합니다.76.57


1
나는 회귀를 가장 자주 사용하는 사람으로서 그 대답이 가장 간단했기 때문에 @AdamO의 대답을 상향 투표했습니다. 그러나 ANOVA와 선형 회귀 간의 표기법 / 개념적 / 방법 론적 관계를 설명하기 때문에이 답변에 감사드립니다.
svannoy

12

와이=β0+β1엑스+ϵ
ϵ엑스

β0β1ϵϵ

RSE는 "통계 학습 입문"에서 매우 명확하게 설명됩니다.


2
ϵ아르 자형에스이자형=아르 자형에스에스(2)

1
ISL의 epub를 읽는 사람은 ctrl-f "잔여 표준 오류"와 함께 "66 페이지"를 찾을 수 있습니다. (Epub 파일에는 실제 페이지 번호가 없습니다.)
user2426679
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.