왜“잔여 표준 오류”라고 말합니까?


14

표준 오차는 추정 된 표준 편차이고 σ ( θ ) 추정기에서의 θ 파라미터에 대한 θ .σ^(θ^)θ^θ

잔차의 추정 표준 편차가 "잔차 표준 오차"(예 : R의 summary.lm함수 출력 )라고하고 잔차 표준 편차가 아닌 이유는 무엇입니까? 여기에 표준 오차를 갖는 모수 추정치는 무엇입니까?

각 잔차를 "그"오류 항에 대한 추정기로 간주하고 이러한 모든 추정 자의 "풀링 된"표준 오류를 추정합니까?


6
나는 그것이 R 일 것이라고 생각합니다. 나는 다른 소프트웨어가 반드시 그 문구를 사용한다고 생각하지는 않으며, '잔여 표준 편차'는 교과서에서 일반적입니다. 나는 대답이 없지만 R이 그 문구를 사용하는 것이 항상 이상하다고 생각했습니다.
gung-모니 티 복원

@ 궁 : 그것은 설명이 될 수 있습니다! 따옴표에서 인터넷 검색 "잔여 표준 오류"는 따옴표없이 적중의 0.1 % 만 얻습니다 ...
Michael M

원하는 경우 (비) 답변으로 넣을 수 있습니다.
gung-복직 모니카

1
@ gung 그것은 특정 소프트웨어를 사용하는 것이 어떻게 당신의 생각을 형성하는지 재미 있습니다 : 나는 그것을 "잔여 SD"라고 부르지 않을 것입니다-잔차는 데이터가 아니라 오류이므로 잔차 오류는 적절한 이름으로 보입니다. 그러나 당신이 그것에 대해 생각하면 실제로 R-thing 인 것 같습니다.
Tim

2
@Tim, 오차의 표준 편차의 추정치로 올바르게 간주 될 수 있지만 잔차는 기술적으로 오차 자체가 아닙니다. 또한 가치 SD의 표준 오류도 아닙니다.
gung-복직 모니카

답변:


12

나는 구절이 R의 summary.lm()출력에 따라 다르다고 생각합니다 . 기본 값은 실제로 "sigma"( summary.lm()$sigma) 라고 합니다. 다른 소프트웨어가 반드시 잔차의 표준 편차에 해당 이름을 사용한다고 생각하지 않습니다. 또한 '잔여 표준 편차'라는 문구는 교과서에서 일반적입니다. 나는 그것이 R의 summary.lm()출력에 사용 된 문구가 된 방법을 모르겠지만 항상 그것이 이상하다고 생각했습니다.


summary.lm(reg)$sigma와는 어떻게 다른 sd(reg$residuals)가요?
airstrike

3
@ AndréTerra에서 올바른 자유도는 n-p이며, 이는 요약이 사용하는 것입니다. sd는 n-1 자유도를 사용하는 var를 사용합니다. n-p로 나눈 잔차의 표준 편차를 수동으로 계산하면 요약에서 제공하는 것과 동일한 대답을 얻을 수 있습니다.
Jdub

3
gung을 확증하기 위해, 나는 R 문서에서 인용한다 stats::sigma: 잘못된“잔여 표준 오류”는 너무 많은 R (및 S) 출력의 일부로 쉽게 변경 될 수 없다.
NRH

2

계량 경제학 교육에서는 실제 "잔여 표준 편차"의 추정치이므로 "잔여 표준 오류"라고합니다. 이 용어를 뒷받침하는 관련 질문참조하십시오 .

잔여 표준 오차라는 용어에 대한 Google 검색도 많은 조회수를 표시하므로 결코 R 홀수입니다. 나는 따옴표로 두 용어를 모두 시도했으며 약 60,000 번 나타납니다.


흥미 롭군 그런데 왜 당신은 표준 편차의 추정 부를 것이다 어떤 (; 아닌 특정 추정 오류 동류항) "표준 오류"확률 변수를?
Michael M

내 생각은 (실제 값과 구별하기 위해) 추정의 이름을 가져야한다는 것입니다. 모든 이름은 다른 이름과 같습니다. 그러나 어원에 대해 더 잘 알고있는 사람은 더 나은 이유를 제시 할 수 있습니다. 계수 추정치의 표준 편차의 추정치 인 계수 표준 오차와 평행을 이룬다는 점에 유의하십시오.
Heisenberg

0

간단히 말해서, 표본의 표준 오차는 표본 평균이 모집단 평균에서 얼마나 멀리 떨어져 있을지에 대한 추정치 인 반면, 표본의 표준 편차는 표본 내의 개인이 표본 평균과 다른 정도입니다.

표준 오류-위키 백과, 우리 모두의 백과 사전


6
이것은 사실이지만 실제로 질문에 대답하지는 않습니다. R이 "잔여 표준 오차"라고 부르는 것은 "표본 평균이 모집단 평균에서 얼마나 멀리 떨어져 있을지에 대한 추정"이 아닙니다.
gung-복직 모니카

0

적합 회귀 모델은 매개 변수를 사용하여 동일한 XX 값으로 스터디를 무한 횟수 ( 선형 모델이 참인 경우 )로 스터디를 복제하는 경우 관측 된 반응의 수단 인 점 추정값 예측을 생성합니다 .

이러한 예측 된 값과 모델을 맞추는 데 사용 된 값의 차이를 " 잔차 "라고하며, 데이터 수집 프로세스를 복제 할 때 0의 평균을 갖는 임의 변수의 속성을 갖습니다. 관찰 된 잔차는 이후에 이들 값의 변동성을 추정하고 파라미터의 샘플링 분포를 추정하는데 사용된다.

노트 :

잔차 표준 오차가 정확히 0 인 경우 모형은 데이터를 완벽하게 적합시킵니다 (과잉 적합으로 인해).

잔차 표준 오차가 무조건 응답의 변동성과 크게 다를 수없는 경우 선형 모형에 예측 능력이 있음을 암시하는 증거는 거의 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.