표준 오차는 추정 된 표준 편차이고 σ ( θ ) 추정기에서의 θ 파라미터에 대한 θ .
잔차의 추정 표준 편차가 "잔차 표준 오차"(예 : R의 summary.lm
함수 출력 )라고하고 잔차 표준 편차가 아닌 이유는 무엇입니까? 여기에 표준 오차를 갖는 모수 추정치는 무엇입니까?
각 잔차를 "그"오류 항에 대한 추정기로 간주하고 이러한 모든 추정 자의 "풀링 된"표준 오류를 추정합니까?
표준 오차는 추정 된 표준 편차이고 σ ( θ ) 추정기에서의 θ 파라미터에 대한 θ .
잔차의 추정 표준 편차가 "잔차 표준 오차"(예 : R의 summary.lm
함수 출력 )라고하고 잔차 표준 편차가 아닌 이유는 무엇입니까? 여기에 표준 오차를 갖는 모수 추정치는 무엇입니까?
각 잔차를 "그"오류 항에 대한 추정기로 간주하고 이러한 모든 추정 자의 "풀링 된"표준 오류를 추정합니까?
답변:
나는 구절이 R의 summary.lm()
출력에 따라 다르다고 생각합니다 . 기본 값은 실제로 "sigma"( summary.lm()$sigma
) 라고 합니다. 다른 소프트웨어가 반드시 잔차의 표준 편차에 해당 이름을 사용한다고 생각하지 않습니다. 또한 '잔여 표준 편차'라는 문구는 교과서에서 일반적입니다. 나는 그것이 R의 summary.lm()
출력에 사용 된 문구가 된 방법을 모르겠지만 항상 그것이 이상하다고 생각했습니다.
summary.lm(reg)$sigma
와는 어떻게 다른 sd(reg$residuals)
가요?
stats::sigma
: 잘못된“잔여 표준 오류”는 너무 많은 R (및 S) 출력의 일부로 쉽게 변경 될 수 없다.
계량 경제학 교육에서는 실제 "잔여 표준 편차"의 추정치이므로 "잔여 표준 오류"라고합니다. 이 용어를 뒷받침하는 관련 질문 을 참조하십시오 .
잔여 표준 오차라는 용어에 대한 Google 검색도 많은 조회수를 표시하므로 결코 R 홀수입니다. 나는 따옴표로 두 용어를 모두 시도했으며 약 60,000 번 나타납니다.
간단히 말해서, 표본의 표준 오차는 표본 평균이 모집단 평균에서 얼마나 멀리 떨어져 있을지에 대한 추정치 인 반면, 표본의 표준 편차는 표본 내의 개인이 표본 평균과 다른 정도입니다.
적합 회귀 모델은 매개 변수를 사용하여 동일한 XX 값으로 스터디를 무한 횟수 ( 선형 모델이 참인 경우 )로 스터디를 복제하는 경우 관측 된 반응의 수단 인 점 추정값 예측을 생성합니다 .
이러한 예측 된 값과 모델을 맞추는 데 사용 된 값의 차이를 " 잔차 "라고하며, 데이터 수집 프로세스를 복제 할 때 0의 평균을 갖는 임의 변수의 속성을 갖습니다. 관찰 된 잔차는 이후에 이들 값의 변동성을 추정하고 파라미터의 샘플링 분포를 추정하는데 사용된다.
잔차 표준 오차가 정확히 0 인 경우 모형은 데이터를 완벽하게 적합시킵니다 (과잉 적합으로 인해).
잔차 표준 오차가 무조건 응답의 변동성과 크게 다를 수없는 경우 선형 모형에 예측 능력이 있음을 암시하는 증거는 거의 없습니다.