답변:
이 분산의 결과는 다음과 같습니다.
견적 어디 더 이상 추정기의 공분산 행렬에 대한 일관된 추정기 가 아닙니다 .. 편향되거나 일관성이 없을 수 있습니다. 실제로 실제로 분산을 과소 평가할 수 있습니다.
포인트 (1)은 큰 문제가 아닐 수 있습니다. 어쨌든 사람들은 종종 일반적인 OLS 추정기를 사용합니다. 그러나 포인트 (2)를 해결해야합니다. 무엇을해야합니까?
이분산성 일관성이있는 표준 오류 가 필요 합니다 . 표준 접근법은 대규모 표본 가정, 점근 적 결과에 의존하고 분산을 추정하는 것입니다. 사용하여 :
이것은 이분산성에 일관된 표준 오류를 제공합니다. 또한 Huber-White 표준 오류, 강력한 표준 오류, "샌드위치"추정기 등으로도 알려져 있습니다. 모든 기본 표준 통계 패키지에는 강력한 표준 오류 옵션이 있습니다. 사용해!
이분산성이 충분히 크면 규칙적인 OLS 추정치에 큰 실제 문제가있을 수 있습니다. 여전히 일관된 추정값이지만 전체 추정값이 몇 가지 높은 분산 관측치에 의해 유발되는 작은 표본 문제가있을 수 있습니다. (이것은 의견에서 @ seanv507이 암시하는 것입니다). OLS 추정기는 최적보다 높은 분산 관측치에 더 많은 가중치를 부여한다는 점에서 비효율적입니다. 추정치는 잡음이 심할 수 있습니다.
비 효율성을 수정하려는 문제는 아마도 오류 항에 대한 공분산 행렬을 알지 못하기 때문에 GLS 와 같은 것을 사용 하면 오류 항 공분산 행렬의 추정치가 가비지 인 경우 상황이 더욱 악화 될 수 있다는 것입니다.
또한 위에서 언급 한 Huber-White 표준 오류는 작은 샘플에서 큰 문제가있을 수 있습니다. 이 주제에 대한 긴 문헌이 있습니다. 예 : Imbens and Kolesar (2016), "작은 샘플의 강력한 표준 오류 : 실제적인 조언"을 참조하십시오.
이것이 스스로 연구하는 경우 고려해야 할 실질적인 다음은 클러스터 된 표준 오류입니다. 클러스터 내에서 임의의 상관 관계를 수정합니다.
짧은 대답은 기본적으로 모델이 잘못되었다는 것입니다.
따라서 분산 공분산 행렬을 추정하는 데 이분산성 문제가 발생하면 계수의 잘못된 표준 오류가 발생하여 잘못된 t- 통계량 및 p- 값이 발생합니다. 간단히 말해서, 오차항에 일정한 분산이 없으면 보통 최소 제곱은 추정에 가장 효율적인 방법이 아닙니다. 이 관련 질문을 살펴보십시오 .
"이분산성"은 예측 오차의 실제 표준 편차를 추정하는 것을 어렵게합니다. 이로 인해 신뢰 구간이 너무 넓거나 좁아 질 수 있습니다 (특히 오류의 분산이 시간이 지남에 따라 증가하는 경우 표본 외 예측에 대해서는 너무 좁아집니다).
또한 회귀 모델은 데이터의 하위 집합에 너무 집중할 수 있습니다.
좋은 참조 : 선형 회귀 테스트 가정