가중 최소 제곱 (WLS) 회귀는 변환 된 모델이 아닙니다. 대신, 각 관측 값을 와 Y 의 기본 관계에 대해 다소 유익한 정보로 취급합니다 . 더 유익한 점은 더 '무게'주어지고 덜 유익한 점은 덜 가중됩니다. 가중 최소 제곱 (WLS) 회귀는 가중치가 사전에 알려진 경우에만 기술적으로 유효합니다. 엑스와이
그러나 (OLS) 선형 회귀는 이분산성에 대해 상당히 견고하므로 추정치가 야구장에 있으면 WLS도 마찬가지입니다. OLS 회귀 분석의 최대 규칙은 최대 분산이 최소 분산의 4 배를 초과하지 않는 한 이분산성에 너무 영향을받지 않는다는 것입니다. 예를 들어, 잔차 / 오류의 분산이 상황에 따라 증가 합니다. 결과적으로 잔차의 분산과 예측 변수의 수준과 관련된 함수를 추정 할 수 있습니다. 엑스 경우, 하이 엔드의 잔차 분산이 로우 엔드의 잔차 분산의 4 배보다 작 으면 괜찮습니다. 이것의 의미는 체중이 그 범위 내에 들어가면 합리적으로 안전하다는 것입니다. 그것은 종류의 말굽과 수류탄
이러한 추정을 수행하는 방법과 관련된 몇 가지 문제가 있습니다.
가중치는 분산 (또는 사용하는 모든 것)의 역수 여야합니다.
엑스엑스
엑스plot(model, which=2)
엑스 중앙값으로부터의 중앙값 절대 편차 .
엑스엑스
OLS 회귀 잔차에서 가중치를 얻는 것은 이분산성이 존재하더라도 OLS가 편향되지 않기 때문에 합리적입니다. 그럼에도 불구하고 이러한 가중치는 원래 모델에 따라 달라지며 후속 WLS 모델의 적합도를 변경할 수 있습니다. 따라서 두 회귀 분석의 추정 베타를 비교하여 결과를 확인해야합니다. 그것들이 매우 유사하다면 괜찮습니다. WLS 계수가 OLS 계수와 다른 경우 WLS 추정값을 사용하여 잔차를 수동으로 계산해야합니다 (WLS 맞춤에서보고 된 잔차가 가중치를 고려함). 새로운 잔차 집합을 계산 한 후 가중치를 다시 결정하고 두 번째 WLS 회귀 분석에서 새 가중치를 사용하십시오. 이 과정은 두 세트의 예상 베타가 충분히 유사해질 때까지 반복해야합니다 (하지만 한 번만 수행하는 경우는 드물지만).
이 프로세스로 인해 가중치가 다소 불편하고 이전의 잘못된 모델에 영향을 받기 때문에 다소 불편한 경우 Huber-White 'sandwich'추정기 를 사용하는 것도 있습니다 . 이것은 아무리 심각하더라도 이분산성이 존재하더라도 일관성이 있으며 모델에 따라 달라지지 않습니다. 또한 번거롭지 않을 수도 있습니다.
가중 최소 제곱의 간단한 버전과 내 대답에 샌드위치 SE를 사용하는 방법을 보여줍니다 : 이 분산 데이터에 대한 일원 분산 분석 대안 .