R MASS 패키지에서 rlm을 사용하여 다변량 선형 모델을 회귀하고 있습니다. 그것은 많은 샘플에서 잘 작동하지만 특정 모델에 대한 준 널 계수를 얻습니다.
Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit)
Residuals:
Min 1Q Median 3Q Max
-7.981e+01 -6.022e-03 -1.696e-04 8.458e-03 7.706e+01
Coefficients:
Value Std. Error t value
(Intercept) 0.0002 0.0001 1.8418
X1 0.0004 0.0000 13.4478
X2 -0.0004 0.0000 -23.1100
X3 -0.0001 0.0002 -0.5511
X4 0.0006 0.0001 8.1489
Residual standard error: 0.01086 on 49052 degrees of freedom
(83 observations deleted due to missingness)
비교를 위해 다음은 lm ()에 의해 계산 된 계수입니다.
Call:
lm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, na.action = na.omit)
Residuals:
Min 1Q Median 3Q Max
-76.784 -0.459 0.017 0.538 78.665
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.016633 0.011622 -1.431 0.152
X1 0.046897 0.004172 11.240 < 2e-16 ***
X2 -0.054944 0.002184 -25.155 < 2e-16 ***
X3 0.022627 0.019496 1.161 0.246
X4 0.051336 0.009952 5.159 2.5e-07 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.574 on 49052 degrees of freedom
(83 observations deleted due to missingness)
Multiple R-squared: 0.0182, Adjusted R-squared: 0.01812
F-statistic: 227.3 on 4 and 49052 DF, p-value: < 2.2e-16
lm의 거리는 Cook의 거리로 측정 할 때 특히 높은 특이 치를 나타내지 않습니다.
편집하다
참고로 Macro가 제공 한 응답을 기반으로 결과를 확인한 후 k
Huber 추정기에서 튜닝 매개 변수를 설정하는 R 명령 은 ( k=100
이 경우)입니다.
rlm(y ~ x, psi = psi.huber, k = 100)
@jbowman Y가 맞습니다. MM 방법을 추가했습니다. 나의 직감은 당신이 언급 한 것과 같습니다. 이 모델 잔차는 내가 시도한 다른 모델에 비해 상대적으로 작습니다. 방법론이 대부분의 관측치를 버리고있는 것 같습니다.
—
Robert Kubrick
@RobertKubrick 당신은 k를 100으로 설정하는 것이 무엇을 의미 하는지 이해 합니까?
—
user603
이를 기반으로 : 다중 R 제곱 : 0.0182, 조정 R 제곱 : 0.01812 모델을 한 번 더 검사해야합니다. 특이 치, 반응 또는 예측 변수의 변환 또는 비선형 모델을 고려해야합니다. 예측 자 X3은 중요하지 않습니다. 당신이 만든 것은 좋은 선형 모델이 아닙니다.
—
Marija Milojevic
rlm
가중치 함수가 거의 모든 관측 값을 버리는 것처럼 보입니다. 두 회귀 분석에서 Y가 같습니까? (그냥 확인 ...) 시도method="MM"
당신에rlm
(실패 할 경우) 다음 시도, 호출psi=psi.huber(k=2.5)
하는 스프레드 아웃 (2.5 기본 1.345보다 단지 더 큰, 임의)lm
가중 함수의 -like 지역.