답변:
분위수 회귀는 반응 변수가 거의 연속적이라고 가정하는 것 외에 분포 분포 가정, 즉 잔차에 대한 가정을하지 않습니다. 함수 예측 변수 X로 단일 Quantile을 추정하는 문제를 해결하는 경우, 선형 예측 변수 의 잘못된 사양은 잘못 될 수 있습니다.즉, 비선형 효과 (일반적인 문제) 또는 상호 작용 효과를 포함시키지 않는 것. 적어도 두 가지 권장 방법이 있습니다. 먼저 표본 크기가 크면 더 유연한 모델에 적합합니다. 좋은 타협은 제한된 입방 스플라인 (자연 스플라인)과 같은 회귀 스플라인을 사용하여 모든 주요 효과를 비선형으로 만드는 것입니다. 그런 다음 상호 작용을 제외하고 확인할 필요가 없습니다. 두 번째 접근 방식은 모형이 단순하기를 희망하는 이유 (왜?)이지만 모형을 복잡하게 한 다음 단순 모형에 대한 복잡한 추가의 영향을 평가하는 것입니다. 예를 들어, 비선형 또는 교호 작용 항 또는 둘 다의 결합 된 기여를 평가할 수 있습니다. 예는 R을 사용하여, 다음 rms
과quantreg
패키지. 매개 변수 수를 제한하기 위해 절충 상호 작용 양식이 사용됩니다. 상호 작용은 이중 비선형이 아닌 것으로 제한됩니다.
require(rms)
# Estimate 25th percentile of y as a function of x1 and x2
f <- Rq(y ~ rcs(x1, 4) + rcs(x2, 4) + rcs(x1, 4) %ia% rcs(x2, 4), tau=.25)
# rcs = restricted cubic spline, here with 4 default knots
# %ia% = restricted interaction
# To use general interactions (all cross product terms), use:
# f <- Rq(y ~ rcs(x1, 4)*rcs(x2, 4), tau=.25)
anova(f) # get automatic combined 'chunk' tests: nonlinearity, interaction
# anova also provides the combined test of complexity (nonlin. + interact.)