내가 사용하고 quantreg의 데이터 세트 내 값의 99 번째 백분위 수를 사용하여 회귀 모델을 만들기 위해 패키지를. 필자가 요청한 이전의 stackoverflow 질문 에 대한 조언을 바탕으로 다음 코드 구조를 사용했습니다.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
내 데이터 위에 플롯 된 것을 보여줍니다. ggplot2를 사용하여 점에 대한 알파 값으로 이것을 플로팅했습니다. 내 분포의 꼬리가 내 분석에서 충분히 고려되지 않고 있다고 생각합니다. 아마도 이것은 백분위 수 유형 측정에 의해 무시되는 개별 점이 있기 때문일 것입니다.
의견 중 하나는
패키지 비 네트에는 비선형 Quantile 회귀에 대한 섹션과 스무딩 스플라인 등이 포함 된 모델이 포함되어 있습니다.
이전 질문을 바탕으로 나는 로그 관계를 가정했지만 그것이 올바른지 확실하지 않습니다. 99 백분위 간격으로 모든 점을 추출한 다음 별도로 검사 할 수 있다고 생각했지만 어떻게 해야하는지 잘 모르겠습니다. 이 관계 식별을 개선하는 방법에 대한 조언을 부탁드립니다.