균형 점수를 예측하고 여러 가지 회귀 분석 방법을 시도했습니다. 내가 주목 한 것은 예측 값에 일종의 상한이있는 것 같습니다. 즉, 실제 균형은 이지만 내 예측은 약 입니다. 다음 그림은 실제 대 예측 잔액을 보여줍니다 (선형 회귀로 예측 됨).
다음은 동일한 데이터에 대한 두 가지 분포도입니다.
예측 변수가 매우 왜곡되었으므로 (전력 법칙 분포가있는 사용자 데이터) Box-Cox 변환을 적용하여 결과를 다음과 같이 변경했습니다.
예측 분포를 변경하더라도 여전히 상한이 있습니다. 그래서 내 질문은 :
- 예측 결과에서 그러한 상한에 대한 가능한 이유는 무엇입니까?
- 실제 값의 분포와 일치하도록 예측을 수정하려면 어떻게해야합니까?
보너스 : Box-Cox 변환 후 분포가 변환 된 예측 변수의 분포를 따르는 것처럼 보이므로 직접 연결될 수 있습니까? 그렇다면 분포를 실제 값에 맞추기 위해 적용 할 수있는 변환이 있습니까?
편집 : 5 예측 변수와 함께 간단한 선형 회귀를 사용했습니다.