선형 회귀 모델에 사용하기 위해 데이터 매트릭스를 스케일링하는 개념을 이해합니다. 예를 들어 R에서는 다음을 사용할 수 있습니다.
scaled.data <- scale(data, scale=TRUE)
내 유일한 질문은 출력 값을 예측하려는 새로운 관찰에 대해 어떻게 정확하게 스케일링되는 것입니까? 그럴까요 scaled.new <- (new - mean(data)) / std(data)
?
값을 되돌리고 싶지 않습니다. 새 인스턴스를 같은 방식으로 올바르게 확장하는 방법을 알고 싶습니다. 귀하의 의견을 바탕으로 질문을 편집했습니다.
—
SamuelNLP
y = y_esc * sd(y) + mean(y)
모델 속성이 엉망이 될 것이므로 더 기술적 인 답변을 기다리고 있습니다!