선형 SVM 분류를 수행 할 때, 예를 들어 평균을 빼고 표준 편차로 나눈 후 훈련 데이터를 정규화하고 나중에 시험 데이터를 훈련 데이터의 평균 및 표준 편차로 스케일링하는 것이 도움이됩니다. 이 프로세스가 분류 성능을 크게 변경하는 이유는 무엇입니까?
1
이 질문은 이미 답변되었습니다. stackoverflow.com/questions/15436367/svm-scaling-input-values
—
jpmuc
감사합니다. 그러나 왜 테스트 세트를 자체 훈련 세트의 평균과 표준으로 스케일링해야하는지 여전히 확실하지 않습니까? 경우에 따라 두 세트의 샘플이 테스트 세트에서 균형이 잘 잡힌 경우 후자가 성능이 좋거나 더 나은 것처럼 보입니다.
—
Qinghua
왜냐하면 당신은 일관성이 없기 때문입니다. 다른 데이터를 테스트하고 있습니다. 가우스 N (mu, sigma)에서 표본을 추출한다고 가정합니다. 당신은 (중심과 스케일링 후) N (0,1)으로 훈련했지만 N (mu, sigma)로 테스트되었습니다
—
jpmuc