사용 StandardScaler
에 대해 읽을 때 대부분의 권장 사항은 데이터를 기차 / 테스트로 나누기 StandardScaler
전에 사용해야한다고 말 했지만 온라인으로 게시 된 코드 중 일부 (sklearn을 사용하여)를 확인했을 때 두 가지 주요 용도가있었습니다.
1- StandardScaler
모든 데이터를 사용 합니다. 예 :
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_fit = sc.fit(X)
X_std = X_fit.transform(X)
또는
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X = sc.fit(X)
X = sc.transform(X)
아니면 간단히
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_std = sc.fit_transform(X)
2- StandardScaler
분할 데이터 사용.
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform (X_test)
데이터를 표준화하고 싶지만 어떤 방법이 가장 좋은지 혼란스러워합니다!