나는이 OTTO Kaggle 챌린지 에 대한 솔루션에 대해 읽고 있었고 첫 번째 장소 솔루션은 입력 데이터 X에 대해 몇 가지 변환을 사용하는 것 같습니다 (예 : Log (X + 1), sqrt (X + 3/8) 등). 다양한 분류 자에게 어떤 종류의 변환을 적용 할 것인지에 대한 일반 지침? 평균-평균 및 최소-최대 …
내 속성으로 '시간'필드가 있지만 주기적 값이 필요합니다. '23'과 '0'시간과 같은 정보를 유지하기 위해 기능을 어떻게 변환 할 수 있습니까? 내가 생각할 수있는 한 가지 방법은 변환을 수행하는 것입니다. min(h, 23-h) Input: [0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 …
휴무 . 이 질문에는 세부 사항이나 명확성 이 필요 합니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 세부 사항을 추가하고 문제점을 명확하게하십시오 . 휴일 삼년 전에 . 25 가지 기능을 갖춘 가상의 데이터 세트를 작업 중입니다. 두 가지 특징은 장소의 위도 및 경도이며, 다른 …
나는 Kaggle ( House Price on Human Price 's Kernel on House Price : Advance Regression Techniques ) 에서 주택 가격 경쟁의 해결책을 겪고 있었고이 부분을 보았습니다 . # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from scipy.stats import …
현재 SVM을 사용하고 있으며 훈련 기능을 [0,1] 범위로 조정하고 있습니다. 먼저 훈련 세트에 적합 / 변환 한 다음 동일한 변형을 테스트 세트에 적용합니다 . 예를 들면 다음과 같습니다. ### Configure transformation and apply to training set min_max_scaler = MinMaxScaler(feature_range=(0, 1)) X_train = min_max_scaler.fit_transform(X_train) ### Perform transformation on testing set X_test …
다음 그림은 선형 회귀로 얻은 계수를 보여줍니다 ( mpg목표 변수로, 다른 모든 변수는 예측 변수로). 데이터 를 스케일링하거나 스케일링하지 않은 mtcars 데이터 세트 ( here 및 here )의 경우 : 이 결과를 어떻게 해석합니까? 변수 hp및 disp데이터의 크기가 조절 된 경우에만 중요합니다. 인가 am와 qsec동등하게 중요이거나 am보다 더 중요 qsec? …