프로그램 작성 scikit-learn

3

배경 : 저는 이제 막 scikit-learn을 시작하고 있으며 페이지 하단에서 joblib와 pickle에 대해 읽었습니다 . joblib의 pickle (joblib.dump & joblib.load) 대체를 사용하는 것이 더 흥미로울 수 있습니다. 저는 Pickle에 대한이 Q & A, Python의 pickle에 대한 일반적인 사용 사례를 읽고 여기 커뮤니티가 joblib와 pickle의 차이점을 공유 할 수 있는지 궁금합니다. …

85 python pickle scikit-learn

7

레이블이있는 sklearn 플롯 혼동 행렬

분류 자의 성능을 시각화하기 위해 혼동 행렬을 플로팅하고 싶지만 레이블 자체가 아닌 레이블 수만 표시합니다. from sklearn.metrics import confusion_matrix import pylab as pl y_test=['business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business'] pred=array(['health', 'business', 'business', 'business', 'business', 'business', 'health', …

85 python matplotlib scikit-learn

4

get_dummies (Pandas)와 OneHotEncoder (Scikit-learn)의 장단점은 무엇입니까?

기계 학습 분류기를 위해 범주 형 변수를 숫자로 변환하는 다양한 방법을 배우고 있습니다. 나는 pd.get_dummies방법을 발견했고 sklearn.preprocessing.OneHotEncoder()성능과 사용 측면에서 어떻게 다른지보고 싶었습니다. 내가 사용하는 방법에 대한 자습서 발견 OneHotEncoder()에 https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/ 이후를 sklearn문서는이 기능에 너무 도움이되지 않았습니다. 제대로하고 있지 않다는 느낌이 있지만 ... 일부는 pd.dummiesover 사용의 장단점을 설명 할 수 있습니까 …

84 python pandas machine-learning scikit-learn dummy-variable

5

scikit-learn을 사용하여 여러 범주로 분류

scikit-learn의지도 학습 방법 중 하나를 사용하여 텍스트를 하나 이상의 범주로 분류하려고합니다. 내가 시도한 모든 알고리즘의 예측 기능은 하나의 일치를 반환합니다. 예를 들어 텍스트가 있습니다. "Theaters in New York compared to those in London" 그리고 내가 피드하는 모든 텍스트 스 니펫의 위치를 선택하도록 알고리즘을 훈련 시켰습니다. 위의 예에서는 New Yorkand 를 …

80 python classification scikit-learn

3

여러 범주 형 열 변환

내 데이터 세트에는 두 개의 범주화 된 열이 있으며,이 열은 계산하고 싶습니다. 두 열 모두 국가를 포함하고 일부는 겹칩니다 (두 열 모두에 나타남). 같은 국가의 column1과 column2에 같은 번호를 지정하고 싶습니다. 내 데이터는 다소 비슷합니다. import pandas as pd d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', …

10 python python-3.x pandas scikit-learn categorical-data

2

특이 치를 찾기 위해 IsolationForest와 함께 GridSearchCV 사용

IsolationForest특이 치를 찾는 데 사용하고 싶습니다 . 모델에 가장 적합한 매개 변수를 찾고 싶습니다 GridSearchCV. 문제는 항상 같은 오류가 발생한다는 것입니다. TypeError: If no scoring is specified, the estimator passed should have a 'score' method. The estimator IsolationForest(behaviour='old', bootstrap=False, contamination='legacy', max_features=1.0, max_samples='auto', n_estimators=100, n_jobs=None, random_state=None, verbose=0, warm_start=False) does not. 방법 …

10 python scikit-learn

«scikit-learn» 태그된 질문