«scikit-learn» 태그된 질문

scikit-learn은 머신 러닝에 중점을 둔 데이터 분석 및 데이터 마이닝을위한 간단하고 효율적인 도구를 제공하는 Python 용 머신 러닝 라이브러리입니다. 누구나 액세스 할 수 있으며 다양한 상황에서 재사용 할 수 있습니다. NumPy 및 SciPy를 기반으로합니다. 이 프로젝트는 오픈 소스이며 상업적으로 사용할 수 있습니다 (BSD 라이선스).

3
joblib와 pickle의 다른 사용 사례는 무엇입니까?
배경 : 저는 이제 막 scikit-learn을 시작하고 있으며 페이지 하단에서 joblib와 pickle에 대해 읽었습니다 . joblib의 pickle (joblib.dump & joblib.load) 대체를 사용하는 것이 더 흥미로울 수 있습니다. 저는 Pickle에 대한이 Q & A, Python의 pickle에 대한 일반적인 사용 사례를 읽고 여기 커뮤니티가 joblib와 pickle의 차이점을 공유 할 수 있는지 궁금합니다. …

7
레이블이있는 sklearn 플롯 혼동 행렬
분류 자의 성능을 시각화하기 위해 혼동 행렬을 플로팅하고 싶지만 레이블 자체가 아닌 레이블 수만 표시합니다. from sklearn.metrics import confusion_matrix import pylab as pl y_test=['business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business', 'business'] pred=array(['health', 'business', 'business', 'business', 'business', 'business', 'health', …

4
get_dummies (Pandas)와 OneHotEncoder (Scikit-learn)의 장단점은 무엇입니까?
기계 학습 분류기를 위해 범주 형 변수를 숫자로 변환하는 다양한 방법을 배우고 있습니다. 나는 pd.get_dummies방법을 발견했고 sklearn.preprocessing.OneHotEncoder()성능과 사용 측면에서 어떻게 다른지보고 싶었습니다. 내가 사용하는 방법에 대한 자습서 발견 OneHotEncoder()에 https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/ 이후를 sklearn문서는이 기능에 너무 도움이되지 않았습니다. 제대로하고 있지 않다는 느낌이 있지만 ... 일부는 pd.dummiesover 사용의 장단점을 설명 할 수 있습니까 …

5
scikit-learn을 사용하여 여러 범주로 분류
scikit-learn의지도 학습 방법 중 하나를 사용하여 텍스트를 하나 이상의 범주로 분류하려고합니다. 내가 시도한 모든 알고리즘의 예측 기능은 하나의 일치를 반환합니다. 예를 들어 텍스트가 있습니다. "Theaters in New York compared to those in London" 그리고 내가 피드하는 모든 텍스트 스 니펫의 위치를 ​​선택하도록 알고리즘을 훈련 시켰습니다. 위의 예에서는 New Yorkand 를 …

3
여러 범주 형 열 변환
내 데이터 세트에는 두 개의 범주화 된 열이 있으며,이 열은 계산하고 싶습니다. 두 열 모두 국가를 포함하고 일부는 겹칩니다 (두 열 모두에 나타남). 같은 국가의 column1과 column2에 같은 번호를 지정하고 싶습니다. 내 데이터는 다소 비슷합니다. import pandas as pd d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', …

2
특이 치를 찾기 위해 IsolationForest와 함께 GridSearchCV 사용
IsolationForest특이 치를 찾는 데 사용하고 싶습니다 . 모델에 가장 적합한 매개 변수를 찾고 싶습니다 GridSearchCV. 문제는 항상 같은 오류가 발생한다는 것입니다. TypeError: If no scoring is specified, the estimator passed should have a 'score' method. The estimator IsolationForest(behaviour='old', bootstrap=False, contamination='legacy', max_features=1.0, max_samples='auto', n_estimators=100, n_jobs=None, random_state=None, verbose=0, warm_start=False) does not. 방법 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.