«unbalanced-classes» 태그된 질문

개별 클래스 또는 * 클래스 *로 구성된 데이터는 각 클래스에 속하는 관측치 ( )가 클래스 전체에서 일정하지 않은 경우 특정 분석에 문제가 발생할 수 있습니다. 이 다른 클래스 는 * 언밸런스 드입니다 *. nn

2
f- 측정은 정확성과 동의어입니까?
나는 f- 측정 (정밀도와 리콜에 기초한)이 분류 기가 얼마나 정확한지 추정한다는 것을 이해합니다. 또한 불균형 데이터 세트가있을 때 정확도보다 f- 측정이 선호 됩니다. 간단한 질문이 있습니다 (기술보다는 올바른 용어를 사용하는 것에 관한 것입니다). 불균형 데이터 세트가 있으며 실험에서 f- 측정을 사용합니다. 머신 러닝 / 데이터 마이닝 회의 가 아닌 논문을 …

1
불균형 데이터 세트에 대한 ROC 곡선
입력 행렬 와 이진 출력 고려하십시오 .y엑스엑스X와이와이y 분류기의 성능을 측정하는 일반적인 방법은 ROC 곡선을 사용하는 것입니다. ROC 플롯에서 대각선은 랜덤 분류기에서 얻은 결과입니다. 불균형 출력 의 경우, 확률이 다른 또는 을 선택하여 랜덤 분류기의 성능을 향상시킬 수 있습니다 .0 1와이와이y000111 이러한 분류기의 성능을 ROC 곡선 플롯으로 어떻게 표현할 수 있습니까? …

1
멀티 클래스 불균형 문제에 대한 SMOTE 오류 발생
SMOTE를 사용하여 멀티 클래스 분류 문제의 불균형을 수정하려고합니다. SMOTE 도움말 문서에 따라 SMOTE가 홍채 데이터 세트에서 완벽하게 작동하지만 유사한 데이터 세트에서는 작동하지 않습니다. 내 데이터 모양은 다음과 같습니다. 값이 1, 2, 3 인 3 개의 클래스가 있습니다. > data looking risk every status 1 0 1 0 1 2 0 …

1
상호 배타적이지 않은 카테고리를 분류 할 수있는 딥 러닝 모델
예 : 직업 설명에 "영국의 Java Senior Engineer"문장이 있습니다. 나는 2 개 종류로 예측하는 깊은 학습 모델을 사용하려면 : English 와 IT jobs. 기존 분류 모델을 사용하는 경우 softmax마지막 레이어에서 함수가있는 레이블 하나만 예측할 수 있습니다 . 따라서 두 모델 신경망을 사용하여 두 범주 모두에서 "예"/ "아니오"를 예측할 수 있지만 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
범주 형 변수로 오버 샘플링
약 4000 명의 고객과 두 그룹으로 나뉘어 진 약 4000 명의 고객과 데이터 세트의 균형을 맞추기 위해 오버 샘플링과 언더 샘플링의 조합을 수행하고 싶습니다. 그룹 중 하나의 비율은 약 15 %입니다. SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE )와 ROSE ( http://cran.r-project.org/web/packages/ROSE/를 살펴 보았습니다 . ROSE.pdf ), 그러나 둘 다 기존 관측 값 (예 …

1
RandomForest-sklearn의 분류 임계 값
1) sklearn의 RandomForest에서 분류 임계 값을 변경하려면 어떻게해야합니까 (기본적으로 0.5라고 생각합니까)? 2) 어떻게 sklearn에서 언더 샘플링을 할 수 있습니까? 3) RandomForest 분류기의 결과는 다음과 같습니다. [[1635 1297] [520 3624]] precision recall f1-score support class 0 0.76 0.56 0.64 2932 class 1 0.74 0.87 0.80 4144 평균 / 총 0.75 0.74 …

1
SVM으로 불균형 멀티 클래스 데이터 세트를 처리하는 가장 좋은 방법
상당히 불균형 한 데이터에서 SVM을 사용하여 예측 모델을 작성하려고합니다. 레이블 / 출력에는 양, 중, 음의 세 가지 클래스가 있습니다. 긍정적 인 예는 내 데이터의 약 10-20 %, 중립 약 50-60 %, 음의 약 30-40 %를 말합니다. 수업 중 잘못된 예측과 관련된 비용이 같지 않기 때문에 수업의 균형을 맞추려고합니다. 한 가지 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.