«class-imbalance» 태그된 질문

2
왜 우리는 데이터 불균형을 처리해야합니까?
데이터 불균형을 처리해야하는 이유 를 알아야 합니다. 업 샘플링 또는 다운 샘플링 또는 Smote를 사용하여 문제를 해결하는 방법과 다양한 방법을 알고 있습니다. 예를 들어, 100 명 중 1 %의 희귀 질환이 있고 훈련 세트에 대해 균형 잡힌 데이터 세트를 결정했다고 가정 해 보겠습니다. 50/50 샘플 기계가 환자의 50 %가 질병? …

2
데이터 세트를 분류 할 수 없다고 언제 말합니까?
나는 실제로 어떤 종류의 분류도 할 수없는 데이터 세트를 분석했습니다. 분류자를 얻을 수 있는지 확인하려면 일반적으로 다음 단계를 사용했습니다. 숫자 값에 대한 레이블의 상자 그림을 생성합니다. 클래스가 분리 가능한지 확인하기 위해 차원을 2 또는 3으로 줄이십시오. 때로는 LDA를 사용해보십시오. SVM 및 임의 포리스트에 맞게 조정하고 기능의 중요성을 살펴보고 기능이 의미가 …

3
언제 데이터 셋을 불균형으로 간주해야합니까?
데이터 세트의 긍정적 및 부정적 예의 수가 불균형 인 상황에 직면하고 있습니다. 내 질문은 데이터 집합에서 일종의 균형을 맞추기 위해 큰 범주를 하위 샘플링 해야하는시기를 알려주는 경험 법칙이 있습니까? 예 : 긍정적 인 예의 수가 1,000이고 부정적인 예의 수가 10,000이면, 전체 데이터 세트에 대한 분류기를 훈련해야합니까, 아니면 부정적인 예를 서브 …

1
불균형 클래스를 다루기위한 접근법의 분류
불균형 계급 문제를 해결하기 위해 개발 된 접근법을 분류하는 가장 좋은 방법은 무엇입니까? 이 기사는 다음과 같이 분류합니다. 전처리 : 오버 샘플링, 언더 샘플링 및 하이브리드 방법, 비용에 민감한 학습 : 직접 분석법과 메타 학습을 포함하며 후자는 임계 값과 샘플링으로 더 나뉘어집니다. 앙상블 기술 : 앙상블 학습과 함께 비용에 민감한 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.