SVM은 불균형 데이터 세트를 처리합니까? 불균형 데이터 세트를 처리하는 매개 변수 (예 : C 또는 분류 오류)가 있습니까?
1
데이터 세트가 "불균형"이되는 이유는 무엇입니까?
—
whuber
@whuber 매우 다양한 클래스 유병률을 가진 분류 데이터 세트를 종종 불균형이라고합니다.
—
Marc Claesen
@Marc 일반적으로 사실 일 수도 있지만 모호한 개념입니다. "거의 변화"는 얼마입니까? 특정 상황을 제외하고 왜 중요한가? 나는 이 질문 의 제안자 가 의도 된 의미에 대한 다른 사람의 지적 추측을 받아들이지 않고 "불균형"에 의해 무엇을 의미 하는지 배우는 것이 중요하다고 생각합니다 .
—
whuber
@whuber 불균형 데이터 셋은 머신 러닝의 일반적인 개념입니다. 예를 들어 스팸 탐지 등으로 인한 응용 프로그램 측면에서 아마 확률 대신 오 분류 오류를 목표로하는 알고리즘의 우세 때문일 수 있습니다. 결과적으로 오류 가중치에 문제가 있습니다.
—
seanv507
설명을 해주셔서 감사합니다, @seanv. 용어 문제는 실제로 "핸들"이 "적용될 수있다"를 말하는 것이 아니라 오히려 (1) 소수에 해당하는 예측 성능에 의해 영향을받을 수있는 클래스가있는 설정을 암시한다 다른 계급의 존재, (2) 소수 계급에 대한 정확한 예측이 중요하다. 그런 의미에서 "불균형 데이터 세트"는 문제에 대한 다소 불완전한 설명이지만,이 용어가 일부 통화를 획득 한 것으로 보이므로 불평 할 것 같지 않습니다.
—
whuber