멀티 클래스 문제와 멀티 라벨 문제의 차이점은 무엇입니까?
멀티 클래스 문제와 멀티 라벨 문제의 차이점은 무엇입니까?
답변:
차이점은 멀티 클래스 문제에서 클래스가 상호 배타적 인 반면 멀티 레이블 문제의 경우 각 레이블은 다른 분류 작업을 나타내지 만 작업은 관련이 있습니다 (따라서 개별적으로 처리하지 않고 함께 처리하면 이점이 있습니다) ). 예를 들어 유명한 Leptograspus crabs 데이터 세트 에는 두 가지 색상의 게 유형의 수컷과 암컷의 예가 있습니다. 네 가지 클래스 (남색, 여성 파란색, 남성 주황색, 여성 주황색)의 다중 클래스 문제 또는 하나의 레이블이 남성 / 여성이고 다른 하나의 파란색 인 다중 레이블 문제 로이 문제에 접근 할 수 있습니다 /주황색. 기본적으로 다중 레이블 문제에서 패턴은 둘 이상의 클래스에 속할 수 있습니다.
멀티 클래스 분류는 둘 이상의 클래스가있는 분류 작업을 의미합니다. 예를 들어, 오렌지, 사과 또는 배일 수있는 과일 이미지 세트를 분류하십시오. 멀티 클래스 분류는 각 샘플이 하나의 레이블에만 할당된다고 가정합니다. 과일은 사과 또는 배일 수 있지만 동시에 둘 다일 수는 없습니다.
다중 레이블 분류 는 각 샘플에 대상 레이블 집합을 할당합니다. 이것은 문서와 관련된 주제와 같이 상호 배타적이지 않은 데이터 포인트의 속성을 예측하는 것으로 생각할 수 있습니다. 텍스트는 동시에 종교, 정치, 재정 또는 교육에 관한 것일 수도 있고 그렇지 않을 수도 있습니다.
http://scikit-learn.org/stable/modules/multiclass.html 에서 가져온
다중 클래스 문제는 상호 배타적 인 유한 클래스 컬렉션 중 하나에 인스턴스를 할당하는 것입니다. 예를 들어 이미 @Dikran에서 제공 한 게 : 남성-파랑, 여성-파랑, 남성-오렌지, 여성-오렌지. 이들 각각은 다른 것들을 배타적이며 종합적입니다.
다중 레이블 문제의 한 가지 형태는 이러한 레이블을 성별과 색상의 두 레이블로 나누는 것입니다. 성별은 남성 또는 여성 일 수 있으며, 색상은 파란색 또는 주황색 일 수 있습니다. 그러나 이것은 모든 인스턴스가 모든 레이블 (즉, 모든 게는 성별과 색상을 가짐)을 갖기 때문에 다중 레이블 문제의 특별한 경우입니다.
다중 레이블 문제에는 각 인스턴스에 다양한 수의 레이블을 할당 할 수있는 다른 경우도 포함됩니다. 예를 들어 신문이나 유선 서비스의 기사는 뉴스, 정치, 스포츠, 의학 등의 범주에 할당 될 수 있습니다. 중요한 스포츠 이벤트에 대한 한 가지 이야기는 SPORTS라는 레이블을 할당하는 것입니다. 한편 특정 스포츠 행사에서 드러나는 정치적 긴장과 관련된 또 하나는 스포츠와 정치라는 레이블을 얻을 수 있습니다. 내가 미국에있는 경우, 슈퍼 볼의 결과는 이벤트의 사회적 영향을 고려하여 스포츠와 뉴스로 표시됩니다.
다양한 수의 레이블이있는이 형식의 레이블은 크랩이있는 예제와 유사한 형식으로 다시 변환 될 수 있습니다. 단, 모든 라벨은 LABEL-X 또는 LABEL-X가 아닌 것으로 취급됩니다. 그러나 모든 방법에이 변환이 필요한 것은 아닙니다.