멀티 클래스와 멀티 라벨 문제의 차이점


52

멀티 클래스 문제와 멀티 라벨 문제의 차이점은 무엇입니까?


Vowpal Wabbit 소프트웨어 패키지를 사용하여 두 가지 작업을 모두 수행 할 수 있습니다 (명령 줄, Python 바인딩 사용 가능).
Vladislavs Dovgalecs

나는이 개념을 배웠고이 게시물로 이해를 쌓았 으며, 그들은 다중 레이블 분류를 매우 우아한 방식으로 설명했습니다.
user235077

답변:


45

차이점은 멀티 클래스 문제에서 클래스가 상호 배타적 인 반면 멀티 레이블 문제의 경우 각 레이블은 다른 분류 작업을 나타내지 만 작업은 관련이 있습니다 (따라서 개별적으로 처리하지 않고 함께 처리하면 이점이 있습니다) ). 예를 들어 유명한 Leptograspus crabs 데이터 세트 에는 두 가지 색상의 게 유형의 수컷과 암컷의 예가 있습니다. 네 가지 클래스 (남색, 여성 파란색, 남성 주황색, 여성 주황색)의 다중 클래스 문제 또는 하나의 레이블이 남성 / 여성이고 다른 하나의 파란색 인 다중 레이블 문제 로이 문제에 접근 할 수 있습니다 /주황색. 기본적으로 다중 레이블 문제에서 패턴은 둘 이상의 클래스에 속할 수 있습니다.



@Learner 죄송합니다. 많은 일을하지 않았습니다. 멀티 라벨 학습과 유사한 멀티 태스킹 학습을 원할 수도 있습니다. 아마도 이것에 사용 된 일부 데이터 세트는 멀티 레이블 학습을위한 벤치 마크로 유용 할 수 있습니다.
Dikran Marsupial 2018

26

멀티 클래스 분류는 둘 이상의 클래스가있는 분류 작업을 의미합니다. 예를 들어, 오렌지, 사과 또는 배일 수있는 과일 이미지 세트를 분류하십시오. 멀티 클래스 분류는 각 샘플이 하나의 레이블에만 할당된다고 가정합니다. 과일은 사과 또는 배일 수 있지만 동시에 둘 다일 수는 없습니다.

다중 레이블 분류 는 각 샘플에 대상 레이블 집합을 할당합니다. 이것은 문서와 관련된 주제와 같이 상호 배타적이지 않은 데이터 포인트의 속성을 예측하는 것으로 생각할 수 있습니다. 텍스트는 동시에 종교, 정치, 재정 또는 교육에 관한 것일 수도 있고 그렇지 않을 수도 있습니다.

http://scikit-learn.org/stable/modules/multiclass.html 에서 가져온


18

다른 답변을 보완하기 위해 다음 그림이 있습니다. 하나의 행 = 하나의 샘플에 대한 예상 출력.

멀티 클래스

하나의 열 = 하나의 클래스 (one-hot encoding)

여기에 이미지 설명을 입력하십시오

멀티 라벨

하나의 열 = 하나의 클래스

여기에 이미지 설명을 입력하십시오


당신은 그것을 본다 :

  • 다중 레이블의 경우 하나의 샘플에 둘 이상의 클래스가 할당 될 수 있습니다.
  • 멀티 클래스의 경우 총 2 개 이상의 클래스가 있습니다.

참고로, 다중 출력 멀티 클래스 분류 문제가 발생 하지 않도록하는 것은 없습니다 . 예 :

여기에 이미지 설명을 입력하십시오


7

다중 클래스 문제는 상호 배타적 인 유한 클래스 컬렉션 중 하나에 인스턴스를 할당하는 것입니다. 예를 들어 이미 @Dikran에서 제공 한 게 : 남성-파랑, 여성-파랑, 남성-오렌지, 여성-오렌지. 이들 각각은 다른 것들을 배타적이며 종합적입니다.

다중 레이블 문제의 한 가지 형태는 이러한 레이블을 성별과 색상의 두 레이블로 나누는 것입니다. 성별은 남성 또는 여성 일 수 있으며, 색상은 파란색 또는 주황색 일 수 있습니다. 그러나 이것은 모든 인스턴스가 모든 레이블 (즉, 모든 게는 성별과 색상을 가짐)을 갖기 때문에 다중 레이블 문제의 특별한 경우입니다.

다중 레이블 문제에는 각 인스턴스에 다양한 수의 레이블을 할당 할 수있는 다른 경우도 포함됩니다. 예를 들어 신문이나 유선 서비스의 기사는 뉴스, 정치, 스포츠, 의학 등의 범주에 할당 될 수 있습니다. 중요한 스포츠 이벤트에 대한 한 가지 이야기는 SPORTS라는 레이블을 할당하는 것입니다. 한편 특정 스포츠 행사에서 드러나는 정치적 긴장과 관련된 또 하나는 스포츠와 정치라는 레이블을 얻을 수 있습니다. 내가 미국에있는 경우, 슈퍼 볼의 결과는 이벤트의 사회적 영향을 고려하여 스포츠와 뉴스로 표시됩니다.

다양한 수의 레이블이있는이 형식의 레이블은 크랩이있는 예제와 유사한 형식으로 다시 변환 될 수 있습니다. 단, 모든 라벨은 LABEL-X 또는 LABEL-X가 아닌 것으로 취급됩니다. 그러나 모든 방법에이 변환이 필요한 것은 아닙니다.


2

그리고 또 하나의 차이점은 다중 레이블 문제는 모델이 다른 클래스 간의 상관 관계를 학습해야한다는 점입니다. 그러나 다중 클래스 문제에서는 다른 클래스가 서로 독립적입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.