다중 레이블 분류 문제에 신경망을 적용하는 방법은 무엇입니까?


12

기술:

문제 영역은 각각 하나 이상의 클래스에 속하는 일련의 특징 벡터가 존재하는 문서 분류로하자. 예를 들어, 문서 doc_1SportsEnglish범주에 속할 수 있습니다 .

질문:

분류를 위해 신경망을 사용하면 특징 벡터의 레이블은 무엇입니까? 관련이없는 클래스에 0 값이 주어지고 관련 클래스에 1이되도록 모든 클래스를 구성하는 벡터입니까? 따라서 클래스 레이블 목록이 [Sports, News, Action, English, Japanese]이면 문서 doc_1의 레이블은 [1, 0, 0, 1, 0]?

답변:


3

예, 다중 레이블 학습에서 레이블 정보는 종종 설명 된 이진 벡터로 인코딩됩니다. 평가가 더 쉽습니다.

다중 레이블 학습을위한 오픈 소스 Java 라이브러리 인 MULAN 을 확인할 수 있습니다 . 이것은 Weka 확장이며 신경망을 포함하여 많은 다중 레이블 분류기를 구현했습니다. 예를 들어 여기서 BP-MLL을 찾을 수 있습니다 .


8

이것은 당신이 찾고있는 종이 인 것 같습니다 :

Min-Ling Zhang 및 Zhi-Hua Zhou : 기능 유전체학 및 텍스트 분류에 응용할 수있는 다중 레이블 신경망

초록에서 :

다중 레이블 학습에서 학습 세트의 각 인스턴스는 레이블 세트와 연관되며, 태스크는 보이지 않는 각 인스턴스의 크기를 알 수없는 레이블 세트를 출력하는 것입니다. BP-MLL이라는 신경망 알고리즘, 즉 다중 레이블 학습을위한 역 전파 (backpropagation)가 제안된다. ... 두 개의 실제 다중 레이블 학습 문제, 즉 기능 게놈 및 텍스트 분류에 대한 응용은 BP-MLL의 성능이 잘 확립 된 다중 레이블 학습 알고리즘의 성능보다 우수함을 보여줍니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.