멀티 클래스 분류기의 혼동 행렬을 작성하는 방법은 무엇입니까?


12

6 개의 수업에 문제가 있습니다. 그래서 다음과 같이 멀티 클래스 분류기를 작성합니다. 각 클래스마다 One vs. All을 사용하여 하나의 Logistic Regression 분류 기가 있습니다. 즉, 6 개의 다른 분류자가 있습니다.

분류기 각각에 대해 혼동 매트릭스를보고 할 수 있습니다. 그러나 여기 많은 예에서 보았 듯이 모든 분류 자에 대한 혼동 행렬을보고하고 싶습니다 .

어떻게하니? One vs. All 대신 One vs. One 알고리즘을 사용하여 분류 전략을 변경해야합니까? 이러한 혼란 매트릭스에서 보고서는 각 클래스에 대한 오 탐지를 말합니다.

멀티 클래스 혼동 행렬의 예

멀티 클래스 혼란 매트릭스

잘못 분류 된 항목 수를 찾고 싶습니다. 첫 번째 행에는 클래스 1로 분류 된 클래스 1의 137 개 예제와 클래스 2로 분류 된 클래스 1의 13 개 예제가 있습니다. 이 번호를 얻는 방법?


잘못 분류 된 항목의 수는 행렬의 모든 요소에서 행렬의 흔적을 뺀 것의 합계입니다 ... 그러나 이것이 당신이 의미하는 것은 아니라고 생각합니다.

1
기계적으로, 먼저 테스트 세트를 실제 클래스 (예 : Target = 1, Target = 2 등)로 분리 한 다음 훈련 된 분류기를 각 그룹의 각 지점에 적용하여이 행렬을 얻습니다. 따라서 Target = 1의 경우 각 그룹에 할당 된이 그룹의 구성원 수에 따라 행렬의 맨 위 행을 채우게됩니다.

이것이 정확히 수행되어야하는 방법입니다 .... 당신이 말한 것처럼 기계적인. 감사!
Victor Leal

1
문제 없어요. 나는 이것을 게시물에서 더 공식적으로 언급했지만 때로는 실제 레시피를 보는 데 도움이됩니다.

답변:


6

아마도 이러한 분류기를 사용하여 지정된 기능 값 세트에 대해 하나의 특정 클래스를 선택하는 데 도움이 될 것입니다 (멀티 클래스 분류기를 작성한다고 말했듯이).

그래서, 당신이 가지고 있다고 N 클래스가 혼란 스러우면 N×N행렬, 왼쪽 축에는 테스트 클래스에 알려진대로 실제 클래스가 표시되고 위쪽 축에는 해당 실제 클래스가있는 항목에 지정된 클래스가 표시됩니다. 각 요소i,j 행렬의 진정한 클래스를 가진 항목의 수입니다 i 수업 중으로 분류 된 j.

이것은 2 클래스 혼란 매트릭스의 간단한 확장입니다.


예! 나는 그것에 대해 알고있다! 그러나 오 탐지를 말하는 방법은 무엇입니까? 잘못 분류 된 항목의 수가 표시되는 예가 있습니다. 분류자가 "A 클래스의 60 개의 항목이 있고 40 개의 다른 클래스가 있습니다 (어떤 항목을 말할 수 없는지) is ...) "
Victor Leal

1
@VictorLeal 내가 따르지 않는 혼란 매트릭스는 거짓 긍정적, 진실 긍정적, 진실 부정, 거짓 부정을 알려줄 것입니다.

1
@VictorLeal 여기를 참조하십시오 : en.wikipedia.org/wiki/Confusion_matrix

혼란 매트릭스에있는 정보를 알고 있습니다. 아마 이미지 캔 내가 무슨 말을하는지 잘 나타냅니다 혼란 매트릭스 멀티 클래스
빅터 충실한

@VictorLeal 그것은 나에게 일반적인 혼란 매트릭스처럼 보입니다 ... LHS는 실제 클래스를 상단에 할당 된 클래스를 보여줍니다 ... 내가 뭔가를 놓치고 있습니까? 또한이 이미지를 게시물에 추가해야합니다. 도움이 될 것입니다.

12

이 포럼에 이미 몇 가지 답변이 있지만 더 명확하게하기 위해 명시 적 방정식을 줄 것이라고 생각했습니다.

다음과 같은 형식의 다중 클래스 혼동 행렬이 있다고 가정하면,

C=ActualClassifedc11...c1ncn1cnn

각 클래스의 혼란 요소는 다음과 같습니다.

tpi=cii

fpi=l=1nclitpi

fni=l=1nciltpi

tni=l=1nk=1nclktpifpifni


L과 L은 무엇입니까?
girl101

1
또한, 모든 수업에서 tp, tn, fp, fn은 무엇입니까
girl101

tp = 참 긍정, fp = 거짓 긍정, fn = 거짓 부정, tn = 참 부정. 인덱스 i가 각 클래스에 대한 참조라고 가정합니다.
앨버트

1

질문에 첨부 된 행렬을 사용하고 세로 축의 값을 실제 클래스로 고려하고 가로 축의 값을 예측으로 고려하십시오. 그런 다음 1 급 :

  • 진 양성 = 137-> 클래스 1로 분류 된 클래스 1의 샘플
  • 거짓 양성 = 6-> 2, 3 및 4 클래스의 샘플 (1 + 2 + 4)이지만 클래스 1로 분류
  • False Negative = 18-> 클래스 1의 샘플 (13 + 3 + 1 + 1)이지만 클래스 2, 3, 6 및 7로 분류됩니다.
  • 완전 음수 = 581-> (55 + 1 + 6 ... + 2 + 26) 1 열과 1 열의 값을 제외한 행렬의 모든 값의 합
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.