멀티 클래스 퍼셉트론은 어떻게 작동합니까?


13

나는 수학에 대한 배경 지식이 없지만 간단한 Perceptron의 작동 방식을 이해하고 하이퍼 평면의 개념을 이해한다고 생각합니다 (나는 3D 공간에서 두 점 구름을 분리하는 선으로 구분되는 것처럼 기하학적으로 상상합니다) 2D 공간에서 두 점 구름).

그러나 나는 하나의 평면이나 하나의 선이 3D 공간 또는 2D 공간에서 각각 3 개의 다른 점 구름을 분리하는 방법을 이해하지 못합니다. 이것은 기하학적으로 불가능합니다.

Wikipedia 기사 의 해당 섹션을 이해하려고 했지만 이미 "여기에서 입력 x 및 출력 y는 임의의 세트에서 가져옵니다"라는 문장에서 비참하게 실패했습니다. 누군가가 멀티 클래스 퍼셉트론을 설명하고 하이퍼 플레인의 아이디어와 어떻게 관련이 있는지, 아니면 수학이 아닌 설명을 지적 할 수 있습니까?

답변:


8

우리는 데이터가 있다고 가정하자 여기서 입력 벡터되어 입니다 분류.x iR n y i{ 빨강, 파랑, 녹색 }(x1,y1),,(xk,yk)xiRnyi{red, blue, green}

이진 결과에 대한 분류기를 작성하는 방법을 알고 있으므로 결과를 함께 그룹화, , 및 입니다.{ 파랑, 빨강 또는 녹색 } { 녹색, 파랑 또는 빨강 }{red, blue or green}{blue, red or green}{green, blue or red}

각 모델은 함수 각각 라고합니다 . 이것은 청색의 예측 긍정적 거리가 대응하는 경우, 각 모델에 관련된 초평면의 부호 거리와 입력 벡터를 얻어 , 빨강으로 그리고 만약 녹색 . 기본적으로 가 양수 모델은 가 녹색 이라고 생각 하고 그 반대도 마찬가지입니다. 결과가 확률 일 필요는 없으며 모델의 신뢰도를 측정 할 수 있어야합니다.f R , f B , f G f B f R f G f G ( x ) xf:RnRfR,fB,fGfBfRfGfG(x)x

입력 주어지면 에 따라 분류 하므로 가 중에서 가장 큰 경우 대해 녹색을 예측 합니다.argmax c f c ( x ) f G ( x ) { f G ( x ) , f B ( x ) , f R ( x ) } xxargmaxc fc(x)fG(x){fG(x),fB(x),fR(x)}x

이 전략을 "일대 모두"라고하며 여기에서 읽을 수 있습니다 .


3

나는 그 위키 기사를 전혀 이해할 수 없다. 다음은 그것을 설명 할 수있는 대안입니다.

하나의 로지스틱 출력 노드가있는 퍼셉트론 은 2 개의 클래스에 대한 분류 네트워크입니다. 이것은 출력 , 다른 단순히에 존재의 확률로, 클래스 중 하나에있는 확률을 .1 - pp1p

두 개의 출력 노드가있는 퍼셉트론 은 3 개의 클래스에 대한 분류 네트워크입니다. 두 노드는 각각 클래스에있을 확률을 출력하고 세 번째 클래스에있을 확률은 입니다.pi1i=(1,2)pi

등등; 출력 노드를 가진 퍼셉트론 은 클래스 의 분류기입니다 . 실제로 숨겨진 계층이없는 경우 단순한 퍼셉트론이 로지스틱 회귀 분석 과 동일한 것처럼 퍼셉트론은 기본적으로 다항 로지스틱 회귀 모형과 동일합니다.m + 1mm+1


결과가 실제 확률인지 확실합니까? 어쨌든, 나는 다항 로지스틱 회귀가 어떻게 작동하는지 알지 못하므로 조사해야합니다. 그러나 두 개 이상의 출력 노드가있는 퍼셉트론을 구성하는 방법을 설명하는 (알고리즘) 방법이 있습니까? 그들은 어떻게 든 연결되어 있습니까?
wnstnsmth
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.