Fisher 기준 가중치를 계산하는 방법은 무엇입니까?


12

패턴 인식과 기계 학습을 공부하고 있는데 다음 질문에 부딪 쳤습니다.

동일한 사전 등급 확률 클래스 분류 문제를 고려하십시오.

P(D1)=P(D2)=12

그리고 각 클래스에서 인스턴스의 분포는

p(x|D1)=N([00],[2001]),

p(x|D2)=N([44],[1001]).

Fisher 기준 가중치를 계산하는 방법은 무엇입니까?

업데이트 2 : 내 책에서 제공 한 계산 된 가중치는 입니다.W=[4329]

업데이트 3 : @xeon이 암시 한 것처럼 Fisher의 판별자를위한 투영선을 결정해야한다는 것을 이해합니다.

업데이트 4 : 투영선의 방향으로 하자 Fisher 선형 판별법은 최상의 가 기준 함수가 최대화 된 것임을 발견합니다 . 나머지 과제는 어떻게 우리가 수치 적으로 벡터를 얻을 수 있습니까?W WWWW


첫 번째 분포는 정의되어 있지 않습니다. 특히 쌍의 두 번째 변이는 분산이 0 인 변성 분포를 갖지만 첫 번째 변이와 양의 공분산을 가지므로 불가능합니다.
owensmartin

@owensmartin이 값을 어떻게 계산합니까?
Dr. Hoshang

Fisher 기준 무게의 정의는 무엇입니까?
Vladislavs Dovgalecs

Fisher의 선형 판별이 최대화되는 벡터 w에 의해 주어진다는 것을 의미합니다. 그것은 luthuli.cs.uiuc.edu/~daf/courses/Learning/Kernelpapers/… 와 같은 모든 자료에 언급되어 있습니다. 2. @xeon은 괜찮습니까?
Dr. Hoshang

힌트 : 두 클래스 사이의 경계는 무엇입니까? 선형, 다항식, 다른 것?
Vladislavs Dovgalecs

답변:


11

(Mika et al., 1999)에 링크 된 논문에 따르면, 소위 일반화 된 Rayleigh 몫 을 최대화하는 를 찾아야합니다 .w

wSBwwSWw,

여기서 및 공분산 ,C 1 , C 2m1,m2C1,C2

SB=(m1m2)(m1m2),SW=C1+C2.

해결 방법은 먼저 계산 된 일반 고유 값 문제 하여 찾을 수 있습니다. 을 풀고 고유 벡터 를 풀면 고유 값 됩니다 . 귀하의 경우 이 2x2 행렬 의 결정 요인 은 손으로 계산할 수 있습니다.

SBw=λSWw,
λ
det(SBλSW)=0
w
SBλSW=(163λ1616162λ).

고유 값이 가장 큰 고유 벡터는 레일리 지수를 최대화합니다. 대신 손으로 계산을하고, 나는 사용하여 파이썬에서 일반화 된 고유치 문제를 해결 scipy.linalg.eig하고있어 당신은 당신의 책에서 볼 수있는 솔루션 다르다. 아래에는 내가 찾은 가중치 벡터의 최적 초평면 (검정색)과 책에서 찾은 가중치 벡터의 초평면이 그려져 있습니다 (빨간색).

w10.5547,w20.8321,

여기에 이미지 설명을 입력하십시오


1
이 예제는 매우 흥미 롭습니다. 두 줄은 두 클래스를 분리하지만 그 중 하나는 학습 이론의 관점에서 "더 나은"것입니다.
Vladislavs Dovgalecs

2
Fisher Criterion은 books.google.com/…
nini

1
@Lucas는 아마도 문제의 결과가 xeon 주석과 비슷할 것입니다. "아마도 하이퍼 플레인은 크기가 아닌 방향으로 정의되기 때문에 단위 벡터 w를보고해야합니다."
nini

1
아 !!! 질문을 도전, 나는 모든이에 2 페이지를 참조하는 것이 좋습니다 dml.ir/wp-content/uploads/2012/04/SPR-S12-M-Sol.pdf
user153695

1
@Lucas 감사합니다. 경계를보기 위해 W = [-2 / 3-2 / 3] 및 W = [-4 / 3-2 / 3] 및 W = [-2-3]에 대해 다른 그림을 추가 하시겠습니까? 감사. 나는 좋은 답변을 당신에게 현상금을 설정했습니다.
nini

7

SOLUTION1:

Duda et al. @lucas에 대한 대체 솔루션이있는이 (Pattern CLassification)는이 경우 손으로 솔루션을 계산하기가 매우 쉽습니다. (이 대체 솔루션이 도움이 되길 바랍니다! :))

두 가지 등급의 LDA에서 목표는 다음과 같습니다.

wTSBwwTSWw 는 클래스 분산 사이의 간격을 늘리고 클래스 내 분산을 줄이는 것을 의미합니다.

여기서 및 , 여기서 는 공분산 행렬이고 는 각각 클래스 1과 2의 평균입니다.SB=(m1m2)(m1m2)TSW=S1+S2S1,S2m1,m2

이 일반화 된 롤리 지수의 솔루션은 일반화 된 고유 값 프로브입니다.

SBw=λSWwSW1SBw=λw

상기 제제는 폐쇄 형 용액을 갖는다. 기준으로 랭크 1 행렬 그래서 에 대한 답변을 얻을 normlizd 수있다.SBm1m2wSW1(m1m2)

방금 계산하고 [0.5547; 0.8321]을 얻었습니다.w

SW1(m1m2)=(S1+S2)1(m1m2)=([2001]+[1001])1([00][44])=([1/3001/2])([00][44])=[1.33332.0000][0.55470.8321]

참고 : Duda, Hart, Stork에 의한 패턴 분류

SOLUTION2:

또는 일반화 된 고유 값 문제에 대한 고유 벡터를 찾아서 해결할 수 있습니다. SBw=λSWw

람다의 다항식은 의해 형성 될 수 다항식의 해는 의 고유 값이됩니다 . 이제 다항식의 근본으로 고유 값 집합이 있다고 가정 해 . 이제 을 대입하고 방정식의 선형 시스템 에 대한 해당 고유 벡터를 . 각각에 대해이 작업을 수행하면 벡터 집합 을 얻을 수 있으며 솔루션으로 고유 벡터 집합입니다.determinant(SBλSW)SBw=λSWwλ1,λ2,...,λn,λ=λi,i{1,2,..,n}SBwi=λiSWwi{wi}i=1n

determinant(SBλSW)=[163λ1616162λ]=6λ280λ 이므로 고유 값은 다항식 뿌리 .6λ280λ

따라서 0 및 40/3가 두 가지 솔루션입니다. LDA의 경우 가장 높은 고유 값에 해당하는 고유 벡터가 솔루션입니다.λ=

방정식 시스템에 대한 해 및(SBλiSW)wi=0λi=40/3

이는[163λ1616162λ]wi[72484832]wi=0

위의 방정식 시스템에 대한 솔루션은 이전 솔루션과 동일한 입니다.[0.55470.8321][0.55470.8321]

또는 는 의 null 공간에 있다고 말할 수 있습니다 .[0.55470.8321][72484832]

2 클래스 LDA의 경우 고유 값이 가장 높은 고유 벡터가 솔루션입니다. 일반적으로 C 클래스 LDA의 경우 가장 높은 C-1 고유 값에 이르는 첫 번째 C-1 고유 벡터가 솔루션을 구성합니다.

이 비디오는 간단한 고유 값 문제에 대한 고유 벡터를 계산하는 방법을 설명합니다. ( https://www.khanacademy.org/math/linear-algebra/alternate_bases/eigen_everything/v/linear-algebra-finding-eigenvectors-and-eigenspaces-example )

다음은 예입니다. http://www.sosmath.com/matrix/eigen2/eigen2.html

멀티 클래스 LDA : http://en.wikipedia.org/wiki/Linear_discriminant_analysis#Multiclass_LDA

행렬의 널 공간 계산 : https://www.khanacademy.org/math/linear-algebra/vectors_and_spaces/null_column_space/v/null-space-2-calculating-the-null-space-of-a-matrix


1
좋은 대답, 당신은 책의 대답이 잘못되었음을 의미합니다! 승인?
Dr. Hoshang

나는이 답변이 정확하다고 생각하고 책을 정의하는 경우 및 다르게 다음 그 정의로 무엇을 얻을 참조하십시오. S BSWSB
dksahuji

2
-1.33은 -4/3과 같지만 두 번째 요소는 다릅니다. 아마도 책 보고서 단위 벡터 w? 옳지 않습니까? 감사합니다
Hoshang 박사

2
현상금 2의 가치에 도달하기 위해 솔루션 2를 완료하십시오
nini

1
@ Dr.Hoshang : 책의 해결책이 잘못되었습니다. 왜 그런지 모르겠습니다.
amoeba는 Reinstate Monica라고
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.