총계 (클래스 내 + 클래스 간) 분산 행렬 도출


14

나는 PCA와 LDA 방법을 다루고 있었고 어느 ​​시점에 갇혀있다. 나는 그것을 볼 수 없을 정도로 단순하다는 느낌이 든다.

내 수준 ( ) 사이 급 ( ) 산란 행렬은 다음과 같이 정의된다 :S BSWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

총 산란 행렬 는 다음과 같습니다.ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

여기서 C는 클래스 수이고 N은 샘플 수 는 샘플이고, 는 i 번째 클래스 평균이고, 는 전체 평균입니다.μ i μxμiμ

를 도출하려고 할 때 나는 내가 가진 지점에 도달했습니다.ST

(xμi)(μiμ)T+(μiμ)(xμi)T

용어로. 이것은 0이어야하지만 왜 그럴까요?


과연:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
답은 평균 주위의 값 편차를 합산하고 그 합이 0이라는 것입니다. 그러나 , 및 는 정확히 무엇 입니까? 어떻게하다 와 관련 와 ? 답변의 질은 우리가 얼마나 정확하게 추측 하느냐에 달려 있지만 당신은 우리가 엄청나게 많은 추측을하도록 강요하고 있습니다! m m i m m i μ μ ixmmimmiμμi
whuber

@ whuber : 당신은 완전히 맞아, 나는 내 질문을 수정했다.
nimcap

답변:


8

당신이 가정한다면

1Nt=1Nxti=μi

그때

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

그리고 공식 보유. 비슷한 방식으로 두 번째 용어를 다룹니다.


2
(+1) 첫 번째의 전치 인 두 번째 항도 0이어야합니다 :-).
whuber

@whuber, 그렇습니다, 그것도 :)
mpiktas

안녕하세요, 가정이 왜 그런지 모르겠습니까? 누군가 설명 할 수 있습니까?
Mvkt

1
μiμiiμi
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.