원리 성분 분석과 다중 판별 분석 (선형 판별 분석)의 차이점에 대한 이 기사 를 읽고 있으며 MDA / LDA가 아닌 PCA를 왜 사용해야하는지 이해하려고 노력하고 있습니다.
설명은 다음과 같이 요약됩니다.
PCA에서 대략적으로 말하면 데이터가 가장 널리 퍼져있는 곳 (PCA가 전체 데이터 세트를 하나의 클래스로 취급하기 때문에 클래스 내에서)이 최대 편차를 갖는 축을 찾으려고 노력하고 있으며 MDA에서는 클래스 간 확산을 추가로 최대화하고 있습니다.
항상 분산을 최대화하고 클래스 간 확산을 최대화하고 싶지 않습니까?