"피셔의 판별 분석"은 단순히 2 개 클래스의 상황에서 LDA 입니다. 수작업으로 2 개의 클래스 만 계산할 수 있고 분석은 다중 회귀와 직접 관련됩니다. LDA는 여러 클래스의 상황에 대한 Fisher의 아이디어를 직접 확장 한 것으로 고유 대수와 같은 행렬 대수 장치를 사용하여 계산합니다. 따라서 "피셔의 판별 분석"이라는 용어는 오늘날 사용되지 않는 것으로 간주 될 수 있습니다. 대신 "선형 판별 분석"을 사용해야합니다. 도 참조하십시오 . 2 개 이상의 클래스 (다중 클래스)를 사용한 판별 분석 은 알고리즘에 의해 정식 입니다 ( 정규 변수로 구분자를 추출합니다). 희소 용어 "정규 판별 분석"
Fisher는 판별 함수가 계산 된 후 "Fisher 분류 함수"라고하는 것을 사용하여 객체를 분류했습니다. 오늘날 LDA 절차 내에서보다 일반적인 Bayes 접근 방식을 사용하여 객체를 분류합니다.
LDA의 설명에 대한 귀하의 요청에 나는이 내 답변에 당신을 보낼 수 있습니다 LDA에서 추출 , LDA의 분류 , LDA를 관련 절차 중 . 또한 이것 , 이것 , 이 질문과 답변.
분산 분석에서 등분 산 가정이 필요한 것처럼 LDA에서는 클래스의 등분 산 공분산 행렬 (입력 변수 간)을 가정합니다. 이 가정은 분석의 분류 단계에서 중요합니다. 행렬이 실질적으로 다르면 변동성이 큰 클래스에 관측치가 할당되는 경향이 있습니다. 이 문제를 극복하기 위해 QDA 가 발명되었습니다. QDA는 클래스의 공분산 행렬의 이질성을 허용하는 LDA의 수정입니다.
(박스의 M 테스트에 의해 검출 된) 이질성이 있고 QDA가없는 경우에도 분류 에서 판별 변수의 개별 공분산 행렬 (풀링 된 행렬이 아닌)을 사용하는 방식으로 LDA를 사용할 수 있습니다. . 이것은 방금 지적한 바와 같이 원래 변수 (매트릭스가 다름)가 아닌 판별 변수 사이의 매트릭스이기 때문에 QDA보다 덜 효율적이지만 문제를 부분적으로 해결합니다.
예제 데이터를 직접 분석해 보겠습니다.
@zyxue의 답변 과 의견에 답장
LDA는 FDA가 귀하의 답변에 정의한 것입니다. LDA는 먼저 분리 사이의 간격을 최대화하는 선형 구조 (구별 자)를 추출한 다음이를 사용하여 (가우시안) 분류를 수행합니다. LDA가 판별 변수 추출 작업과 관련이없는 경우 LDA가 가우스 분류 기인 것처럼 보이면 "LDA"라는 이름이 전혀 필요하지 않습니다.
에스승에스승상기 클래스 내 공분산은 모두 동일하다. 동일성; 사용권은 절대적으로됩니다.)
가우시안 분류기 (LDA의 두 번째 단계)는 베이 즈 규칙을 사용하여 판별에 의해 관측치를 클래스에 할당합니다. 원래의 특징을 직접 활용하는 Fisher 선형 분류 함수라고하는 동일한 결과를 얻을 수 있습니다. 그러나 판별을 기반으로하는 Bayes의 접근 방식은 풀링 된 것을 사용하는 기본 방법 외에도 별도의 클래스 판별 공분산 행렬을 사용할 수 있다는 점에서 약간 일반적입니다. 또한 판별 하위 세트를 기준으로 분류 할 수 있습니다.
클래스가 두 개 뿐인 경우 "잠재적 추출"과 "관찰 분류"가 동일한 작업으로 줄어듦에 따라 LDA의 두 단계 모두 단일 패스로 함께 설명 될 수 있습니다.