판별 분석을 공부하고 있지만 여러 가지 다른 설명을 조정하는 데 어려움을 겪고 있습니다. 나는 전에 (이것으로 보이는) 수준의 불일치에 직면 한 적이 없기 때문에 뭔가 빠진 것이 틀림 없다고 생각합니다. 그러나이 웹 사이트의 판별 분석에 대한 질문의 수는 그 복잡성을 입증하는 것으로 보입니다.
여러 클래스의 LDA 및 QDA
저의 주요 교과서는 Johnson & Wichern Applied Multivariate Statistical Analysis (AMSA)와이를 바탕으로 한 선생님의 메모입니다. 이 설정에서 단순화 된 수식이 적어도 혼란을 유발한다고 생각하기 때문에 두 그룹 설정을 무시합니다. 이 소스에 따르면 LDA와 QDA는 예상되는 오 분류 비용 (ECM)을 기준으로 분류 규칙의 매개 변수 (다변량 정규성 가정) 확장으로 정의됩니다. ECM은 새로운 관측 값 x를 모든 그룹으로 분류하기위한 조건부 예상 비용을 합산하고 (오 분류 비용과 사전 확률 포함)이를 최소화하는 분류 영역을 선택합니다. 여기서
아마도이 분류 규칙은 "후부 확률을 최대화하는 규칙"(sic AMSA)과 동일하며, 내가 언급 한 Bayes의 접근 방식 만 가정 할 수 있습니다. 이 올바른지? ECM은 다른 곳에서 발생하는 것을 본 적이 없기 때문에 오래된 방법입니다.
정규 모집단의 경우이 규칙은 2 차 판별 점수로 단순화합니다. .
이것은 동등한 것 통계 학습의 요소 들은 이차 판별으로 설명하지만, (ESL) 110 페이지 식 4.12 함수 보다는 점수 . 또한 다변량 밀도의 로그 비율을 통해 여기에 도달합니다 (4.9). 이것이 베이 즈 접근의 또 다른 이름입니까?
동일한 공분산을 가정하면 공식은 선형 판별 점수로 훨씬 더 단순 해 집니다.
이 공식은 첫 번째 용어가 반대 인 ESL (4.10)과 다릅니다 : . ESL 버전은 R의 통계 학습에 나열된 버전이기도합니다 . 더욱이, AMSA에 제시된 SAS 출력에서 선형 판별 함수 는 상수 및 계수로 구성됩니다. 벡터 , ESL 버전과 일치하는 것 같습니다.
이 불일치의 원인은 무엇입니까?
판별 자와 피셔의 방법
참고 :이 질문이 너무 큰 것으로 간주되면이 섹션을 제거하고 새 질문을 열지 만 이전 섹션에서 작성됩니다. 텍스트의 벽에 대한 사과, 나는 그것을 약간 구조화하기 위해 최선을 다했지만,이 방법에 대한 나의 혼란이 다소 이상한 논리 점프로 이어질 것이라고 확신합니다.
AMSA 책은 여러 그룹에 대한 피셔 방법을 설명합니다. 그러나 ttnphns는 FDA가 단순히 두 그룹을 가진 LDA라는 것을 여러 번 지적했습니다 . 그렇다면이 멀티 클래스 FDA는 무엇입니까? 아마도 FDA는 여러 가지 의미를 가질 수 있습니까?
AMSA는 Fisher의 판별 의 비율을 최대화하는 의 고유 벡터로 설명 합니다. . 선형 조합 은 샘플 판별 는 ). 분류를 위해 대해 가장 작은 값을 가진 그룹 k를 선택합니다. 여기서 r은 사용하려는 판별 자의 수입니다. 모든 판별 변수를 사용하면이 규칙은 선형 판별 함수와 같습니다.
LDA에 대한 많은 설명 은 AMSA 책에서 FDA라고 불리는 방법론을 설명하는 것으로 보입니다. 즉, 가변성 측면 / 범위 내에서 시작합니다. BW 매트릭스의 분해가 아닌 경우 FDA는 무엇을 의미합니까?
교과서가 판별 분석의 차원 축소 측면을 언급 한 것은 이번이 처음이지만, 이 사이트의 여러 답변 은이 기술의 2 단계 특성을 강조하지만 1 개만 있기 때문에 두 그룹 설정에서는 명확하지 않습니다. 판별력. 멀티 클래스 LDA 및 QDA에 대한 위의 공식을 감안할 때, 판별 요소가 나타나는 위치는 여전히 명확하지 않습니다.
이 의견 은 베이 즈 분류가 원래 변수에 대해 본질적으로 수행 될 수 있음을 지적하면서 특히 혼란 스러웠습니다. 그러나 FDA와 LDA가이 책과 여기 에서 지적한 바와 같이 수학적으로 동등하다면 , 차원 축소가 함수에 내재되어 있지 않아야 하는가? 나는 이것이 마지막 링크가 해결하는 것이라고 믿지만 완전히 확신하지는 못한다.
선생님의 강의 노트는 FDA가 본질적으로 정식 상관 분석의 한 형태라고 설명합니다. 나는 이 측면에 대해 이야기하는 다른 소스 를 1 개 찾았 지만 다시 한 번 사이와 가변 범위 내에서 분해하는 Fisher 접근법과 밀접한 관련이있는 것으로 보입니다. SAS는 피셔의 방법 ( https://stats.stackexchange.com/a/105116/62518 ) 과 관련이있는 LDA / QDA 절차 (DISCRIM)에 결과를 제시합니다 . 그러나 SAS의 FDA 옵션 (CANDISC)은 피셔의 분류 계수를 나타내지 않고 정식 상관 관계를 수행합니다. 그것은 lda (MASS)에 의해 얻은 R의 W-1B 고유 벡터와 동등한 것으로 생각되는 원시 표준 계수를 제시합니다 (https://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_candisc_sect019.htm ). 분류 계수는 LDA 및 QDA 섹션에 설명 된 판별 함수 (인구 당 하나의 함수가 있고 가장 큰 함수를 선택하기 때문에)에서 얻은 것으로 보입니다.
나는 나무를 통해 숲을 볼 수있게 해주는 출처에 대한 모든 설명이나 언급에 대해 감사하게 생각합니다. 혼동의 주된 원인은 다른 교과서가 다른 이름으로 방법을 호출하거나 다른 가능성을 인정하지 않고 수학의 약간의 변형을 제시하는 것으로 보입니다 .AMSA 서적의 나이를 고려할 때 놀라운 일은 아니지만 .
W^-1B
를 수행 한 다음 "Bayes"를 수행 하지 않고 LDA를 수행하는 방법 입니다. 동등하지만 유연성 이 떨어집니다 (분류의 소수만 선택할 수 없으며 분류 등의 공분산 행렬 내에서는 별도로 사용할 수 없습니다).
If we use all the discriminants this rule would be equivalent to the linear discriminant function
불분명합니다. "식별"및 "식별 기능"은 동의어입니다. 모든 판별자를 사용하거나 가장 강력하거나 유의미한 몇 가지만 사용할 수 있습니다. 나는 AMSA 책을 보지 않았지만 저자들에게는 FDA = LDA라고 생각한다. 실제로 저는 개인적으로 "피셔 LDA"가 잉여의 불필요한 용어라고 생각합니다.