군집 분석 후 판별 분석


10

k-means와 같은 군집 알고리즘의 결과에 대해 판별 분석 (DA)을 사용하는 근거는 무엇입니까 (필수적으로 정신 장애의 임상 적 서브 타이핑).

클래스 간 (클래스 내) 관성의 최대화 (각각 최소화)를 지원하므로 클러스터 생성 중에 사용 된 변수에 대한 그룹 차이를 테스트하는 것은 일반적으로 권장되지 않습니다. 따라서 개인을 더 낮은 차원의 계승 공간에 포함시키고 그러한 분할의 "생성 성"에 대한 아이디어를 얻지 않는 한 예측 DA의 부가 가치를 충분히 인식하지 못합니다. 그러나이 경우에도 클러스터 분석은 기본적으로 탐색 도구로 남아 있으므로 이러한 방식으로 계산 된 클래스 멤버십을 사용하여 점수 규칙을 추가로 도출하면 처음에는 이상하게 보입니다.

관련 논문에 대한 권장 사항, 아이디어 또는 포인터?


cran.r-project.org/web/packages/adegenet/vignettes/… 를 사용하는 설명과 예는 다음과 같습니다 R.
Ben

답변:


5

나는 이것에 관한 논문을 모른다. 설명을 위해이 방법을 사용했습니다. DFA는 원래 변수와 관련하여 그룹 차이와 차원을 요약 할 수있는 좋은 방법을 제공합니다. 원래 변수에서 그룹을 더 쉽게 프로파일 링 할 수 있지만, 이는 클러스터링 문제의 본질적으로 다변량 특성을 상실합니다. DFA를 사용하면 문제의 다변량 특성을 그대로 유지하면서 그룹을 설명 할 수 있습니다. 따라서 클러스터의 해석에 도움이 될 수 있습니다. 이는 클러스터링 방법과 분류 방법 (예 : DFA 및 Ward의 방법) 사이에 밀접한 관계가있는 경우에 특히 이상적입니다.

테스트 문제가 옳습니다. 클러스터링 솔루션을 설명하기 위해 DFA 후속 조치와 함께 클러스터 분석을 사용하여 논문을 발표했습니다. 테스트 통계없이 DFA 결과를 발표했습니다. 검토자가 그 문제를 해결했습니다. 나는 이러한 p- 값이 전통적인 방식으로 해석되어서는 안된다는 면책과 함께 테스트 통계와 p 값을 인정하고 거기에 넣었습니다.


클러스터링 후 DA의 절차 단계는 무엇입니까? 어떤 변수가 어떤 클러스터를 다른 클러스터와 다르게 만드는지 알아낼 수있는 다른 기법을 생각할 수 있습니까?
danas.zuokas

그 논문에 인용을 공유 할까, 브렛?
Roman Luštrik 2016 년

와이즈먼과 마길. 2008. "1 학년 세미나의 효과를 조사하기위한 학생 유형학 개발"1 학년 경험 및 전환 20 (2) 저널. 하드 카피를 원하면 오프라인으로 연락하십시오.
Brett
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.