가우스 혼합 모델을 언제 사용해야합니까?


9

GMM을 처음 사용합니다. 온라인에서 적절한 도움을 찾을 수 없었습니다. "GMM을 사용하는 것이 내 문제에 적합한 지 결정하는 방법"에 대한 올바른 자료를 제공해 주시겠습니까? 또는 분류 문제가있는 경우 "SVM 분류 또는 GMM 분류를 사용해야하는지 어떻게 결정합니까?"


ur 데이터 세트 란 무엇이며 정확한 문제는 무엇입니까? 데이터가 정규 분포를 1 회 이상 따르는 경우에 사용됩니다. 다른 질문보기 -stats.stackexchange.com/questions/236295/…
Arpit Sisodia

데이터를 레이블링하지 않았으며 잠재 그룹화가 다변량 정상이라고 믿는 클러스터링의 형태로 생각할 수 있습니다.
gung-복직 모니카

@ arpit-sisodia, 우리는 특정 기능을 가진 것으로 보이는 하드웨어 키보드 설정의 타당성을 연구 중이며 GMM을 사용하여 모델링 할 계획입니다. 우리는 기본 프로세스를 명확하게 알지 못하므로 기계 학습 방법을 사용하여 모델링하려고합니다. 따라서 기본 프로세스에 실제로 가우시안이 혼합되어 있는지 확실하지 않습니다. 더욱이 그것은 다차원 적이며 우리가 그것이 가우시안이 섞여 있는지 볼 수는 없다
Vinay

@ arpit-sisodia, 제공 한 링크는 GMM이 내 데이터에 맞는지 확인하기 위해 시행 착오 방법을 더 제안합니다. 사용할 모델을 결정하는 결정적인 방법 / 엄지 규칙이 있습니까? 더 많은 혼합물을 사용하는 시행 착오 방법은 내 데이터에 맞을 수 있습니다. 그러나 결정하는 특정 방법이 있습니까? SVM 분류를위한 데이터의 선형 분리 가능성이 필요합니다
Vinay

답변:


4

내 의견으로는 데이터 포인트가 가우스 분포의 혼합임을 알면 GMM을 수행 할 수 있습니다. 평균 및 표준 편차가 다른 기본적으로 클러스터를 형성합니다. scikit-learn 웹 사이트에는 멋진 다이어그램이 있습니다. 엘

GMM 분류

소프트 클러스터링 방법을 사용하여 클러스터를 찾은 다음 가우스인지 확인하는 방법입니다. 그렇다면 전체 데이터 세트를 나타내는 GMM 모델을 적용 할 수 있습니다.


1
데이터 포인트가 가우스 혼합인지 여부를 종종 알 수 없습니다. 따라서 이것은 Gaussian 및 MoG에서 더 많은 문제를 해결하고 그것이 맞는지 확인하십시오. 그러나 GMM을 올바르게 사용하기위한 방향 / 엄지 규칙은 없습니다
Vinay

2
내 경험에 따르면 데이터에서 혼합 모델 인 패턴을 찾아야합니다. 읽을만한 좋은 논문은 다음과 같습니다. stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer

0

GMM은 일반적으로 (1) 군집 관측, (2) 생성 모델 지정 또는 (3) 밀도 추정에 목표가있는 경우 시작하기에 좋은 장소입니다. 실제로 클러스터링의 경우 GMM은 k- 평균 의 상위 집합 입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.