강력한 PCA ( Candes et al 2009 또는 Netrepalli et al 2014에서 개발 한 )는 다변량 이상치 탐지에 널리 사용되는 방법 이지만 , 공분산 행렬의 강력하고 규칙적인 추정을 통해 Mahalanobis 거리를 이상치 탐지에도 사용할 수 있습니다 . 한 방법을 다른 방법으로 사용하는 것의 장점에 대해 궁금합니다.
내 직감에 따르면 둘 사이의 가장 큰 차이점은 다음과 같습니다. 데이터 집합이 "소형"(통계적 의미에서)이면 강력한 PCA는 낮은 순위의 공분산을 제공하고 강력한 공분산 매트릭스 추정은 전체를 제공합니다. Ledoit-Wolf 정규화로 인한 순위 공분산. 이것이 어떻게 이상치 탐지에 영향을 줍니까?