우리는 일반적으로 PCA를 사례가 iid로 가정되는 데이터의 차원 축소 기술로 사용합니다.
질문 : 종속적이지 않은 IId 데이터에 PCA를 적용 할 때의 일반적인 뉘앙스는 무엇입니까? iid 데이터를 보유하고있는 PCA의 어떤 좋은 / 유용한 속성이 손상되거나 완전히 손실됩니까?
예를 들어, 데이터는 다변량 시계열 일 수 있으며,이 경우 자기 상관 또는 자기 회귀 조건부 이분산성 (ARCH)이 예상 될 수 있습니다.
시계열 데이터에 PCA를 적용하는 것과 관련된 몇 가지 관련 질문, 예를 들어 1 , 2 , 3 , 4 가 이전에 요청 되었지만 더 일반적이고 포괄적 인 답변을 찾고 있습니다 (각 개별 지점에서 크게 확장 할 필요가 없음).
편집 : @ttnphns가 지적했듯이 PCA 자체 는 추론 분석이 아닙니다. 그러나 PCA의 일반화 성능, 즉 샘플 PCA의 인구 집단에 초점을 맞추는 데 관심이있을 수 있습니다. 예를 작성로 (2008) Nadler :
주어진 데이터가 (일반적으로 알려지지 않은) 분포에서 나온 유한하고 랜덤 한 샘플이라고 가정하면, 흥미로운 이론적이고 실용적인 질문은 유한 데이터에서 계산 된 샘플 PCA 결과와 기본 모집단 모델의 결과 사이의 관계입니다.
참고 문헌 :
- 나 들러, 보아스 "주성분 분석을위한 유한 한 샘플 근사 결과 : 매트릭스 교란 접근법." 통계의 연대기 (2008) : 2791-2817.