수업 전에 몇 가지 강의에서 PCA에 대해 배웠고이 매혹적인 개념에 대해 더 많이 알게되면서 희소 한 PCA에 대해 알게되었습니다.
내가 틀리지 않은지 물어보고 싶었다. 이것은 희소 한 PCA이다. PCA에서, 변수 를 가진 데이터 점이 있다면 , PCA를 적용하기 전에 차원 공간 에서 각 데이터 점을 나타낼 수있다 . PCA를 적용한 후에는 동일한 차원 공간에서 다시 표시 할 수 있지만 이번에는 첫 번째 주요 구성 요소에 가장 많은 분산이 포함되고 두 번째 주요 구성 요소에는 두 번째로 가장 큰 분산 방향이 포함됩니다. 따라서 마지막 몇 가지 주요 구성 요소를 제거 할 수 있습니다. 그 이유는 많은 데이터 손실을 일으키지 않으며 데이터를 압축 할 수 있기 때문입니다. 권리?p
스파 스 PCA는 이들 성분이 벡터 계수에서 0이 아닌 값을 포함하도록 주요 성분을 선택하고 있습니다.
이것이 데이터를 더 잘 해석하는 데 어떻게 도움이됩니까? 누구나 모범을 보여줄 수 있습니까?